CUDA 8混合精度编程

Mixed-Precision Programming with CUDA 8

论文地址:https://devblogs.nvidia.com/mixed-precision-programming-cuda-8/

更新,2019年3月25日:最新的Volta和Turing GPU现在加入了张量核,加速了某些类型的FP16矩阵数学。这使得在流行的人工智能框架中进行更快、更容易的混合精度计算成为可能。使用张量磁芯需要使用CUDA9或更高版本。NVIDIA还为TensorFlow、PyTorch和MXNet添加了自动混合精度功能。想多学点还是自己试试?在这里获取流行的人工智能框架的tensor核心优化示例。

在软件开发的实践中,程序员很早就学会了使用正确的工具来完成工作的重要性。当涉及到数值计算时,这一点尤其重要,因为在精度、精度和性能之间的权衡使得选择数据的最佳表示非常重要。随着Pascal GPU体系结构和CUDA 8的引入,NVIDIA正在扩展可用于混合精度计算的工具集,包括新的16位浮点和8/16位整数计算功能。

“随着在不同精度下计算的相对成本和易用性的发展,由于体系结构和软件的变化,以及GPU等加速器的破坏性影响,将看到混合精度算法的开发和使用越来越多。”—Nick Higham,Richardson应用数学教授,曼彻斯特大学。

许多技术和高性能计算机应用需要32位(单浮点数,或FP32)或64位(双浮点数,或FP64)浮点的高精度计算,甚至还有依赖更高精度(128位或256位浮点)的GPU加速应用。但是有许多应用需要低精度的算法。例如,在快速增长的深度学习领域的研究人员发现,由于训练深层神经网络时使用的反向传播算法,深层神经网络结构对错误具有自然的弹性,一些人认为16位浮点(半精度,或FP16)足以训练神经网络。

与精度更高的FP32或FP64相比,存储FP16(半精度)数据减少了神经网络的内存使用,允许训练和部署更大的网络,并且FP16数据传输比FP32或FP64传输花费的时间更少。此外,对于许多网络,可以使用8位整数计算来执行深度学习推断,而不会对精度产生显著影响。

除了深度学习之外,使用摄像机或其真实传感器数据的应用程序通常不需要高精度浮点计算,因为传感器生成低精度或低动态范围数据。射电望远镜处理的数据就是一个很好的例子。正如将在本文后面看到的,使用8位整数计算可以大大加快用于处理射电望远镜数据的互相关算法。

在计算方法中结合使用不同的数值精度称为混合精度。NVIDIA Pascal体系结构通过在32位数据路径中添加向量指令(将多个操作打包到一个数据路径中),为能够利用较低精度计算的应用程序提供了旨在提供更高性能的功能。具体地说,这些指令操作16位浮点数据(“半”或FP16)和8位和16位整数数据(INT8和INT16)。

新的NVIDIA Tesla P100由GP100 GPU供电,可以以FP32的两倍吞吐量执行FP16算法。GP102(Tesla P40和NVIDIA Titan X)、GP104(Tesla P4)和GP106 gpu都支持指令,这些指令可以对2和4元素8位向量执行整数点积,并累加为32位整数。这些指令对于实现高效的深度学习推理以及射电天文学等其应用具有重要价值。

在这篇文章中,将提供一些有关半精度浮点的详细信息,并提供使用FP16和INT8矢量计算在Pascal gpu上可实现的性能的详细信息。还将讨论各种CUDA平台库和api提供的混合精度计算能力。

A Bit (or 16) about Floating Point Precision

每一位计算机科学家都应该知道,浮点数提供了一种表示法,允许在计算机上对实数进行近似,同时在范围和精度之间进行权衡。浮点数将实值近似为一组有效数字(称为尾数或有效位),然后按固定基数的指数缩放(当前大多数计算机上使用的IEEE标准浮点数的基数为2)。
常见的浮点格式包括32位,称为“单精度”(“float”在C派生的编程语言中)和64位,称为“双精度”(“double”)。根据IEEE 754标准的定义,32位浮点值包括符号位、8个指数位和23个尾数位。64位双精度包含一个符号位、11个指数位和52个尾数位。在本文中,对(较新的)IEEE754标准16位浮点半类型感兴趣,包含一个符号位、5个指数位和10个尾数位,如图1所示。
在这里插入图片描述
Figure 1: 16-bit half-precision floating point (FP16) representation: 1 sign bit, 5 exponent bits, and 10 mantissa bits.

为了了解精度16位之间的差异,FP16可以表示2-14和215(其指数范围)之间2的每个幂的1024个值。这是30720个值。与之形成对比的是FP32,在2-126和2127之间,每2次幂的值约为800万。这大约是20亿的价值,差别很大。那么为什么要使用像FP16这样的小浮点格式呢?一句话,表演。

NVIDIA Tesla P100(基于GP100 GPU)支持双向矢量半精度融合乘法加法(FMA)指令(操作码HFMA2),可以以与32位FMA指令相同的速率发出该指令。这意味着半精度算法在P100上的吞吐量是单精度算法的两倍,是双精度算法的四倍。具体来说,启用NVLink的P100(SXM2模块)能够达到21.2teraflop/s的半精度。有了这么大的性能优势,应该看看如何使用。

在使用降低精度时要记住的一点是,由于FP16的标准化范围较小,生成次标准化数(也称为非标准化数)的概率增加。因此,NVIDIA的gpu必须在低标准数上实现FMA操作,并具有完整的性能。有些处理器没有,性能会受到影响。(注意:启用“flush to zero”仍有好处)。请参阅文章“CUDA Pro Tip:Flush Denormals with Confidence”。)

High Performance with Low-Precision Integers

浮点数结合了高动态范围和高精度,但也有不需要动态范围的情况,因此整数可以完成这项工作。甚至有些应用程序处理的数据精度很低,因此可以使用非常低的精度存储(如C short或char/byte类型)。
在这里插入图片描述
Figure 2: New DP4A and DP2A instructions in Tesla P4 and P40 GPUs provide fast 2- and 4-way 8-bit/16-bit integer vector dot products with 32-bit integer accumulation.

对于此类应用,最新的Pascal gpu(GP102、GP104和GP106)引入了新的8位整数4元向量点积(DP4A)和16位2元向量点积(DP2A)指令。DP4A执行两个4元素向量A和B(每个向量包含存储在32位字中的4个单字节值)之间的向量点积,将结果存储为32位整数,并将其添加到第三个参数C(也是32位整数)中。见图2。DP2A是类似的指令,其中a是16位值的2元向量,B是8位值的4元向量,不同类型的DP2A为2路点积选择高字节对或低字节对。这些灵活的指令对于线性代数计算(如矩阵乘法和卷积)非常有用。对于实现用于深度学习推理的8位整数卷积特别强大,通常用于部署用于图像分类和对象检测的深度神经网络。图3显示了在AlexNet上使用INT8卷积在Tesla P4 GPU上实现的改进的功率效率。
在这里插入图片描述
Figure 3: Using INT8 computation on the Tesla P4 for deep learning inference provides a very large improvement in power efficiency for image recognition using AlexNet and other deep neural networks,
when compared to FP32 on previous generation Tesla M4 GPUs. Efficiency of this computation on Tesla P4 is up to 8x more efficient than an Arria10 FPGA, and up to 40x more efficient than an Intel Xeon CPU. (AlexNet, batch size = 128, CPU: Intel E5-2690v4 using Intel MKL 2017, FPGA is Arria10-115. 1x M4/P4 in node, P4 board power at 56W, P4 GPU power at 36W, M4 board power at 57W, M4 GPU power at 39W, Perf/W chart using GPU power.)

DP4A计算总共8个整数操作的等效值,DP2A计算4个。这使Tesla P40(基于GP102)的峰值整数吞吐量达到47 TOP/s(Tera操作/秒)。

DP4A的一个应用实例是在射电望远镜数据处理管道中常用的互相关算法。与光学望远镜一样,较大的射电望远镜可以分辨宇宙中较暗和较远的物体;但是,建造越来越大的单片单天线射电望远镜是不实际的。取而代之的是,射电天文学家在大面积上建造了许多天线阵列。要使用这些望远镜,来自所有天线的信号必须是互相关的,这是一种高度并行的计算,其成本与天线数量成正比。由于射电望远镜元件通常捕获非常低精度的数据,所以信号的互相关不需要浮点运算。gpu已经被用于射电天文学互相关的制作,但通常使用FP32计算。DP4A的引入为这种计算提供了更高的功率效率。

图4显示了修改互相关代码以使用DP4A的结果,从而在具有默认时钟的Tesla P40 GPU上提高了4.5倍的效率(与P40上的FP32计算相比),并在设置GPU时钟以降低温度(从而降低泄漏电流)的情况下提高了6.4倍。总的来说,新代码比上一代Tesla M40 GPU上的FP32交叉相关效率高出近12倍(图片来源:Kate Clark)。
在这里插入图片描述
Figure 4: INT8 vector dot products (DP4A) improve the efficiency of radio astronomy cross-correlation by a large factor compared to FP32 computation.

Mixed Precision Performance on Pascal GPUs

半精度(FP16)格式对gpu来说并不新鲜。事实上,FP16作为一种存储格式在NVIDIA GPUs上已经支持了很多年,主要用于降低精度的浮点纹理存储和过滤等特殊用途的操作。Pascal GPU架构实现了通用的IEEE 754 FP16算法。高性能FP16在Tesla P100(GP100)上以全速支持,在其Pascal gpu(GP102、GP104和GP106)上以较低的吞吐量(类似于双精度)支持,如下表所示。

GP102-GP106支持8位和16位DP4A和DP2A点产品指令,但GP100不支持。表1显示了基于Pascal的Tesla gpu上不同数值指令的算术吞吐量。
在这里插入图片描述
Table 1: Pascal-based Tesla GPU peak arithmetic throughput for half-, single-, and double-precision fused multiply-add instructions, and for 8- and 16-bit vector dot product instructions. (Boost clock rates are used in calculating peak throughputs. TFLOP/s: Tera Floating-point Operations per Second. TIOP/s: Tera Integer Operations per Second.

Mixed-Precision Programming with NVIDIA
Libraries

从应用程序的混合精度中获益的最简单方法是利用NVIDIA GPU库中对FP16和INT8计算的支持。NVIDIA SDK的密钥库现在支持计算和存储的各种精度。

表2显示了当前对FC16和It8在关键CUDA库以及PTX组件和CUDA C/C++内部的支持。
在这里插入图片描述
Table 2: CUDA 8 FP16 and INT8 API and library support.

cuDNN

cuDNN是一个原始程序库,用于训练和部署深层神经网络。cuDNN 5.0包括对前向卷积的FP16支持,以及对FP16后向卷积的5.1附加支持。库中的所有其例程都是内存绑定的,因此FP16计算不利于性能。因此,这些例程使用FP32计算,但支持FP16数据输入和输出。cuDNN 6将增加对INT8推理卷积的支持。

TensorRT

TensorRT是一个高性能的深度学习推理机,用于深度学习应用程序的生产部署,自动优化训练神经网络的运行时性能。TensorRT v1支持FP16进行推理卷积,v2支持INT8进行推理卷积。

cuBLAS

cuBLAS是一个用于密集线性代数的GPU库,是基本线性代数子程序BLAS的一个实现。cuBLAS在几个矩阵乘法例程中支持混合精度。cubrashgemm是一个FP16密集矩阵乘法例程,使用FP16进行计算以及输入和输出。cubassgemex()在FP32中计算,但输入数据可以是FP32、FP16或INT8,输出可以是FP32或FP16。cublasgem()是CUDA 8中的一个新例程,允许指定计算精度,包括INT8计算(使用DP4A)。

将根据需要添加对具有FP16计算和/或存储的更多BLAS级别3例程的支持,因此如果需要,请与联系。级别1和级别2的BLAS例程是内存限制的,因此减少精度计算是不利的。

cuFFT

cuft是CUDA中一种流行的快速傅立叶变换库。从CUDA 7.5开始,cuft支持单GPU fft的FP16计算和存储。FP16 FFT比FP32快2倍。FP16计算需要一个计算能力为5.3或更高的GPU(Maxwell架构)。当前大小限制为2的幂,并且不支持R2C或C2R转换的实际部分上的跨步。

cuSPARSE

cuSPARSE是一个用于稀疏矩阵的GPU加速线性代数例程库。cuSPARSE支持几个例程的FP16存储(cusparseXtcsrmv()cusparseCsrsv_analysisEx()cusparseCsrsv_solvex()cusparseScsr2cscEx()cusparseCsrilu0Ex())。正在研究cuSPARSE的FP16计算。

Using Mixed Precision in your own CUDA Code

对于定制的CUDA C++内核和推力并行算法库的用户,CUDA提供了需要从FP16和It8计算、存储和I/O.中充分利用的类型定义和API。

FP16 types and intrinsics

对于FP16,CUDA定义了CUDA include路径中包含的头文件“CUDA_FP16.h”中的“half”和“half 2”类型。此头还定义了一组完整的内部函数,用于对“半”数据进行操作。例如,下面显示标量FP16加法函数“hadd()”和双向向量FP16加法函数“hadd2()”的声明。

device __half
__hadd ( const __half a, const __half b );

device __half2
__hadd2 ( const __half2 a, const __half2 b );

cuda_fp16.h为算术、比较、转换和数据移动以及其数学函数定义了一整套半精度的内部函数。所有这些都在CUDA Math API文档中描述。

尽可能使用“half2”向量类型和内部函数以获得最高的吞吐量。GPU硬件算术指令一次对2个FP16值进行操作,并打包在32位寄存器中。表1中的峰值吞吐量数字采用“半2”矢量计算。如果使用标量“half”指令,则可以达到峰值吞吐量的50%。同样,要在从FP16阵列加载和存储到FP16阵列时获得最大带宽,需要对“半2”数据进行矢量访问。理想情况下,可以通过加载和存储“float2”或“float4”类型并强制转换到“half2”或从“half2”转换到“half2”,进一步将加载矢量化以获得更高的带宽。有关相关示例,请参阅所有Pro-Tip博客文章的上一篇平行文章。

下面的示例代码演示如何使用CUDA的uu hfma()(半精度融合乘法加法)和其内部函数计算半精度AXPY(a*X+Y)。该示例的完整代码在Github上提供,展示了如何在主机上初始化半精度数组。重要的是,当开始使用半类型时,可能需要在主机端代码中的半值和浮点值之间进行转换。这篇来自FabianGiesen的博客文章包含了一些快速CPU类型转换例程(请参阅相关的要点以获得完整的源代码)。在这个例子中使用了一些Giesen的代码。

global
void haxpy(int n, half a, const half *x, half *y)
{
int start = threadIdx.x + blockDim.x * blockIdx.x;
int stride = blockDim.x * gridDim.x;
#if CUDA_ARCH >= 530
int n2 = n/2;
half2 x2 = (half2)x, y2 = (half2)y;
for (int i = start; i < n2; i+= stride)
y2[i] = __hfma2(__halves2half2(a, a), x2[i], y2[i]); // first thread handles singleton for odd arrays
if (start == 0 && (n%2))
y[n-1] = __hfma(a, x[n-1], y[n-1]);
#else
for (int i = start; i < n; i+= stride) {
y[i] = __float2half(__half2float(a) * __half2float(x[i]) + __half2float(y[i])); }
#endif
}

Integer
Dot Product Intrinsics

CUDA在头文件“smɤu intrinsics.h”(smɤ61是对应于GP102、GP104和GP106的sm体系结构)中定义8位和16位点产品(前面描述的DP4A和DP2A指令)的内部函数。也称为计算能力6.1。为了方便起见,DP4A内部函数有“int”和“char4”两种版本,有符号和无符号两种:

device int __dp4a(int srcA, int srcB, int c);
device int __dp4a(char4 srcA, char4 srcB, int c);
device unsigned int dp4a(unsigned int srcA, unsigned int srcB, unsigned int c);
device
unsigned int __dp4a(uchar4 srcA, uchar4 srcB, unsigned int c);

两个版本都假设A和B的四个向量元素被压缩到32位字的四个相应字节中。char4/uchar4`版本使用带有显式字段的CUDA结构类型,而包装在’int’版本中是隐式的。

如前所述,DP2A具有用于分别选择输入B的高或低两个字节的“高”和“低”版本。

// Generic [_lo]
device int __dp2a_lo(int srcA, int srcB, int c);
device unsigned int __dp2a_lo(unsigned int srcA, unsigned int srcB, unsigned int c);
// Vector-style [_lo]
device int __dp2a_lo(short2 srcA, char4 srcB, int c);
device unsigned int __dp2a_lo(ushort2 srcA, uchar4 srcB, unsigned int c);
// Generic [_hi]
device int __dp2a_hi(int srcA, int srcB, int c);
device unsigned int __dp2a_hi(unsigned int srcA, unsigned int srcB, unsigned int c);
// Vector-style [_hi]
device int __dp2a_hi(short2 srcA, char4 srcB, int c);
device unsigned int __dp2a_hi(ushort2 srcA, uchar4 srcB, unsigned int c);

请记住,基于GP102、GP104和GP106 GPU的Tesla、GeForce和Quadro加速器上提供了DP2A和DP4A,而不是Tesla P100(基于GP100 GPU)。

Download CUDA 8

要充分利用GPU上的混合精度计算,请下载免费的NVIDIA CUDA工具包版本8。要了解CUDA 8的所有强大功能,请查看后cuda8显示的功能。

查看全文
如若内容造成侵权/违法违规/事实不符,请联系编程学习网邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

相关文章

  1. 做题中遇到的知识点(二)

    我是小康小白,一个平平无奇的Java小白。热爱有趣的文字,生活和远方。 个人博客:https://blog.csdn.net/weixin_45791445Java程序编译会产生.class文件的情况:(1)对于普通的Java文件,里面只有一个类,也就是一个class,(注意:e->表达式也应该不能有),那么编译出来…...

    2024/5/8 1:35:47
  2. 堆、栈、自由存储区、全局/静态存储区和常量存储区分别是什么作用?

    堆、栈、自由存储区、全局/静态存储区和常量存储区 在C++中,内存分成5个区,他们分别是堆、栈、自由存储区、全局/静态存储区和常量存储区。栈,就是那些由编译器在需要的时候分配,在不需要的时候自动清除的变量的存储区。里面的变量通常是局部变量、函数参数等。堆,就是那些…...

    2024/4/15 3:43:18
  3. 第一节:Jieba分词

    在我们的日常工作与学习当中,最常用的两种语言就是汉语和英语了。在做文本分析的时候,第一步都是分词。在英语文章中,每个词都是天然的用空格分开的,所以我们就不讨论英语的分词了。在汉语分词中,我们最常用的就是jieba分词分词库了。jieba是一款开源的分词工具包,广泛应…...

    2024/4/15 3:43:17
  4. Proeasy机器人入门手册

    1.打开机器人软件,如图:2.打开后的界面如下:3.将电脑与机器人通讯上,首先得插上网线,配置好本地网络IP地址,我自己笔记本的IP地址如图:配置好本机的IP地址后,重新回到机器人软件界面,按图所示配置: 第一步 点击通讯接口按钮,会弹出如图所示的小窗口 第二步 在IP地址处…...

    2024/4/15 3:43:16
  5. 【25】kotlin 密封类

    子类可数(枚举是实例可数)<v1.1子类必须定义为密封类得内部类v1.1子类只需要与密封类在同一个文件夹中codepackage com.yzdzy.kotlin.SealedClasssealed class PlayerCmd {class Play(val url: String, val position: Long = 0) : PlayerCmd()class Seek(val position: Lo…...

    2024/4/15 3:43:16
  6. 进击的Java:从0到1第一天_常见的Dos命令,Jdk安装及环境变量配置

    打开dos窗口:WIN+R后输入cmd 通过图形文件打开常见的dos命令:指令 作用盘符+冒号(D:) 切换盘符cd+路径(cd D:\a) 进入指定的路径(不可以跨盘符使用)dir 列出当前目录下面的所有文件夹cd… 返回上一级目录cd\ 返回根目录md+文件夹名 在当前目录下创建新文件夹(md a)…...

    2024/4/19 15:51:51
  7. Java序列化和反序列化对象

    Java中的序列化对象是指将内存中的对象转换成字节流的形式,以方便保存(写入文件、数据库)和传输。反序列化对象则是相应的逆过程,将从文件或数据库或网络中获取到的字节流重新构造成序列化前的对象实例并写入到内存中,这使得我们可以在程序运行过程中使用该对象。如果想要…...

    2024/4/15 3:43:14
  8. JVM视频学习笔记

    1. jvm结构启动方式表示以server端启动jdk server会分配更大的堆内存等 可以以下面的方式修改启动方式谁在上谁生效jvm结构java堆内存受限于JVM,而直接内存受限于物理内存1.放在一起回收的时候需要全局查找性能低 2.内存在分配空间的时候是连续的如果中间一块内存快被回收会导…...

    2024/4/15 3:43:12
  9. JVM第六章_本地方法接口

    什么是本地方法? 简单地讲,一个Native Method就是一个Java调用非Java代码的接口。一个Native Method是这样一个Java方法:该方法的实现由非Java语言实现,比如C.这个特征并非Java所特有,很多其它的编程语言都有这一机制, 比如在C++中 ,你可以用extern "C"告 知C++…...

    2024/4/15 3:43:11
  10. 强化学习的state和observation

    state:全局的状态,是全局的 observation:agent的观测,是局部的如果是单一agent的场景下,state和observation并没有区别 如果是多agent的场景下,则每个agent的observation与全局的state是不一样的...

    2024/4/17 16:48:28
  11. PAT乙级 | 1076 Wifi密码 (15分)

    题目描述 下面是微博上流传的一张照片:“各位亲爱的同学们,鉴于大家有时需要使用 wifi,又怕耽误亲们的学习,现将 wifi 密码设置为下列数学题答案:A-1;B-2;C-3;D-4;请同学们自己作答,每两日一换。谢谢合作!!~”—— 老师们为了促进学生学习也是拼了…… 本题就要求你…...

    2024/4/15 3:43:09
  12. C++11 线程池demo

    线程池:一种线程的使用模式,线程过多会带来调度开销,进而影响缓存局部性和整体性能。而线程池维护着多个线程,等待着监督管理者分配可并发执行的任务。这避免了在处理短时间任务时创建与销毁线程的代价。线程池不仅能够保证内核的充分利用,还能防止过分调度。可用线程数量…...

    2024/4/15 3:43:08
  13. ELK在linux上的安装和配置

    安装ELK 1、将安装包上传到linux中,本人新建了一个software文件夹,用于放安装包2、解压jdk,并放到opt文件夹中 tar -zxvf jdk-8u221-linux-x64.tar.gz -C /opt 3、解压elasticsearch-head-master unzip elasticsearch-head-master.zip 4、将elasticsearch-head-master放到opt文…...

    2024/4/15 3:36:33
  14. 通俗易懂的Makefile教程(一)

    通俗易懂的Makefile教程最近在学习Linux下的C编程,买了一本叫《Linux环境下的C编程指南》读到makefile就越看越迷糊,可能是我的理解能不行。于是google到了以下这篇文章。通俗易懂。然后把它贴出来,方便学习。后记,看完发现这篇文章和《Linux环境下的C编程指南》的makefile…...

    2024/4/18 3:00:56
  15. 98. Validate Binary Search Tree包括重复节点

    BST不存在重复的val public boolean isValidBST(TreeNode root) {return isValidBST(root, null, null); } public boolean isValidBST(TreeNode root, Integer lo, Integer hi) {if (root == null) return true;if (lo != null && root.val <= lo) return false;if…...

    2024/4/25 5:57:05
  16. 网站判断

    #!/bin/bash 设置循环 check_website(){ 在外面创建一个文件,放入网址,在这里提取 wang=cat /root/wl.txt 循环取出网址,判断是否网络可以连通 for i in ${wang[@]} do code=curl -I -m 1 -o /dev/null -s -w %{http_code} $i if [ code−eq200];thenecho"code -eq 200…...

    2024/5/5 14:25:50
  17. Day120 计算机网络

    计算机网络重点了解网络分层模型(OSI、TCP/IP和五层模型)和常用的协议(HTTP/HTTPS 和 TCP/IP)分层模型概述:OSI模型七层,概念清楚,理论也比较完整,但其既复杂又不实用;TCP/IP模型四层,应用非常广泛,计算机网络的课程一般会把两者折中为五层架构,这样既简洁又能将概…...

    2024/4/15 3:43:07
  18. 爆款互联网人, 28岁的财富自由?

    前一两天,估计大家都被28岁程序员财富自由的热点给刷了吧。主角2012年毕业,经过一连串极其幸运的职业经历后,宣布从字节跳动退休。是的,人家不是离职,是退休。网上的帖子给他做了个大略的估算,身价应该接近1个亿了。说来惭愧,说到身价,我这个干了快十年的程序员跟他还是…...

    2024/4/15 3:43:06
  19. 工业级4G路由器在工业DTU数据透传和PLC远程网关控制中的作用

    现在物联网的发展比较快,工业4G路由器在工业中搭配DTU数据透传和PLC远程网关控的应用,使得物联网无人工业化的的应用越来越广泛,从而解放了工程师在户外路程上的人力,和时刻监测的劳动力。实现智能无人工业化。然而工业级4G路由在DTU数据透传和PLC远程网关控制中担任的什么…...

    2024/4/15 3:43:05
  20. 学习笔记--HTTP-字段总结(三)-与Cookie和Cache相关的字段总结

    目录一、Cookie相关1、Set-Cookie 和 Cookie2、Cookie常见的属性值1)Cookie的生命周期2)Cookie的作用域3)Cookie的安全性二、Cache 缓存相关报文字段1、浏览器请求数据及使用Cache的过程2、Cache-Control相关字段1)Cache-Control在响应报文中2)其他属性3)Cache-Control在…...

    2024/4/15 3:43:04

最新文章

  1. 传递给组件

    React 组件使用 props 相互通信。每个父组件都可以通过为其子组件提供道具来将一些信息传递给子组件。Props 可能会让您想起 HTML 属性&#xff0c;但您可以通过它们传递任何 JavaScript 值&#xff0c;包括对象、数组和函数。 Props 是传递给 JSX 标签的信息。例如&#xff0…...

    2024/5/8 8:58:08
  2. 梯度消失和梯度爆炸的一些处理方法

    在这里是记录一下梯度消失或梯度爆炸的一些处理技巧。全当学习总结了如有错误还请留言&#xff0c;在此感激不尽。 权重和梯度的更新公式如下&#xff1a; w w − η ⋅ ∇ w w w - \eta \cdot \nabla w ww−η⋅∇w 个人通俗的理解梯度消失就是网络模型在反向求导的时候出…...

    2024/5/7 10:36:02
  3. 8卡微调Grok-1实战教程

    本文是根据魔搭社区推出的轻量级训练推理工具SWIFT微调实战教程。SWIFT&#xff08;Scalable lightWeight Infrastructure for Fine-Tuning&#xff09;是一套基于PyTorch的轻量级、开箱即用的模型微调、推理框架&#xff0c;让AI爱好者能够轻松地在消费级显卡上运行大模型和AI…...

    2024/5/7 11:28:26
  4. 阿里云8核32G云服务器租用优惠价格表,包括腾讯云和京东云

    8核32G云服务器租用优惠价格表&#xff0c;云服务器吧yunfuwuqiba.com整理阿里云8核32G服务器、腾讯云8核32G和京东云8C32G云主机配置报价&#xff0c;腾讯云和京东云是轻量应用服务器&#xff0c;阿里云是云服务器ECS&#xff1a; 阿里云8核32G服务器 阿里云8核32G服务器价格…...

    2024/5/8 2:44:58
  5. DDIM,多样性与运行效率之间的trade off

    DDPM的重大缺陷在于其在反向扩散的过程中需要逐步从 x t x_t xt​倒推到 x 0 x_0 x0​&#xff0c;因此其推理速度非常缓慢。相反&#xff0c;DDPM的训练过程是很快的&#xff0c;可以直接根据 x 0 x_0 x0​到 x t x_t xt​添加的高斯噪声 ϵ \epsilon ϵ完成一次训练。 为了解…...

    2024/5/8 4:05:48
  6. 【外汇早评】美通胀数据走低,美元调整

    原标题:【外汇早评】美通胀数据走低,美元调整昨日美国方面公布了新一期的核心PCE物价指数数据,同比增长1.6%,低于前值和预期值的1.7%,距离美联储的通胀目标2%继续走低,通胀压力较低,且此前美国一季度GDP初值中的消费部分下滑明显,因此市场对美联储后续更可能降息的政策…...

    2024/5/8 6:01:22
  7. 【原油贵金属周评】原油多头拥挤,价格调整

    原标题:【原油贵金属周评】原油多头拥挤,价格调整本周国际劳动节,我们喜迎四天假期,但是整个金融市场确实流动性充沛,大事频发,各个商品波动剧烈。美国方面,在本周四凌晨公布5月份的利率决议和新闻发布会,维持联邦基金利率在2.25%-2.50%不变,符合市场预期。同时美联储…...

    2024/5/7 9:45:25
  8. 【外汇周评】靓丽非农不及疲软通胀影响

    原标题:【外汇周评】靓丽非农不及疲软通胀影响在刚结束的周五,美国方面公布了新一期的非农就业数据,大幅好于前值和预期,新增就业重新回到20万以上。具体数据: 美国4月非农就业人口变动 26.3万人,预期 19万人,前值 19.6万人。 美国4月失业率 3.6%,预期 3.8%,前值 3…...

    2024/5/4 23:54:56
  9. 【原油贵金属早评】库存继续增加,油价收跌

    原标题:【原油贵金属早评】库存继续增加,油价收跌周三清晨公布美国当周API原油库存数据,上周原油库存增加281万桶至4.692亿桶,增幅超过预期的74.4万桶。且有消息人士称,沙特阿美据悉将于6月向亚洲炼油厂额外出售更多原油,印度炼油商预计将每日获得至多20万桶的额外原油供…...

    2024/5/7 14:25:14
  10. 【外汇早评】日本央行会议纪要不改日元强势

    原标题:【外汇早评】日本央行会议纪要不改日元强势近两日日元大幅走强与近期市场风险情绪上升,避险资金回流日元有关,也与前一段时间的美日贸易谈判给日本缓冲期,日本方面对汇率问题也避免继续贬值有关。虽然今日早间日本央行公布的利率会议纪要仍然是支持宽松政策,但这符…...

    2024/5/4 23:54:56
  11. 【原油贵金属早评】欧佩克稳定市场,填补伊朗问题的影响

    原标题:【原油贵金属早评】欧佩克稳定市场,填补伊朗问题的影响近日伊朗局势升温,导致市场担忧影响原油供给,油价试图反弹。此时OPEC表态稳定市场。据消息人士透露,沙特6月石油出口料将低于700万桶/日,沙特已经收到石油消费国提出的6月份扩大出口的“适度要求”,沙特将满…...

    2024/5/4 23:55:05
  12. 【外汇早评】美欲与伊朗重谈协议

    原标题:【外汇早评】美欲与伊朗重谈协议美国对伊朗的制裁遭到伊朗的抗议,昨日伊朗方面提出将部分退出伊核协议。而此行为又遭到欧洲方面对伊朗的谴责和警告,伊朗外长昨日回应称,欧洲国家履行它们的义务,伊核协议就能保证存续。据传闻伊朗的导弹已经对准了以色列和美国的航…...

    2024/5/4 23:54:56
  13. 【原油贵金属早评】波动率飙升,市场情绪动荡

    原标题:【原油贵金属早评】波动率飙升,市场情绪动荡因中美贸易谈判不安情绪影响,金融市场各资产品种出现明显的波动。随着美国与中方开启第十一轮谈判之际,美国按照既定计划向中国2000亿商品征收25%的关税,市场情绪有所平复,已经开始接受这一事实。虽然波动率-恐慌指数VI…...

    2024/5/7 11:36:39
  14. 【原油贵金属周评】伊朗局势升温,黄金多头跃跃欲试

    原标题:【原油贵金属周评】伊朗局势升温,黄金多头跃跃欲试美国和伊朗的局势继续升温,市场风险情绪上升,避险黄金有向上突破阻力的迹象。原油方面稍显平稳,近期美国和OPEC加大供给及市场需求回落的影响,伊朗局势并未推升油价走强。近期中美贸易谈判摩擦再度升级,美国对中…...

    2024/5/4 23:54:56
  15. 【原油贵金属早评】市场情绪继续恶化,黄金上破

    原标题:【原油贵金属早评】市场情绪继续恶化,黄金上破周初中国针对于美国加征关税的进行的反制措施引发市场情绪的大幅波动,人民币汇率出现大幅的贬值动能,金融市场受到非常明显的冲击。尤其是波动率起来之后,对于股市的表现尤其不安。隔夜美国股市出现明显的下行走势,这…...

    2024/5/6 1:40:42
  16. 【外汇早评】美伊僵持,风险情绪继续升温

    原标题:【外汇早评】美伊僵持,风险情绪继续升温昨日沙特两艘油轮再次发生爆炸事件,导致波斯湾局势进一步恶化,市场担忧美伊可能会出现摩擦生火,避险品种获得支撑,黄金和日元大幅走强。美指受中美贸易问题影响而在低位震荡。继5月12日,四艘商船在阿联酋领海附近的阿曼湾、…...

    2024/5/4 23:54:56
  17. 【原油贵金属早评】贸易冲突导致需求低迷,油价弱势

    原标题:【原油贵金属早评】贸易冲突导致需求低迷,油价弱势近日虽然伊朗局势升温,中东地区几起油船被袭击事件影响,但油价并未走高,而是出于调整结构中。由于市场预期局势失控的可能性较低,而中美贸易问题导致的全球经济衰退风险更大,需求会持续低迷,因此油价调整压力较…...

    2024/5/4 23:55:17
  18. 氧生福地 玩美北湖(上)——为时光守候两千年

    原标题:氧生福地 玩美北湖(上)——为时光守候两千年一次说走就走的旅行,只有一张高铁票的距离~ 所以,湖南郴州,我来了~ 从广州南站出发,一个半小时就到达郴州西站了。在动车上,同时改票的南风兄和我居然被分到了一个车厢,所以一路非常愉快地聊了过来。 挺好,最起…...

    2024/5/7 9:26:26
  19. 氧生福地 玩美北湖(中)——永春梯田里的美与鲜

    原标题:氧生福地 玩美北湖(中)——永春梯田里的美与鲜一觉醒来,因为大家太爱“美”照,在柳毅山庄去寻找龙女而错过了早餐时间。近十点,向导坏坏还是带着饥肠辘辘的我们去吃郴州最富有盛名的“鱼头粉”。说这是“十二分推荐”,到郴州必吃的美食之一。 哇塞!那个味美香甜…...

    2024/5/4 23:54:56
  20. 氧生福地 玩美北湖(下)——奔跑吧骚年!

    原标题:氧生福地 玩美北湖(下)——奔跑吧骚年!让我们红尘做伴 活得潇潇洒洒 策马奔腾共享人世繁华 对酒当歌唱出心中喜悦 轰轰烈烈把握青春年华 让我们红尘做伴 活得潇潇洒洒 策马奔腾共享人世繁华 对酒当歌唱出心中喜悦 轰轰烈烈把握青春年华 啊……啊……啊 两…...

    2024/5/4 23:55:06
  21. 扒开伪装医用面膜,翻六倍价格宰客,小姐姐注意了!

    原标题:扒开伪装医用面膜,翻六倍价格宰客,小姐姐注意了!扒开伪装医用面膜,翻六倍价格宰客!当行业里的某一品项火爆了,就会有很多商家蹭热度,装逼忽悠,最近火爆朋友圈的医用面膜,被沾上了污点,到底怎么回事呢? “比普通面膜安全、效果好!痘痘、痘印、敏感肌都能用…...

    2024/5/5 8:13:33
  22. 「发现」铁皮石斛仙草之神奇功效用于医用面膜

    原标题:「发现」铁皮石斛仙草之神奇功效用于医用面膜丽彦妆铁皮石斛医用面膜|石斛多糖无菌修护补水贴19大优势: 1、铁皮石斛:自唐宋以来,一直被列为皇室贡品,铁皮石斛生于海拔1600米的悬崖峭壁之上,繁殖力差,产量极低,所以古代仅供皇室、贵族享用 2、铁皮石斛自古民间…...

    2024/5/4 23:55:16
  23. 丽彦妆\医用面膜\冷敷贴轻奢医学护肤引导者

    原标题:丽彦妆\医用面膜\冷敷贴轻奢医学护肤引导者【公司简介】 广州华彬企业隶属香港华彬集团有限公司,专注美业21年,其旗下品牌: 「圣茵美」私密荷尔蒙抗衰,产后修复 「圣仪轩」私密荷尔蒙抗衰,产后修复 「花茵莳」私密荷尔蒙抗衰,产后修复 「丽彦妆」专注医学护…...

    2024/5/4 23:54:58
  24. 广州械字号面膜生产厂家OEM/ODM4项须知!

    原标题:广州械字号面膜生产厂家OEM/ODM4项须知!广州械字号面膜生产厂家OEM/ODM流程及注意事项解读: 械字号医用面膜,其实在我国并没有严格的定义,通常我们说的医美面膜指的应该是一种「医用敷料」,也就是说,医用面膜其实算作「医疗器械」的一种,又称「医用冷敷贴」。 …...

    2024/5/6 21:42:42
  25. 械字号医用眼膜缓解用眼过度到底有无作用?

    原标题:械字号医用眼膜缓解用眼过度到底有无作用?医用眼膜/械字号眼膜/医用冷敷眼贴 凝胶层为亲水高分子材料,含70%以上的水分。体表皮肤温度传导到本产品的凝胶层,热量被凝胶内水分子吸收,通过水分的蒸发带走大量的热量,可迅速地降低体表皮肤局部温度,减轻局部皮肤的灼…...

    2024/5/4 23:54:56
  26. 配置失败还原请勿关闭计算机,电脑开机屏幕上面显示,配置失败还原更改 请勿关闭计算机 开不了机 这个问题怎么办...

    解析如下&#xff1a;1、长按电脑电源键直至关机&#xff0c;然后再按一次电源健重启电脑&#xff0c;按F8健进入安全模式2、安全模式下进入Windows系统桌面后&#xff0c;按住“winR”打开运行窗口&#xff0c;输入“services.msc”打开服务设置3、在服务界面&#xff0c;选中…...

    2022/11/19 21:17:18
  27. 错误使用 reshape要执行 RESHAPE,请勿更改元素数目。

    %读入6幅图像&#xff08;每一幅图像的大小是564*564&#xff09; f1 imread(WashingtonDC_Band1_564.tif); subplot(3,2,1),imshow(f1); f2 imread(WashingtonDC_Band2_564.tif); subplot(3,2,2),imshow(f2); f3 imread(WashingtonDC_Band3_564.tif); subplot(3,2,3),imsho…...

    2022/11/19 21:17:16
  28. 配置 已完成 请勿关闭计算机,win7系统关机提示“配置Windows Update已完成30%请勿关闭计算机...

    win7系统关机提示“配置Windows Update已完成30%请勿关闭计算机”问题的解决方法在win7系统关机时如果有升级系统的或者其他需要会直接进入一个 等待界面&#xff0c;在等待界面中我们需要等待操作结束才能关机&#xff0c;虽然这比较麻烦&#xff0c;但是对系统进行配置和升级…...

    2022/11/19 21:17:15
  29. 台式电脑显示配置100%请勿关闭计算机,“准备配置windows 请勿关闭计算机”的解决方法...

    有不少用户在重装Win7系统或更新系统后会遇到“准备配置windows&#xff0c;请勿关闭计算机”的提示&#xff0c;要过很久才能进入系统&#xff0c;有的用户甚至几个小时也无法进入&#xff0c;下面就教大家这个问题的解决方法。第一种方法&#xff1a;我们首先在左下角的“开始…...

    2022/11/19 21:17:14
  30. win7 正在配置 请勿关闭计算机,怎么办Win7开机显示正在配置Windows Update请勿关机...

    置信有很多用户都跟小编一样遇到过这样的问题&#xff0c;电脑时发现开机屏幕显现“正在配置Windows Update&#xff0c;请勿关机”(如下图所示)&#xff0c;而且还需求等大约5分钟才干进入系统。这是怎样回事呢&#xff1f;一切都是正常操作的&#xff0c;为什么开时机呈现“正…...

    2022/11/19 21:17:13
  31. 准备配置windows 请勿关闭计算机 蓝屏,Win7开机总是出现提示“配置Windows请勿关机”...

    Win7系统开机启动时总是出现“配置Windows请勿关机”的提示&#xff0c;没过几秒后电脑自动重启&#xff0c;每次开机都这样无法进入系统&#xff0c;此时碰到这种现象的用户就可以使用以下5种方法解决问题。方法一&#xff1a;开机按下F8&#xff0c;在出现的Windows高级启动选…...

    2022/11/19 21:17:12
  32. 准备windows请勿关闭计算机要多久,windows10系统提示正在准备windows请勿关闭计算机怎么办...

    有不少windows10系统用户反映说碰到这样一个情况&#xff0c;就是电脑提示正在准备windows请勿关闭计算机&#xff0c;碰到这样的问题该怎么解决呢&#xff0c;现在小编就给大家分享一下windows10系统提示正在准备windows请勿关闭计算机的具体第一种方法&#xff1a;1、2、依次…...

    2022/11/19 21:17:11
  33. 配置 已完成 请勿关闭计算机,win7系统关机提示“配置Windows Update已完成30%请勿关闭计算机”的解决方法...

    今天和大家分享一下win7系统重装了Win7旗舰版系统后&#xff0c;每次关机的时候桌面上都会显示一个“配置Windows Update的界面&#xff0c;提示请勿关闭计算机”&#xff0c;每次停留好几分钟才能正常关机&#xff0c;导致什么情况引起的呢&#xff1f;出现配置Windows Update…...

    2022/11/19 21:17:10
  34. 电脑桌面一直是清理请关闭计算机,windows7一直卡在清理 请勿关闭计算机-win7清理请勿关机,win7配置更新35%不动...

    只能是等着&#xff0c;别无他法。说是卡着如果你看硬盘灯应该在读写。如果从 Win 10 无法正常回滚&#xff0c;只能是考虑备份数据后重装系统了。解决来方案一&#xff1a;管理员运行cmd&#xff1a;net stop WuAuServcd %windir%ren SoftwareDistribution SDoldnet start WuA…...

    2022/11/19 21:17:09
  35. 计算机配置更新不起,电脑提示“配置Windows Update请勿关闭计算机”怎么办?

    原标题&#xff1a;电脑提示“配置Windows Update请勿关闭计算机”怎么办&#xff1f;win7系统中在开机与关闭的时候总是显示“配置windows update请勿关闭计算机”相信有不少朋友都曾遇到过一次两次还能忍但经常遇到就叫人感到心烦了遇到这种问题怎么办呢&#xff1f;一般的方…...

    2022/11/19 21:17:08
  36. 计算机正在配置无法关机,关机提示 windows7 正在配置windows 请勿关闭计算机 ,然后等了一晚上也没有关掉。现在电脑无法正常关机...

    关机提示 windows7 正在配置windows 请勿关闭计算机 &#xff0c;然后等了一晚上也没有关掉。现在电脑无法正常关机以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容&#xff0c;让我们赶快一起来看一下吧&#xff01;关机提示 windows7 正在配…...

    2022/11/19 21:17:05
  37. 钉钉提示请勿通过开发者调试模式_钉钉请勿通过开发者调试模式是真的吗好不好用...

    钉钉请勿通过开发者调试模式是真的吗好不好用 更新时间:2020-04-20 22:24:19 浏览次数:729次 区域: 南阳 > 卧龙 列举网提醒您:为保障您的权益,请不要提前支付任何费用! 虚拟位置外设器!!轨迹模拟&虚拟位置外设神器 专业用于:钉钉,外勤365,红圈通,企业微信和…...

    2022/11/19 21:17:05
  38. 配置失败还原请勿关闭计算机怎么办,win7系统出现“配置windows update失败 还原更改 请勿关闭计算机”,长时间没反应,无法进入系统的解决方案...

    前几天班里有位学生电脑(windows 7系统)出问题了&#xff0c;具体表现是开机时一直停留在“配置windows update失败 还原更改 请勿关闭计算机”这个界面&#xff0c;长时间没反应&#xff0c;无法进入系统。这个问题原来帮其他同学也解决过&#xff0c;网上搜了不少资料&#x…...

    2022/11/19 21:17:04
  39. 一个电脑无法关闭计算机你应该怎么办,电脑显示“清理请勿关闭计算机”怎么办?...

    本文为你提供了3个有效解决电脑显示“清理请勿关闭计算机”问题的方法&#xff0c;并在最后教给你1种保护系统安全的好方法&#xff0c;一起来看看&#xff01;电脑出现“清理请勿关闭计算机”在Windows 7(SP1)和Windows Server 2008 R2 SP1中&#xff0c;添加了1个新功能在“磁…...

    2022/11/19 21:17:03
  40. 请勿关闭计算机还原更改要多久,电脑显示:配置windows更新失败,正在还原更改,请勿关闭计算机怎么办...

    许多用户在长期不使用电脑的时候&#xff0c;开启电脑发现电脑显示&#xff1a;配置windows更新失败&#xff0c;正在还原更改&#xff0c;请勿关闭计算机。。.这要怎么办呢&#xff1f;下面小编就带着大家一起看看吧&#xff01;如果能够正常进入系统&#xff0c;建议您暂时移…...

    2022/11/19 21:17:02
  41. 还原更改请勿关闭计算机 要多久,配置windows update失败 还原更改 请勿关闭计算机,电脑开机后一直显示以...

    配置windows update失败 还原更改 请勿关闭计算机&#xff0c;电脑开机后一直显示以以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容&#xff0c;让我们赶快一起来看一下吧&#xff01;配置windows update失败 还原更改 请勿关闭计算机&#x…...

    2022/11/19 21:17:01
  42. 电脑配置中请勿关闭计算机怎么办,准备配置windows请勿关闭计算机一直显示怎么办【图解】...

    不知道大家有没有遇到过这样的一个问题&#xff0c;就是我们的win7系统在关机的时候&#xff0c;总是喜欢显示“准备配置windows&#xff0c;请勿关机”这样的一个页面&#xff0c;没有什么大碍&#xff0c;但是如果一直等着的话就要两个小时甚至更久都关不了机&#xff0c;非常…...

    2022/11/19 21:17:00
  43. 正在准备配置请勿关闭计算机,正在准备配置windows请勿关闭计算机时间长了解决教程...

    当电脑出现正在准备配置windows请勿关闭计算机时&#xff0c;一般是您正对windows进行升级&#xff0c;但是这个要是长时间没有反应&#xff0c;我们不能再傻等下去了。可能是电脑出了别的问题了&#xff0c;来看看教程的说法。正在准备配置windows请勿关闭计算机时间长了方法一…...

    2022/11/19 21:16:59
  44. 配置失败还原请勿关闭计算机,配置Windows Update失败,还原更改请勿关闭计算机...

    我们使用电脑的过程中有时会遇到这种情况&#xff0c;当我们打开电脑之后&#xff0c;发现一直停留在一个界面&#xff1a;“配置Windows Update失败&#xff0c;还原更改请勿关闭计算机”&#xff0c;等了许久还是无法进入系统。如果我们遇到此类问题应该如何解决呢&#xff0…...

    2022/11/19 21:16:58
  45. 如何在iPhone上关闭“请勿打扰”

    Apple’s “Do Not Disturb While Driving” is a potentially lifesaving iPhone feature, but it doesn’t always turn on automatically at the appropriate time. For example, you might be a passenger in a moving car, but your iPhone may think you’re the one dri…...

    2022/11/19 21:16:57