1802.00930
2026-06-04
cs.NE
cs.LG
cs.NA
math.NA
Mixed Precision Training of Convolutional Neural Networks using Integer Operations
使用整数运算进行卷积神经网络的混合精度训练
Dipankar Das, Naveen Mellempudi, Dheevatsa Mudigere, Dhiraj Kalamkar, Sasikanth Avancha, Kunal Banerjee, Srinivas Sridharan, Karthik Vaidyanathan, Bharat Kaul, Evangelos Georganas, Alexander Heinecke, Pradeep Dubey, Jesus Corbal, Nikita Shustrov, Roma Dubtsov, Evarist Fomenko, Vadim Pirogov
发表机构
*
Parallel Computing Lab(并行计算实验室)
;
Intel Labs, India(英特尔实验室,印度)
;
Product Architecture Group(产品架构组)
;
Intel Labs, SC Intel, OR(英特尔实验室,SC英特尔,美国)
;
Software Services Group(软件服务组)
;
Intel, OR(英特尔,美国)
AI总结
本文提出了一种基于整数运算的混合精度训练方法,在ImageNet-1K数据集上训练了ResNet-50、GoogLeNet-v1等SOTA网络,实现了比FP32更高的训练吞吐量和相同精度下的最高准确率。