本发明涉及一种分布式深度学习的通信优化方法及系统。该方法包括:1)对于分布式深度学习的训练过程中各计算节点产生的梯度,采用稀疏化方法选取部分梯度值;2)对采用稀疏化方法选取的部分梯度值进行量化,将量化后的梯度值作为梯度通信的传输对象,传输给参数服务器。本发明提出了梯度的稀疏化传递和量化压缩的结合,并且针对训练过程中的不同特点划分了三个不同的训练阶段,根据不同的训练状况进行调整,将梯度压缩的效果进一步提升,提高了分布式场景下的训练效率,并且没有对收敛性能和模型的精度产生明显的负面影响。
欢迎访问我们网站
江苏淮海技术产权交易中心是由江苏淮海科技城、徐州市科技局和中国矿业大学国家大学科技园联合出资设立的,专业从事技术成果转化、转移与技术产权交易的服务机构。
本发明涉及一种分布式深度学习的通信优化方法及系统。该方法包括:1)对于分布式深度学习的训练过程中各计算节点产生的梯度,采用稀疏化方法选取部分梯度值;2)对采用稀疏化方法选取的部分梯度值进行量化,将量化后的梯度值作为梯度通信的传输对象,传输给参数服务器。本发明提出了梯度的稀疏化传递和量化压缩的结合,并且针对训练过程中的不同特点划分了三个不同的训练阶段,根据不同的训练状况进行调整,将梯度压缩的效果进一步提升,提高了分布式场景下的训练效率,并且没有对收敛性能和模型的精度产生明显的负面影响。
扫描访问手机版