一种利用NVIDIA Kepler GPU汇编指令加速的卷积优化方法及系统

欢迎进入淮海经济区技术产权交易中心官方网站！

0516-83896168 Email：jshtec@163.com 旧版回顾

发明专利

专利名称：一种利用NVIDIA Kepler GPU汇编指令加速的卷积优化方法及系统

专利类型：发明专利

专利号：CN201611215263.X

发布日期：2025-11-26

授权公告日：
详细内容

本发明提出一种利用NVIDIA Kepler GPU汇编指令加速的卷积优化方法,涉及深度学习,高性能计算,GPGPU编程技术领域,该方法包括将大小的矩阵与大小的矩阵相乘,获得大小的输出元素,对N维度用bn做分块,对K维度用bk作分块,获得GPU的block维度为>>,其中N为批处理图像数目,K为输出图像深度,C为输入图像深度,R为卷积核高度, S为卷积核宽度,P为输出图像高度,Q为输出图像宽度。本发明相比传统的卷积过程简化了步骤,减少了调用次数,增加了数据局部性;避免额外延迟并可选取高效的向量指令,如STS.128,LDG.128减少bank冲突和增加带宽;可以达到75%的峰值性能,超过目前最优的cudnn实现20%‑40%。

扫描访问手机版

国家部委

科技与知识产权

友情链接

关于我们

电话：0516-83896168 传真：0516-83896168 邮箱：jshtec@163.com 网址：www.jshtec.com 地址：江苏徐州市金山东路中国矿业大学国家大学科技园科技大厦