CPU多线程处理,一种隐藏传输时间方法-阿里云开发者社区

开发者社区> 云计算> 正文
登录阅读全文

CPU多线程处理,一种隐藏传输时间方法

简介: 在使用CUDA进行编程时,遇到提速时间达不到效果时往往会用CUDA自带的visual profiler进行算法运行时间的分析; 在分析时,总会遇到数据流从向显存传输时的时间在算法中多于实际你的算法处理你要解决问题的算法的时间。 如你在传输时花70%的时间,而你处理你的问题时只花30%的时间,这时再提升你算法处理的问题时的速度主要集中在怎么减少传输时所用的时间或者怎么隐藏传输

在使用CUDA进行编程时,遇到提速时间达不到效果时往往会用CUDA自带的visual profiler进行算法运行时间的分析;
在分析时,总会遇到数据流从向显存传输时的时间在算法中多于实际你的算法处理你要解决问题的算法的时间。
如你在传输时花70%的时间,而你处理你的问题时只花30%的时间,这时再提升你算法处理的问题时的速度主要集中在怎么减少传输时所用的时间或者怎么隐藏传输时所用的时间。
在网上找了两种方法:
1是在GPU上进行多流处理。
2是在CPU上多线程进行异步处理。
持续更新

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享: