近来完成了一个功能,然后进行各项测试工作的。吾发现了一个cudaMemcpy有严重的性能问题。
- 如果复制的数据量,不超过1920x1080*4(颜色)*4(画面),性能表现良好。
- 一旦超过,性能急剧恶化,消耗的时间大增。
有人奇怪了:汝怎么知道的?
这有什么奇怪的,测试多个摄像头的时候发现画面卡顿,再检查哪个步骤,就知道了。
怎么解决呢?当然是限制数据量的大小。怎么限制?9个摄像头合成以后的画面,大小能控制?有几个思路:
- 限制合成画面的大小;
- 进行缩放;
- 限制单次数据量。
近来完成了一个功能,然后进行各项测试工作的。吾发现了一个cudaMemcpy有严重的性能问题。
有人奇怪了:汝怎么知道的?
这有什么奇怪的,测试多个摄像头的时候发现画面卡顿,再检查哪个步骤,就知道了。
怎么解决呢?当然是限制数据量的大小。怎么限制?9个摄像头合成以后的画面,大小能控制?有几个思路: