大爱的CUDA:图像亮度直方图统计
(发些代码赚些零用KCB来花花)

CPU实现大法:计算每个点的亮度值(0~255),然后用一个256大小的数组统计每个亮度的点的数量。



对1280*1024大小的图像,在QX6600(2.4GHz)上单线程运行时间为17.5ms。

hist_cpu.JPG
+777  科创币    破93   2009-08-07    70马要赞扬
来自:计算机科学 / 软件综合
 
2009-8-7 23:28:37
小俊(作者)
1楼
CUDA实现大法:和CPU法原理差不多,但实现起来要分两步。第一步把整个图像分成很多个部分,每个部分用一个线程块(含很多个线程)独立统计;第二步则把各个部分独立统计的结果再累加起来得到总的统计结果。之所以用这个方法是从GPU内部架构考虑的,因为每个部分并行独立统计的结果可以放在对应的片上shared memory中,效率很高。代码比较复杂:



同样大小的图像,在Geforce GTX 285上计算时间为0.56ms,比QX6600上单线程提速约30倍。

hist_gpu.JPG
折叠评论
加载评论中,请稍候...
折叠评论
2009-08-08 10:05:38
2楼
小俊那里是否能便宜拿到显卡?geforce8XXX系列我想弄一块,越便宜越好,最好100元以内解决
折叠评论
加载评论中,请稍候...
折叠评论
3楼
我能300搞到块9600GT-512MB
等我买新机器装上
折叠评论
加载评论中,请稍候...
折叠评论
小俊(作者)
4楼
引用第3楼novakon于2009-08-08 10:05发表的  :
小俊那里是否能便宜拿到显卡?geforce8XXX系列我想弄一块,越便宜越好,最好100元以内解决


弄不到。我现在台式机用的显卡和主板是在NV美国总部的垃圾堆捡回来的。
折叠评论
加载评论中,请稍候...
折叠评论
5楼
对了,经研究发现最后一步可以用对global atomic实现
第二个kernel可以省掉
以前理解有误
折叠评论
加载评论中,请稍候...
折叠评论
小俊(作者)
6楼
引用第6楼darkstorm于2009-08-08 23:06发表的  :
对了,经研究发现最后一步可以用对global atomic实现
第二个kernel可以省掉
以前理解有误


是不是在__syncthreads之后,直接把各线程块的shared memory的内容通过AtomicAdd累加到global memory中呢?
折叠评论
加载评论中,请稍候...
折叠评论
小俊(作者)
7楼
这样?

atomicAdd((int *)&out[tid], smem[tid]);
atomicAdd((int *)&out[tid + 128], smem[tid + 128]);
折叠评论
加载评论中,请稍候...
折叠评论
2009-08-09 01:15:50
8楼
好像在科创搞计算机的都一夜暴富了呵。。。
我还是一穷光蛋。。。
折叠评论
加载评论中,请稍候...
折叠评论
9楼
引用第8楼小俊于2009-08-08 23:40发表的  :
这样?

atomicAdd((int *)&out[tid], smem[tid]);
atomicAdd((int *)&out[tid + 128], smem[tid + 128]);


折叠评论
加载评论中,请稍候...
折叠评论
2009-08-10 17:44:42
2009-8-10 17:44:42
小俊(作者)
10楼
引用第10楼darkstorm于2009-08-09 11:39发表的  :




今天试了一下,改成对global memory原子加之后,计算时间从0.56ms减少到0.55ms,还是有一定作用的,多谢指教!
折叠评论
加载评论中,请稍候...
折叠评论
2009-08-17 11:34:43
2009-8-17 11:34:43
11楼
引用第5楼小俊于09-08-08 18:30发表的  :


弄不到。我现在台式机用的显卡和主板是在NV美国总部的垃圾堆捡回来的。

啊(突然头很痛)。
折叠评论
加载评论中,请稍候...
折叠评论

想参与大家的讨论?现在就 登录 或者 注册

小俊
学者 机友 笔友
文章
71
回复
1155
学术分
47
2006/12/29注册,3 个月前活动
暂无简介
插入资源
全部
图片
视频
音频
附件
全部
未使用
已使用
正在上传
空空如也~
上传中..{{f.progress}}%
处理中..
上传失败,点击重试
{{f.name}}
空空如也~
(视频){{r.oname}}
{{selectedResourcesId.indexOf(r.rid) + 1}}
插入表情
我的表情
共享表情
Emoji
上传
注意事项
最大尺寸100px,超过会被压缩。为保证效果,建议上传前自行处理。
建议上传自己DIY的表情,严禁上传侵权内容。
点击重试等待上传{{s.progress}}%处理中...已上传
空空如也~
草稿箱
加载中...
此处只插入正文,如果要使用草稿中的其余内容,请点击继续创作。
{{fromNow(d.toc)}}
{{getDraftInfo(d)}}
标题:{{d.t}}
内容:{{d.c}}
继续创作
删除插入插入
{{forum.displayName}}
{{forum.countThreads}}
篇文章,
{{forum.countPosts}}
条回复
{{forum.description || "暂无简介"}}
ID: {{user.uid}}
{{submitted?"":"投诉"}}
请选择违规类型:
{{reason.description}}
支持的图片格式:jpg, jpeg, png