“我们为并行计算评估了多种开发环境,”负责CUDA实现的研究人员Herlambang这样说,“最终选择了CUDA,因为它使我们能够使用熟悉的C语言语法进行开挑战
在成像技术中,一个非常有趣的领域就是裸眼立体成像技术,它无需特殊眼镜就能显示三维立体图像。这种有趣的技术不仅有着娱乐方面的应用潜力,也可作为多种专业应用程序的实用技术。东京大学信息科学与技术研究生院机械信息系的Takeyoshi Dohi教授与他的同事研究了NVDIA的CUDA™并行计算平台之后认为,医疗成像是这种平台非常有前途的应用领域之一。
自2000年以来,这所大学的研究小组已经开发出一种系统,通过CT或MRI扫描实时获得的活体截面图被视为体纹理,这种系统不仅能够通过体绘制再现为三维图像,还可作为立体视频显示,供IV系统使用。
该系统为实时、立体、活体成像带来了革命性的变化。但是,它的计算量极其庞大,仅体绘制本身就会带来极高的处理工作量,况且此后还需要进一步处理来实现立体成像。对于每一个图像帧,都有众多角度需同时显示。将此乘以视频中的帧数,您会看到令人震惊的庞大计算数量,且必须在很短的时间内高度精确地完成这样的计算。
在2001年的研究中,使用了一台Pentium III 800 MHz PC来处理一些512 x 512解析度的图片,实时体绘制和立体再现要花费10秒钟以上的时间才能生成一帧。为了加速处理,研究小组尝试使用配备60块CPU的UltraSPARC III 900 MHz机器,这是当时性能最高的计算机。但可以得到的最佳结果也不过是每秒钟五帧。从实用的角度考虑,这样的速度还不够快。
解决方案
体绘制和随后转换为IV格式都需要进行数据平行矢量计算。为此,最佳计算范式是GPU。相应地,Liao和Herlambang 着手研究使用CUDA实现GPU,这是来自NVIDIA的通用C语言GPU开发环境。
首先,研究人员使用最新一代的GPU GeForce® 8800 GTX开发了一个原型系统。在使用CUDA的GPU上运行2001年研究所用的数据集时,性能提升到每秒13至14帧。UltraSPARC系统的成本高达数千万日元,是GPU的上百倍,而GPU却交付了几乎等同于其三倍的性能,研究人员为此感到十分惊讶。不仅如此,根据小组的研究,NVIDIA的GPU比最新的多核CPU至少要快70倍。另外,测试显示,对于较大规模的体纹理数据,GPU的性能更为突出。
目前,这支研究小组正运用NVDIA最新的桌面端超级计算机Tesla™ D870,针对使用CUDA的Tesla优化目前的IV系统。这一举措有望使性能获得更大幅度的提升。
效果
此外,我们还可以在不必修改已开发系统的前提下利用速度更快的新生代GPU。如果某种环境使得调试大型CUDA程序成为可能,CUDA必将成为一种更强大的并行计算开发环境,我们希望它在医疗成像处理领域中得到更广泛的应用。”
如果能够以立体方式实时查看来自CT和MRI的图像,医生就能够检查病患组织的状态并做出诊断,而无需活体检查和外科处理。此外,某些医生可以同时查看此类图像,彼此沟通。这使部分医生能够同时进行关节镜手术和其他微创型外科技术,而每名外科医生都能实时观察手术过程。
将庞大的并行计算阵列引入临床设备非常困难,但GPU和Tesla的强大计算能力使得提供紧凑的并行计算模块成为可能。
Integral Videography(IV)原理示意图
图字:计算机内部处理 calculation of IV element image IV像素图计算 Voxel data 三维数据 virtual lens array 虚拟透镜阵列
Flat display 平面显示屏
Space image formation:空间立体图像构成
Micro convex lens array:微型透镜阵列 observer:观察者
解决方案
远距离观察IV图像的示例。在显示屏前
两米的位置形成非常逼真、立体的黄色竹竿图像,看上去就像是被握在手中。即便在观察者移动时,图像依然保持“被握在手中”的可见状态。要创建高解析度、立体的图像,就要使用体绘制之类的处理方法,但需要极高的计算能力。
效果
使用CUDA的IV系统