| 热点推荐 |
|---|
面向未来 3D API、外部接口和多GPU并行
至此,07年度显卡技术和芯片级产品的回顾就已经全部结束,笔者不想在这里过多的臆测未来阵营、厂商间的对比、沉浮,纵使目前有Radeon研发团队跳槽Intel等剧烈变化,用户层面更多关心的仍然是好的产品,实实在在的技术革新,那么,我们将不得不关注以下方面:
● 关于DirectX 10.1
DirectX 10.1是微软DirectX 3D API的最新版本。其关键特性包括:一个更新的着色器模型、抗锯齿支持的提高、更灵活的数据获取,以及能够保证程序更好的兼容性的更严格的规格。这些新特性将支持一些不错的新技术,如实时全局照明,它明确了未来交互3D图形的发展方向。008年年初将发布的Windows Vista Service Pack 1中将包含DirectX 10.1支持。
DirectX 10.1保持了DirectX 10的整体结构和编程模型,同时提供了许多增强的功能。顶点、几何和像素着色指令集已经得到更新,支持Shader Model 4.1。 DirectX 10.1的新特性可分为三大类:新的纹理着色能力、抗锯齿失真的改进和更严格的规范。下表显示了每类中的关键特性,也指出了这些新特性的优势。
DirectX 10.1 新 特 性 汇 总 能够对复杂,动态的交互场景进行高效的实时全局照明 提供许多光线追踪技术具有的品质效果,包括:间接照明、褪色、软阴影、折射和高质量的有光泽反射 定制边缘检测滤波器以获得高质量的抗锯齿效果,性能得到了提高 提高自适应抗锯齿的性能 通过HDR渲染提高抗锯齿质量的兼容性 通过延时渲染技术提高抗锯齿的兼容性和性能。 实时抗锯齿 通过多GPU抗锯齿技术提高图像质量 确保抗锯齿功能在所有的DirectX 10.1 GPU上表现一致 通过提高一致性,鼓励支持抗锯齿功能 消除舍入误差 要求所有的运算匹配IEEE标准
特性
功能
优势
着色器与纹理的改进
立方图阵列
允许在一次渲染过程中对多重立方图阵列进行读和写
区分每个多重缓冲区的混合模式
允许每个像素着色器使用不同的混合模式输出到多重缓冲区中
在复杂的3D场景中,能够有效地进行延时渲染以提升性能
增加的顶点着色单元的输入与输出量
从16位提升到32位,达到每着色器128位值
使复杂着色器的性能得到了提高
Gather 4
允许在一个单一双线性滤波的纹理查找中提取一个2×2的未经过滤波的纹理值
使流计算应用的性能得到了提高
LOD 指令
为了进行滤波的纹理查找而要求返回层次细节的新的着色器指令
定制纹理滤波技术,以优化性能和提高图像质量
抗锯齿失真的提高
多重采样缓冲读写
允许着色器直接存取多重采样缓冲区中的每个色彩采样和深度采样
像素覆盖
使得像素着色器具有可编程抗锯齿功能
可编程抗锯齿采样模式
使得开发人员可控制每个像素的采样位置
更严格的规范
要求32位浮点滤波
对128位的浮点纹理格式进行滤波作为要求而不是可选功能
通过确保硬件的兼容性鼓励使用高精度的数据格式
要求Int16混合操作
对64位整型像素格式进行混合操作作为要求而不是可选功能
要求最小支持4种多重采样抗锯齿支持
对于所有的32位和64位像素格式,要求每个像素至少支持4种采样以实现多重采样抗锯齿
标准化的抗锯齿采样模式
硬件必须支持2×、4×、8× 和16×抗锯齿模式的预定义采样位置
提高浮点运算操作的精度
要所有的浮点运算(加、减、乘、除)和混合运算的精度都要达到0.5ULP
DirectX 10.1对编程接口提供更好的改进,解决了DirectX 10中的限制问题,并且其新的图形技术将使2008年及以后的3D图形质量达到一个新的高度,其优势包括:全局照明特性使光照和实时场景的阴影质量能够达到CG电影中使用光线跟踪技术达到的效果;提高的抗锯齿技术能够清楚锯齿和闪光带来的混乱效果;更严格的规范能够提高兼容性。

DirectX 10.1在演示DEMO中的优势
在AMD的演示DEMO中,DirectX 10.1能够实现一个和DirectX 10区别明显的应用,如上图所示,这显示了有无全局光影照明的区别,DirectX 10.1+DirectX 10.1硬件可以在演示的墙壁漫反射光源发出的光,并正确渲染每一个球体的光影效果,DirectX 10则做不到。
AMD Radeon HD 3800系列产品是目前唯一支持DirectX 10.1而设计制造的显卡系列,DirectX10.1是否能帮助它在未来扳回技术形象方面的颓势暂时还无法判断,这很大程度上要看微软的执行力度和游戏软件公司的支持。
● PCI Express 2.0
PCI-Express是第三代I/O架构,通过提供点到点、高速度、低针脚数解决方案,满足了日益提高了I/O带宽需求。
PCI-SIG于2007年1月出版了PCI Express Base 2.0规范。这一规范以无缝的可兼容的方式把互连位速率提高了一倍,从2.5 GT/s提高到5 GT/s。PCI Express 2.0版规范的其它新增功能和改进功能包括动态链路速度和链路宽度管理、以及活动状态电源管理(ASPM)相关改进。目前NVIDIA G92、AMD RV670两款GPU均可以运行在PCI Express 2.0 x16上,对应支持的主板逻辑芯片组包括Intel X48 / 38 Express和AMD的790 / 770系列。
PCI Express 2.0(16GB/s)可以提供2倍于PCI Express 1.0的上下行带宽,更有利于GPU和系统内存之间进行数据交换,加速HyperMemory / TubroCache类应用。按照惯例,显卡的总线接口很难在换代之时就带来明显的整体速度提升,更多的意义是未雨绸缪,眼前的PCI Express 2.0也是一样也成为新发GPU的现实标准。
● 多GPU并行之战的升级
Radeon HD 3850和Radeon HD 3870都支持在AMD最新的790FX主板上的2、3或4个显卡的多GPU加速技术,这是在旧有双GPU加速的CrossFire技术的最新扩展,被命名为CrossFire X。

Radeon HD 3850四卡CrossFire X系统
相对于当年CrossFire迟于NVIDIA的SLI技术发布匆匆追赶的态势,这次AMD在多GPU并行技术方面可谓相当积极,并在规格上有所超越,首先在桌面平台实现了四卡的超级规模。这种极致的技术扩展了超级DIY玩家的系统构建可能。

Geforce 8800 Ultra 3Way SLI系统
NVIDIA则适时的推出3卡SLI,这种系统运作在nForce 680i / 780i SLI主板上,目前仅有Geforce 8800 Ultra / GTX显卡可以使用,3卡SLI同样面向极限性能,系统电源供应器甚至都要求1200W额定输出功率。
和CPU领域2年以前就开始提倡降低功耗提高性能/龚好比的设计思路相比,GPU还走在爆炸增长晶体管+急速飙升功率的粗放增长之路上。我们仅仅在年末的Radeon HD 3800上看到一种动态降频的节能技术PowerPlay,这和Intel Core 2系列CPU可以实现内部动态区域门控的技术还相差甚远,这也许是GPU厂商未来几年应该考虑的方向。
接下来是我们测试过的显卡产品中具有代表性优秀产品推荐。