MCPLive > 杂志文章 > DirectX 11显卡裁判 《3DMark 11》解析

DirectX 11显卡裁判 《3DMark 11》解析

2011-02-02uc 破布《微型计算机》2011年1月下

如果你是一个老玩家,肯定不会忘记每代显卡运行3DMark测试软件的情形,甚至对其中一些画面还历历在目。而在《3DMark 11》发布后,很多人惊奇地发现,测试时间变短了,画质更漂亮了,当然对显卡的要求更高、系统负载也更重了。那么,《3DMark 11》是通过怎样的设计来实现如此绚丽的画面?它采用了哪些新技术?

基准测试软件的进化和更新,一直是图形、显卡业界的大事。从早期的《3DMark 99》到后来的《3DMark 2000》、《3DMark 2003》、《3DMark 2005》,还有目前尚在使用的《3DMark Vantage》等,都对当时显卡的发展带来了深远的影响,甚至还左右了显卡厂商的宣传策略和市场手段。

在《3DMark 11》发布之前,离我们近一代的3DMark软件是2008年初发布的《3DMark Vantage》,这款测试软件在发布时将所有显卡的主流成绩(即Performance)拉低到5000分以内,但随着技术进步,目前的显卡在《3DMark Vantage》的主流成绩已经突破20000分大关。显然,《3DMark Vantage》已经很难给新一代显卡带来太大压力,其较老的架构和只支持DirectX 10 API的缺陷也令玩家很难及时感受到新技术的魅力。作为业界评测软件大佬的Furmark当然不会坐视不管,终于在2010年11月30日,《3DMark 11》携带着全新的技术和绚丽的画面,来到我们的眼前。

从低端到顶级《3DMark 11》测试等级一点通

大家知道,在《3DMark Vantage》之前,3DMark的测试是不分等级的,或者说只有一个等级,那就是“默认”。例如,只要你打开《3DMark 06》,不作任何设置直接按下“运行测试”的按键,就意味着测试已经正式开始。这种操作虽然简单,但存在较大漏洞。在之前的设计中,即使玩家修改了默认设置,3DMark也会给出成绩,这将导致整个测试软件的横向可比性变差。比如同样的显卡,在A手中,由于分辨率只有1280×720,因此可以得到8000分的成绩,但是在B手中,由于分辨率达到1680×1050,测试分数就只有6000分。此时成绩仅仅作为一个数据来传递信息,不够可靠也不够完整。


各种不同的测试等级,给用户的使用带来了方便,也让《3DMark 11》更具有可比性。

在《3DMark Vantage》中,这种情况得到了根本性的改善。3DMark的测试开始分类,并且在分数前加上限定词语。比如《3DMark Vantage》分出E、P、H、X四类测试级别,分别针对入门级、性能级、高级以及终极用户。这些分类测试的设定全部是已经设置好的,如果用户擅自改动测试项目则不会显示综合成绩。而在《3DMark 11》中,Furmark坚持了这样的设置,并提供了以下三类测试:

Entry(E):入门级:用于测试显卡低负载下的系统性能表现。测试在1024×600分辨率下运行,适合于入门级的DirectX 11兼容系统,如笔记本电脑和上网本;

Performance(P):性能级用于测试显卡中等负载时的系统性能表现。测试在1280×720 分辨率下运行,适合于绝大多数支持DirectX 11的游戏电脑;

Extreme(X):极限级用于测试显卡在极重负载下的性能表现。测试分辨率为1920×1080,测试的目的在于模拟未来几年中游戏可能达到的负载压力,保证测试成绩在相当长的时间内都存在可比性。

与《3DMark Vantage》相比,《3DMark 11》取消了H高级模式。同时,我们还注意到在《3DMark Vantage》技术白皮书中有这样一个提示:如采用高端硬件进行P模式测试,将会出现测试运行相当流畅的情况,在这种状态下,软件本身给予显卡的负载压力可能不足,终导致性能被局限在另外的瓶颈上。如曾被玩家戏称为“CPU Mark”的《3DMark 06》,就是因为其默认状态的3D测试对显卡性能要求过低,导致瓶颈集中在CPU上。如果出现这种情况,玩家可以运行X模式以真正压榨硬件性能,在不同的显卡中拉开足够的性能分数差距。Furmark认为《3DMark 11》的X模式设计可以满足未来几年之内对游戏可能拥有的负载模拟,因此X模式是3DMark测试数据拥有长期可比性的重要保证。

当然,虽然《3DMark 11》已经设计了几种测试模式,但并不代表玩家不能自行设定分辨率。玩家依旧可以在设置窗口中对各个选项进行调节,但终只能得到某一场景的单项测试成绩,《3DMark 11》在这种情况下不会给出综合的测试成绩。

《3DMark 11》各等级详细设置表

   Entry(入门级)  Performance(性能级)  Extreme(发烧级)
 分辨率  1024×600  1280×720  1920×1080
 所需显存  256MB  768MB  1024MB
 多重采样
 抗锯齿
 /  /  4×MSAA
 纹理过滤模式  三线性过滤  三线性过滤  16倍各向
 异性过滤
 大曲面
 细分系数
 6  10  15
 阴影贴图大小  低(大1024×1024)  中(大2048×2048)  高(大4096×4096)
 阴影投射数  低(3,平行光源)  中(4,平行光源)  高(5,平行光源)
 表面阴影
 采样数
 8  16  16
 体积光照质量  低  中  中
 环境光
 遮蔽质量
 低(采样模式3×4)  中(采样模式4×5)  高(采样模式5×6)
 景深质量
 低(焦外虚化纹理大
 小16×16,虚化分辨
 率衰减增加33%)
 中(焦外虚化纹
 理大小24×24)
 高(焦外虚化纹
 理大小32×32,
 虚化分辨率衰
 减补偿33%)

全面进入DirectX 11《3DMark 11》渲染技术揭秘

作为一款构建于DirectX 11之上的测试软件,在《3DMark 11》中Furmark应用了大量DirectX 11技术。除了我们介绍过多次、耳熟能详的曲面细分、多线程处理等技术外,在画面后期效果处理上,3DMark 11还大范围应用了景深、bloom等效果。接下来,就让我们来了解一下《3DMark 11》强大的渲染引擎。

多线程技术是标配

DirectX 11中引入的多线程技术能很好地对多核心处理器进行优化,让渲染任务尽可能平均地分摊在各处理器上。也正是由于多线程技术的采用,《3DMark 11》中的渲染工作任务将会在每个线程级别上实现有效率的分配。

在好的情况下,每个线程都会被赋予基本等量的工作任务。比如在渲染一帧画面时,一般会包含诸如计算变换矩阵、可见性筛选、Shader相关参数计算等任务,这些复杂的任务都会被均分在多个线程内执行。除此之外,当一个线程结束了自己的任务后,还会自动执行在线程命令列表中记录的指令,保证系统效率大化。

在硬件优化方面,《3DMark 11》的多线程模型基于DirectX 11的设备环境和命令表,并分为两个部分进行操作:在图形测试中,计算引擎的每一个线程,可以对应一个可用的物理核心;在物理和综合测试中,计算引擎的每一个线程对应一个逻辑核心。这就意味着拥有超线程等技术的处理器可以很好地在《3DMark 11》的物理和综合测试中发挥作用。

曲面细分成重头

曲面细分技术是DirectX 11的重大改进,它将给模型的精细程度带来前所未有的变化。在《3DMark 11》中,一共使用了两种曲面细分:基于置换贴图(Displacement map)的细节曲面细分(Detail tessellation),以及采用可选置换贴图(Displacement map) 的方氏曲面细分( Phong tessellation)。它们的差异在于:在细节曲面细分当中,增加的顶点将直接在一张置换贴图上生成,带来更柔的几何法线。而在方氏曲面细分当中,顶点在置换操作之前,就已经在一个近似曲面上生成。该曲面由系统根据三角形顶点的位置和法线信息算出,从而使得物体边缘部分更为圆滑。同时,方氏曲面细分可以降低对CPU和PCI-E数据传输的压力,提高显卡的工作效率。

《3DMark 11》在很多场景都使用了曲面细分,但曲面细分负载并不高,高细分系数也只有15级。

另外,《3DMark 11》的曲面细分特效并非固定和一成不变的,在设计中,曲面细分系数会根据情况自动调整以节约资源。比如,《3DMark 11》中的曲面细分系数会根据每一个三角形投影在屏幕空间里的距离计算来自动确定。这就是说,远离视角的物体将使用低级别的曲面细分甚至关闭曲面细分,而接近视角的物体或者重要物体,将使用高级别的曲面细分。如果视角被遮挡,在执行曲面细分技术之前输入的三角形和顶点法线数据会被直接抛弃,不予处理,这样就大大减少了无用曲面细分从而浪费资源的情况。

阴影质量方面,在《3DMark 11》中对画质产生直接影响的阴影贴图也和曲面细分系数相关。简单来说,某处的曲面细分系数越高,阴影贴图的质量也就越高。这种自动调节设置的设计,能够满足各种不同曲面细分条件下的阴影质量要求,也很好地平衡了画质和资源的情况,是一种相当智能的设计。

在曲面细分性能压力程度上,《3DMark 11》并不像之前几款测试软件如《天堂2》那样,开启了等级极高的曲面细分负载计算。在《3DMark 11》中,高的曲面细分系数也仅仅为15。从实际产品来看,NVIDIA的显卡由于多形体引擎被绑定在SM中,因此具备很强的曲面细分运算性能。而AMD则只有1~2个曲面细分引擎(新的Radeon HD 6900系列显卡也只有2个曲面细分引擎),因此在高曲面细分系数下的表现要比NVIDIA同档次产品差。相比NVIDIA对曲面细分的着力宣传而言,AMD认为曲面细分只是DirectX 11的一部分,不能代表新技术的全部。此次《3DMark 11》中对曲面细分的态度显然和AMD的看法相近,这也说明Furmark认为未来游戏将不会使用过高的曲面细分系数,或者目前的曲面细分系数已经可以很好地展示设计者的创意和想法,无需特别看重。

体积光照更真实

《3DMark 11》中的光照渲染采用了延迟执行方式。在这种计算方式中,先得到的是渲染对象的几何属性,接着软件会根据目标的深度值和法线缓冲渲染出环境光遮蔽、反射、散射、深度信息等,终的视觉效果会综合所有因素来汇总计算。同时,在光线计算中,《3DMark 11》为那些没有受到阴影遮蔽影响的点光源启用两个绘制调用,其中一个绘制调用会处理那些不会和视角发生互动的点光源;而另一个绘制调用则相反,它主要用于处理那些能够和视角发生互动的点光源。对一些定向光源来说,《3DMark 11》也使用了一个绘制调用,并且会根据光照照射的渐进来生成阴影,这样会让终的阴影处理效果更为柔和。

而在玩家颇为关心的表面光照和体积光照上,《3DMark 11》的处理也相当出色。在《3DMark 11》中,表面光照模型由漫反射率模型和镜面高光反射率模型结合而成,并考虑了环境光衰减的因素。体积光照的处理则要复杂一些,它模拟了朝向观察者的一束散射光线通过介质传导到观察者眼中的情况。这种模拟利用了一个专门的体积光线投射模型,并相应参考了光线散射和光线衰减。在实际计算中,噪声函数可以调节体积光照的光线密度。每一帧的体积光线需要两个纹理数组,分别储存适合光线密度预渲染数据,以及基于预计算密度的累积透射比数据。这两个纹理数组随后被采样计算并得到体积光照的相关信息。终,在多个影响因素的共同计算下,《3DMark 11》就可以对任何角度的体积光照进行计算,并取得出色的计算效果。

景深处理不可少

景深是体现3D画面立体感的关键,为了得到一个漂亮的景深效果,Furmark特别通过以下七步运算对《3DMark 11》的景深效果进行了处理:


无处不在的体积光照,是《3DMark 11》的重要应用。

1.首先,为屏幕上每一个像素计算模糊半径,并存储在一个全分辨率DXGI_FORMAT_R16_FLOAT纹理中;

2.1/2分辨率和1/4分辨率的景深纹理由半径纹理和原始光照纹理得到;

3.判断像素是否超出焦点清晰区域,如果是,则将其纳入缓冲区;

4.缓冲区中的数据将被几何着色器处理成六边形虚化的效果;

5.重复步骤3和4,并生成面向不同虚化半径的、全分辨率,1/2分辨率,1/4分辨率的图像数据;

6.各个小区域里的纹理数据终会汇集起来进行统一处理;

7.这些汇集的虚化图像将会和原始光照交互合成,终就能得到处理完成的景深场景。

从《3DMark 11》的实际效果来看,景深效果还是得到了很大的体现,但效果还显得颇为生硬,焦外虚化扩散效果也不够理想。

《3DMark 11》所有图形测试场景都应用了景深技术,可见Furmark认为景深技术将在未来游戏中得到普遍应用。

这可能和它采用的处理方法有关,《3DMark 11》在景深处理上使用了几何着色器,而我们看到的AMD的景深处理演示中,则采用了DirectX 11的DirectCompute。不过目前还没有太多的信息来确定这两种方法的具体差异,但就从景深效果来看,《3DMark 11》的景深效果是不够令人满意的。

两大特效助画质

Bloom效果是类似于HDR的一种加强光线动态范围的计算方法。不过它和真正的HDR相比还有很大差距,但由于其计算要求低,视觉效果也很不错,因此被游戏和测试软件广泛使用。在《3DMark 11》中,Bloom效果通过使用快速傅里叶变换,将光照转换为频率域,并应用Bloom滤镜处理、DirectCompute计算得到。另外,在《3DMark 11》中出现了大量的镜头反射效果,这种效果在真正的单反相机或者视频拍摄中被称之为“鬼影”或者“耀斑”,有些时候需要尽可能避免。但3DMark 11为了加强真实性,还是将其纳入画面效果中。镜头反射效果也是利用滤镜处理,同样需要DirectCompute执行计算。

简洁快速 《3DMark 11》测试项目简介

和之前的多场景、长时间测试不同,《3DMark 11》的测试场景只有6个,测试时间和测试速度都相当快。这6个测试场景又按不同的画质和计算要求划分为4个图形测试、1个物理测试以及1个综合测试。

其中在物理测试里,与之前《3DMark Vantage》采用NVIDIA PhysX物理引擎的做法不同,《3DMark 11》采用了Bullet开源物理C++库作为基本物理引擎。显然这样的做法极大降低了软件本身的硬件倾向性,令软件本身更加公平。对于每一个测试场景的详细介绍和和场景画面,大家可以参看本期彩页部分的《悲剧,无人达标!——笔记本电脑DirectX 11性能专项测试》

复杂组合《3DMark 11》测试成绩计算分

《3DMark 11》的测试成绩还是基于每秒钟帧数。但是做出了一定处理,并包含调节参数。从Furmark公布的数据来看,《3DMark 11》的成绩分为图形测试、物理测试和综合测试三个部分,后的总成绩则是由这三项成绩以及测试权重数值加权计算后得出。


图形测试成绩计算公式

其中图形测试成绩的计算因子由图形度量常数(Cgraphics)和四个图形测试的帧数(Fgt)组成,其计算公式如上图所示。而物理测试的成绩则是由物理度量常数(Cphysics)和物理测试帧数相乘所得。综合测试的计算方法与物理测试类似,结果是综合度量常数与综合测试帧数的乘积。

总分计算的方法则稍显复杂。《3DMark 11》除了在之前的分项计算中使用了度量常数来计算加权值外,在总分计算上,《3DMark 11》也使用了多个加权值。其中包含了图形、物理以及综合测试三个加权值。在不同等级的测试中,加权值的数值也不尽相同。

不同等级的测试,《3DMark 11》所侧重的测试点也会有所不同。如上图所示,W数据就是综合分数计算的加权值。可看出,越靠近极限测试,图形测试成绩所占比重越大,而性能与入门级测试中的物理计算比重则会适当加强。终,《3DMark 11》的总分会由3个项目加权值、3个项目测试成绩,通过如下图所示的公式得出。


由6个因子构成的总分计算公式

更加独立 《3DMark 11》有望成为新一代标准

与之前的3DMark相比,此次《3DMark 11》还有其它一些进步,如首次支持多国语言,除英语之外还包括德语、简体中文、繁体中文、芬兰语,看来Futuremark对中国市场也给予很大关注。另外,《3DMark 11》也完美支持64位操作系统,安装包包含32位/64位程序,安装时会自动选择,用户不必另外下载64位。

不过我们认为,《3DMark 11》大的进步不仅在于采用了新的图形技术,还在于相对于《3DMark Vantage》来说更加独立。它并没有和之前预想的那样,在测试设定上偏向某些硬件厂商。它在曲面细分等级、物理引擎应用方面的态度,都说明Furmark立志于将其硬件倾向性降到低,从而得出有利于游戏玩家和未来技术发展的测试。

纵观3DMark的发展历程,我们可以看到它也曾有对技术把握的失误,也曾有中立性方面的一些争议,比如早期的《3DMark 2003》驱动优化事件、以及《3DMark Vantage》在物理引擎上的选择等.但显然Furmark已经从这些纷争中走出,《3DMark 11》带给我们更为全面的技术和平衡的考察,所受“外力”的影响已经降低到低。

从另一个角度来看,《3DMark 11》传统意义上的角色只是一个裁判,它只能判断当前产品的实力如何。但这次《3DMark 11》诞生后,一些业内人士也猜测,Furmark是否将立志于把3DMark打造成为一种标准?虽然Furmark目前并没有推动3D API发展和技术进化的足够实力,但对技术如何应用、是否符合未来发展,Furmark已经初具影响力——比如本次《3DMark 11》在曲面细分上的选择就影响了游戏和厂商,甚至玩家的态度。当然,现在做这些猜测还为时尚早,或许等到下一代3DMark发布后,我们再回顾历史、观察动态,才能更清晰地看到图形技术和3DMark的未来。

MC特约评论员 王海涛(盈通数码总经理特别助理)

讨论《3DMark 11》是一件很有意思的事情,在发布之前,由于NVIDIA新产品超强的曲面细分能力,因此一部分“N饭”曾经寄以厚望,希望《3DMark 11》能够证明NVIDIA在显卡发展上的影响力,但终看到的《3DMark 11》并未有过重倾向性。实际上3DMARK并不是NVIDIA或者AMD用来攻击竞争对手的工具,它的真正作用在于给用户提供一个具备实用意义的指导指标,让未来可能遇到的计算需求和计算压力出现在用户的平台上,指导用户根据需求选择产品。作为专业的显卡厂商,我们也对《3DMark 11》相当重视,一发布就购买了若干套顶级的专业版用于全面衡量显卡的性能。在未来DirectX 11软件和硬件逐渐成熟后,大量的测试都会转移到《3DMark 11》上来,我们厂商也将利用《3DMark 11》和游戏测试作为性能评估参考,以及显卡稳定性测试软件,从而为玩家带来更多更优秀的显卡产品。

分享到:

用户评论

共有评论(2)

  • 2011.03.23 18:34
    2楼

    3D MARK11测得不准的就是HD6950和GTX560Ti,分数上6950完胜,游戏上560完胜

    (0) (0) 回复
  • 2011.02.08 13:32
    1楼

    不错的文章

    (0) (0) 回复

用户名:

密码: