国产显卡的春天来了!摩尔线程MTT S80深入体验:短短2年创造奇迹
一、摩尔线程MTT S80显卡介绍
国内的新兴GPU厂商摩尔线程在今年3月份推出了第一款国产GPU“苏堤”。
时隔七个月,摩尔线程带来了第二款多功能GPU“春晓,以及基于这款GPU打造的MTT S80游戏显卡。
它内置图形渲染引擎、多媒体引擎、AI计算加速,以及物理仿真与科学计算引擎,以满足更加广泛和不同平台的多元算力需求 ,是一个全能型的GPU,并且这是业内首款支持PCI-E 5.0的显卡。
今天,我们就来体验一下这款用国产GPU打造的MTT S80游戏显卡。
从公司的官方介绍得知,摩尔线程成立于2020年10月,相当年轻,但他们的核心成员均来自NVIDIA,以及微软、Intel和AMD等科技公司的技术人员。
所以这是一支“覆盖GPU研发设计、生产制造、市场销售、服务支持等完整架构的成熟团队”,并且去年11月宣布了20亿元的A轮融资。
MTT S80是摩尔线程基于“春晓”GPU打造的游戏显卡,这是业界首款配备PCIe 5.0接口的同类产品。
GPU频率为1.8GHz,配备256bit/16GB的GDDR6显存,显存传输速率14Gbps,显存带宽为448 GB/s;配置了一个8Pin外接供电接口。
“春晓”GPU采用7nm工艺生产,集成220亿个晶体管,拥有4096个可编程MUSA核心和128个专用张量计算核心,内置MUSA架构通用计算核心以及张量计算核心,可以支持FP32、FP16和INT8等计算精度,不像其他厂商那样在游戏显卡上阉割半精度浮点能力 ,不仅为游戏玩家提供强大的的3D渲染能力,还可以为学生和研究人员等提供在人工智能、通用计算和多媒体处理等方面的完整GPU能力。
摩尔线程表示,新款GPU在1.8GHz的主频下,能够提供14.4TFLOPS的单精度浮点算力,图形渲染能力方面较“春晓”平均提升3倍;编码能力提升4倍,解码能力提升2倍;AI计算加速平均提升4倍,物理仿真计算性能提升2.5倍。此外,摩尔线程还引入了新技术支持窄带高清,节约30%以上的带宽。
除了基础的图形图像渲染和视频编解码功能之外,MTT S80还能够提供完整的AI训练和推理、通用计算、GPU虚拟化、安卓容器云加速等功能。
“春晓”GPU里面的128个张量计算核心,对摩尔线程自研的TensorX推理引擎提供了完整支持,使其可以在AI和通用计算等应用中展现出强大性能。
实际应用当中,MTT S80可支持PyTorch、TensorFlow、百度飞桨(PaddlePaddle)等多种主流深度学习框架,并实现了对数十种深度学习算法的加速。
MTT S80显卡提供了三个DisplayPort 1.4a接口和一个HDMI 2.1接口,支持8K@30Hz视频或1080P@360Hz高刷新率的显示输出。
内置的MUSA智能多媒体引擎2.0能够提供AV1、H.265、H.264、VP9等主流编码格式的硬件编码、解码功能,为视频编辑、视频直播、多人视频会议场景提供更多并行路数、更高分辨率、更高帧率的硬件编码能力,可以极大的节省CPU的负载。
凭借MTT S80,让摩尔线程成为国内首家支持Windows环境和DirectX图形接口的GPU公司,驱动程序里已内置MUSA DirectX Driver模块,并完成对数十款主流游戏的适配,同时还对Vulkan、OpenGL、OpenGL ES等主流图形接口提供支持。
摩尔线程MTT S80显卡介绍
摩尔线程MTT S80的外形识别度挺高的,外观追求极简设计,装饰甚少。
显卡上两个8cm的风扇夹着中间一把小一点的7cm风扇,采用11叶高风量叶片,支持智能调速,风扇中央的三角形标志就是摩尔线程的Logo。
散热器的整流罩是磨砂面的,出风口在上下两侧,整卡尺寸为286 x 111 x 49 mm,以显卡的标准来说的话不算大。
背面则有金属背板加固防止显卡弯曲,并且提供一定的散热能力,而且显卡尾巴是有开孔的,这部分也没有PCB,能让散热器的第三吧风扇风流能直接吹透散热鳍片,使其散热效能得到充分的体现,进一步降低显卡的工作温度。
显卡提供了三个DisplayPort 1.4a接口和一个HDMI 2.1接口,比较有趣的是显卡的挡板是完全封死的,完全不透风,在近些年的显卡设计中比较少见,只有AMD公版卡会这样做。
不过显卡散热鳍片布置是纵向而不是横向的,即使开孔也只会有少量的风从这个位置出来,对散热提升有限,而且这样设计有助于提高挡板强度,从这个角度来看的话,显卡厚度比双槽略微多一点点。
供电口位于显卡尾部,这个口不是PCIe的8pin口,而是EPS 12V 8pin,也就是CPU用的8pin口,理论上可以提供300W的电力,比常规的PCIe 8pin口高一倍,带动TGP只有255W的MTT S80完全不是问题。
不过由于预留给卡扣的空间不大,那种4+4的CPU供电口是插不进去的, 原生的8pin线可以,当然有些电源可能会不够CPU供电线用,所以摩尔线程配了一根转接线,可以用两个PCI-E 8pin口来为这块显卡供电。
二、显卡拆解:PCB精悍、供电散热强悍
拆开显卡后,我们发现显卡的PCB其实只有整卡长度的一半多一点, 而供电接口是由固定在背板的延长线延伸至显卡尾部的。
供电布置也很有意思,GPU核心供电是显卡顶部中央4相加显卡右下角那两相,显存供电则是PCB顶部两侧各一相,这6+2相供电全部使用Alpha & Omega的AOZ5311NQI,最大持续电流为55A,10毫秒内峰值电流可达80A,10微秒内峰值电流则达到120A。
“春晓”GPU的核心代号为SD102AA-500,核心面积还蛮大的,四周围绕着8颗三星的GDDR6显存,组成256bit/16GB的规格,显存型号是K4ZAF325BM-HC16,这其实是16Gbps的显存,现在只跑在14Gbps,未来开放超频的话显存是有一定提升空间的。
MTT S80显卡所用的散热器规格还是很大的,和GPU接触的是散热器的纯铜底座,而且散热器也有照顾到显存与供电MOS,能有效降低这些元件的工作温度,让它们能稳定的工作。
散热器用了4根6mm直径热管,连通大量镀镍铝制鳍片,配合两个8cm风扇和一个7cm风扇,对于一张TBP只有255W的显卡来说已经是非常高的规格了。
三、理论性能测试
这次之所以说是体验而不是评测,是因为目前他们提供的显卡驱动还不算完善。虽然他们用两年多的时间就把GPU和显卡做出来确实是非常强的一支团队,但显卡驱动的编写与游戏引擎的适配还需要有很长一段路要走,所以我们今天只是跑一些能跑的测试项目,而传统显卡测试的3DMark跑分和游戏测试这次大家基本看不到了。
测试平台基于酷睿i7-12700K处理器打造,配置总容量为16GB(8GB*2)的DDR4-3600内存,主板是配套销售的华硕TUF GAMING B660M-PLUS D4,由于测试项目需要分别在Windows 10和Ubuntu两个系统下运行,所以准备了两套系统。
MTT S80显卡的中央风扇以及背板开孔处是有氛围灯的,颜色是摩尔线程的橙色,为显卡添加信仰。
先来看看在Ubuntu系统跑的测试。
摩尔线程MTT S80显卡的显存带宽我们测出来有370.5GB/s,高于RTX 3060,毕竟是256bit显存位宽的对192bit,显存频率虽然低一点,但总带宽上还是有优势的。
MTT S80显卡的单精度浮点算力有13.9TFLOPS,比RTX 3060要高一些,可见这GPU的定位确实是直指GA106的。
我们使用OCL Bandwidth Test来测试了PCI-E接口的带宽,采用PCI-E 5.0 x16的MTT S80显卡下行带宽28.7GB/s,上行带宽打到42.8GB/s,比还是用PCI-E 4.0 x16的RTX 3060高得多。
上面三个都是OpenGL的测试,目前来说由于驱动的关系,MTT S80在这些项目的性能表现还不尽人意,部分测试和RTX 3060差距有点大。
然后就是大家比较熟悉的Windows 10系统。
从3DMark06的纹理填充测试来看,MTT S80在单纹理填充性能上是要远高于RTX 3060的,但在多纹理填充性能上则比RTX 3060略低一些,可以看得出这两个GPU的侧重点不一样。
但实际跑分结果就没有这么好看了,还有很大提升空间,4K分辨率下差距略微少一点,这也可以看得出摩尔线程现在的显卡驱动优化还没到位,显卡的性能没有得到充分发挥。
我们也使用Fillrate Tester测试了显卡的纹理填充性能,数值上和3DMark06有一定出入,但趋势是一样的,MTT S80的纹理填充率远高于RTX 3060。
MTT S80可以运行Unigine Valley v1.0测试的DX9和DX11模式,所以我们都跑了,但帧率大幅低于RTX 3060,摩尔线程的驱动开发人员来说,还有许多工作要干。
四、实际游戏体验
目前摩尔线程公布出来MTT 80显卡已适配的包括:《英雄联盟》、《穿越火线》、《QQ飞车》、《QQ炫舞》、《梦幻西游》、《起凡群雄逐鹿》、《劲舞团》、《跑跑卡丁车》、《暗黑破坏神III》32bit、《终极街霸IV》、《围攻》、《我的世界》以及《极品飞车:热力追踪III》,还有超过60款可运行的游戏。
我们在其中挑选了几款跑了下。
《英雄联盟》运行正常,在1080p分辨率最高设置下能平均帧跑到149fps,在4K分辨率下能跑到128fps,很明显在1080p下显卡的性能发挥不完全。
《穿越火线》运行也正常,在最高设置下1080p的平均帧率是182fps,4K分辨率下是165fps,流畅度有保障。
《QQ飞车》由于游戏锁帧,所以在1080p和4K下都是40fps满帧率运行。
《街霸IV》在最高设置下1080p的平均帧率是104pfs,4K分辨率则是87fps,这游戏本身是锁60fps的,所以MTT S80可以在4K最高画质下提供这游戏最流畅的游戏体验。
《最终幻想14:天堂之剑》不是已适配游戏,但在可运行游戏列表内,我们跑了下它的Benchmark,它DX9和DX11模式都能跑,但是有贴图错误和颜色渲染错误,整个画面非常奇怪,1080p的帧数是47.2fps,4K则是43.1fps。
整体来看,4K分辨率下摩尔线程MTT 80显卡有更好的发挥,而1080p分辨率并不能很好的体现显卡的性能。
五、视频编码解码测试
上面的视频编码转码测试都是在Ubuntu系统里面跑的,由于测试脚本使用的编码器是摩尔线程专用的,所以没有对比。
我们用MTT S80并行处理50路的视频,转码则是20路,每项测试的总fps都很高,显卡内置的媒体引擎性能非常强。
在Windows系统里面我们可以用自带的“电影与电视”播放一个8K 30fps的HEVC 8bit编码视频,从任务管理器来看摩尔线程MTT 80显卡的视频解码器还没满载,对于显卡来说还是很轻松的,不过8K@30Hz也是这款显卡的解码上限,再高帧率的话就不行了。
目前Windows系统已经适配显卡的H.264、H.265、VP9解码,AV1目前仅在Linux系统上支持,Windows系统还有待驱动更新。
六、温度与功耗测试
显卡功耗测试使用的是NVIDIA提供的PCAT工具,可以精确测量显卡PCIe与外接电源接口的实际功率。
但目前MTT S80显卡 在WIndows下跑不了Furmark,目前观测到GPU负载最高的是Unigine Valley,但GPU负载也就90%左右。
此外,MTT S80暂时还没提供功耗控制功能,所以目前待机时GPU频率降不下去,导致待机功耗非常高。
此功能还在测试中,未来会增加到显卡上,实现不同应用场景下的功耗状态切换。
负载时摩尔线程MTT S80的平均功耗是210.5W,而峰值功耗240.4W,待机时的平均功耗则是114.6W, 这待机是绝对有问题的,负载时显卡温度不过57℃,温度非常低,当然此时GPU没有满载,而待机温度则是44℃。
七、兼容性有待提升未来可期
摩尔线程MTT 80显卡的硬件是没有问题的,从理论测试来看,显卡的像素填充率和纹理填充率远高于RTX 3060,单精度浮点算力和显存带宽也比RTX 3060更高,也是目前唯一的PCIe 5.0显卡,可以提供远超现在主流显卡的接口带宽,显卡的多媒体引擎现在也可以提供最高8K 30fps视频解码,“春晓”GPU的实力确实过硬。
但现在显卡的驱动还不成熟,整体还有待优化,实际游戏中的表现和中高端GPU还有差距,现在的驱动还没发挥出GPU一半的实力,所以驱动方面的改进是目前摩尔线程首要工作,当然更重要的是对游戏的适配性。
从我们的测试来看,MTT 80对DX9的游戏基本都能运行,但不在适配名单内的游戏运行起来可能会有贴图错误,而DX10、DX11、DX12的游戏目前问题比较多,所以显卡驱动目前最优先的是游戏的兼容性。
目前显卡已经支持超过60款游戏的运行,随着未来驱动的改善,游戏支持数量会增加得与来越快。
显卡的多媒体引擎是支持持AV1、H.265、H.264等主流格式的编码或解码,最高支持到8K分辨率的视频,现在已经兼容主流视频应用和浏览器调用MTT S80进行硬件解码,我们实际测试它可以流畅播放8K@30Hz的H.265视频。
当然了编码方面现在还得软件适配才行,现在摩尔线程已经在和剪映合作,估计很快就会提供对应的适配。
“春晓”GPU内是有128个张量计算核心的,可应用在AI训练方面,比如摩尔线程未来会上线MT马良AIGC平台。
它是一个AI作画工具,在发布会上他们也实际展示过,可支持中英文代码生成图片、简笔画创作、图片超分等功能,创作者可以根据自己的需求生成插画,是一个非常方便的AI实际应用,未来还会有更多AI应用会适配摩尔线程的MUSA架构。
总的来说,摩尔线程MTT 80硬实力是有的,两年就做出这种性能的GPU出来摩尔线程的努力和实力值得肯定,但目前驱动还远没到理想状态,还有很大提升空间,可以期待它未来驱动优化好后的表现。