还要脸吗 驳“国产龙芯究竟水平如何?”(国产龙芯什么水平)
【PConline 资讯】事情缘由:昨天(4月6日),雷锋网发表了一篇名为《国产龙芯究竟水平如何?》的文章,随后被多家媒体转载后,引发了网友及舆论的诸多回应。这当中虽然也有理智的朋友看出了问题和端倪,但贬低和谩骂的声音依然占据了上风。当天,就有网友发帖驳斥了这篇文章的作者,并列举出了该文章的几个不实之处。
以下为帖子的整理(原帖略修正):
此文充满误导性和选择性的数据和误导性的解读。虽然这个文章可以让99.9%的一般人认为中国搞了这么多年就搞一个手机芯片都不如的垃圾出来。
首先,文章中几个基本的错误。
三个测试数据中唯一一个使用的是龙芯3b的成绩,如图:
测试项目是SPEC_INT,也就是整数通用计算性能。
龙芯3b频率1.2ghz,龙芯3b是一款256bit浮点,全速64位FPU并行设计的矢量计算CPU,主要面向科学计算和浮点计算的超算领域。而整数执行管线部分继承的是2008年设计的龙芯3A的部分。
问题来了,拿向量计算型的CPU的整数性能去和通用计算CPU去比?为什么跑SPEC只选整数部分故意不提SPEC_fp浮点计算部分的成绩?因为它列举的这些芯片SPEC_fp测试成绩连龙芯3b边都摸不到的原因吧?
再来看下这张图:
龙芯3b 1Ghz下实测122Gflops。它选取的对比芯片跑浮点什么成绩?i7 4770k 3.9ghz也就86.36Gflops,也就是说浮点性能i7 4770k同频率也只有龙芯3B-1500的18%,接近1/5。
用通用计算处理器去和一个设计就是跑浮点运算的向量处理器而且是使用8年前设计的整数执行管线的处理器去比通用处理性能,这就是编辑所想要的对比条件?用一个大家比较理解的一个比喻告诉大家这个测试的本质是什么?
这就好比拿一辆设计上是百吨级重载卡车去和大家平时用的私家车去比公路上的舒适型和加速性能一样,无厘头。
说完3B,我们再说3A。
龙芯3A是2010年正式进入投产的一款老芯片,GS464构架设计基本上2008年就完成的老构架。龙芯3A不是一款成功的产品,整数计算能力只能满足最基本的桌面应用要求。龙芯3A-1500才是龙芯3A家族的最新构架,GS464V构架,面向桌面应用和以后军队政府信息化应用的桌面级CPU。但周期不同指令类型整数管线执行效率提升2-3倍,部分指令性能提升5倍,2014年末已经在流片第一个版本阶段。
测试中使用大量龙芯3a SPEC_int 测试成绩,然后感叹一下:“那么在2015年的今天,他们的产品究竟达到了什么水平呢?”
用2008年前的构架来说2015年的水平?要点脸吧?
龙芯小组这些年期间把工作重心放在了众核并行构架和龙芯2B超算向CPU和龙芯2J军用加固CPU方面。新的面向桌面定位的龙芯3A1500也已经进入流片阶段。对照上面放出的成绩我们来估算一下龙芯3A的水平。
i7 965满载睿频3.46ghz,spec_int成绩184,按照1ghz性能也该是53.1。
龙芯3a工作频率是900mhz~1Ghz,就当样品是1ghz测试结果spec_int 25,整数性能周期效率是i7 965的1/2。
那么2014年末流片的龙芯3A-1500呢?根据大部分指令效率提升2~3倍的流片测试结果看:龙芯3A-1500 1Ghz spec_int的成绩应该是50~75之间。
这个成绩还很差么?啧啧。
应大家的要求,列一下现有的几款超算CPU的浮点计算能力:
Intel xeon phi 5110 60核 1011Gflop 225w 2013年 (intel的制造工艺是怪物 不过60核功率是225w 相当于3~4颗龙芯3b )
中科龙芯 龙芯2B-1500 8核 192GFlop 45~85w2013~2014
富士通 Sparc64 VIIIfx 8核心 128Gflops 功率?2009
IBM CELL BE 9核心 192Gflops 2007年发布 但是因为功耗太高 实际获得性能效率太低 cell项目已经死了
江南计算所 申威-1600 140Gflops 16核心 45~75w2011年
至于最后这张图,我只剩下呵呵了。
曙光已经在部署新一代基于龙芯3B家族的全国产CPU超算,当龙芯3B方案的超级计算机排名刷榜的时候,看看这个编辑还有没有脸来提手机芯片都不如?有本事编辑用高大上的手机芯片来超算排行刷榜吧。