距2月7日正式发布Threadripper3990X已经过去了一段时间,因为某些原因,我们拿到U的时间稍微晚了一些,但事不宜迟,马上开测吧。
前排提示:至发稿时可能主板与系统厂商会推出优化版本的BIOS或更新补丁,处理器的成绩很有可能还会有所提高。
▼Threadripper3990X:让你见识什么叫真正的“发烧级CPU”
对比一下三款发烧级平台旗舰的规格、再加上与之规格非常相似的EPYC7742。
CPU参数点评:
从规格上看,Threadripper3990X与EPYC7742比较相似,同样基于7nmZEN2架构,同样为64核128线程,三缓均为256MB,都支持PCIeGen4。
而不同的地方,就是通道(包括PCIe和内存)的数量,内存容量上限与基础频率等地方了。至于为什么做这样的变动,这就关乎到两种处理器面对的应用场景需求了。
简单讲讲,服务器通常需要面对大量的并行数据处理情景,比如多虚拟机同时运作,四通道的内存带宽就可能不够数量众多的虚拟机同时使用,PCIe通道数量同理。
同时,AMD要区分两款处理器的定位,64核不能动(因为要进一步拉大AMD在HEDT平台中的优势),频率也要提高(服务器低频是为了稳定性,发烧级平台就可以将频率提高获得更好性能了),就只能动一下上述大多数消费者都不会用到的地方了。
3990X的CCD比3970X多了4个,每个CCD对应8个核心,之前EPYCROME的官方开盖图就展示过,里面有9片DIE,真是佩服这种封装方式。
说回大家关心的价格,29999元,看着很多钱,不过仔细算一笔账其实还不算很贵。
EPYC7742:64核,48529元,每个核心758元;Threadripper3990X:64核,29999元,每个核心468元。
XeonPlatinum8280:28核,10009美元,每个核心2497元;i9-10980XE:18核,12999元,每个核心722元。
这样看来AMD这边的每个核心性价比要比Intel高很多。
说实话,这回AMD真的有点要抹杀对手的感觉了,核心数量比Intel多,每个核心的价格卖得还便宜(由于没有相同核心的产品来对比,所以没法断定Intel的64核会卖多少)。甚至有可能会升级成理财产品,毕竟市面上就这一家卖64核,万一没货了还会给人炒高价格。
说了一堆,也是时候上菜了。
评测项目简介
一、传统软件性能测试:本项综合传统跑分软件与一些对内存容量不敏感的软件进行对比,如CPU-Z,CineBenchR15、R20等。该项会使用幻光戟与皇家戟内存搭建四通道,共32GB,颗粒均为三星B-Die,频率时序3200MHzC14-14-14-34。
二、生产力性能测试:本次测试加入PR、AE与AME导出视频速度的对比。该项会将四种内存混搭凑成96GB总容量,为确保兼容性,频率时序为默认2133MHzC15-15-15-36。
三、发热与功耗测试:TDP280W?不存在的,开PBO解锁高频才是这块CPU的正确打开方式,我们来看看64核能不能让电表倒转?
四、娱乐测试环节:针对这款稀有物种,我们也想到了各种办法去折腾它,榨干它的性能。
下一页会详细讲解本次的测试平台配置,想看数据的朋友可以直接跳到第三页开始。
测试前的平台介绍
不用测都可以猜到,Threadripper3990X单靠核心数就已经可以手撕绝大部分的处理器,包括英特尔的服务器CPU至强铂金,所以理论上我们要拿出两边阵营最强的处理器来进行对比。
但比较遗憾的是,我们弄不到双路C621和两块至强8280,也搞不到EPYC7742(买不起...)所以我们只能选择两边阵营均比较高端的发烧级处理器进行对比,大家都是HEDT平台处理器的最高端型号,应该还是有代表性的。另外我们还会加上Ryzen53500X来代表主流处理器的水平,看看这些很多人都买不起的怪物与平时用的CPU差距有多大。
说配置之前,也介绍一下我们的测试系统。
最近看了很多新闻,外媒Anandtech在测试Threadripper3990X时出现了Windows10系统下CPU规格识别错误的问题,大致意思就是家用Windows10系统(Windows10Pro或更低版本)不能将Threadripper3990X识别为完整的一颗CPU,而会将它分成两块独立的64线程CPU。AMD建议是,安装Windows10ProWorkstation或者Windows10Enterprise。
我们也遵循建议安装了Windows10ProWorkstation进行测试,在任务管理器中,系统也成功识别出为1个处理器而不是双路。
通过上面任务管理器的逻辑线程数也可以看到,ProWorkstation是可以支持这款64核怪物的,但首要条件是需要安装上最新版本与补丁,我们的补丁也是当天最新的版本了。
讲回配置,平台主板这次选用了技嘉TRX40AORUSXTREME,为该品牌最强的TRX40芯片组主板。
供电方案升级,16相英飞凌直出式供电,每相提供90A的负载能力,足以应付瞬时负载极高产生大量功耗的的Threadripper3990X。
散热部分装载了高密度的散热鳍片,提供更大的散热面积,加上8mm热管为供电模组散热,热管连接了I/O装甲与供电模块,提高了散热鳍片的利用率,如果它压制Threadripper3990X都有问题,那可能就没有主板能驾驭这颗U了。
随板附送的AICSSD扩展卡
扩展卡的设计很有质感,体现了技嘉最高端主板的诚意,整个金属片用料厚实,即使4个PCIe4.0SSD同时运行,也能有效地把热量带走。
简单拆解,内置4个NVMeM.2接口,最高支持4块PCIeGen4SSD组建阵列。可惜目前手上没有4片高端的NVMeSSD,之后如果能凑出来的话,一定要Raid一个试试。
电源选用了鑫谷昆仑的1080W,本应打算用1600W的电源,奈何手上没有这么高功率的电源。在之前某韩国博主评测这块CPU时瞬时功耗曾达到800W,所以用1080W应该没什么问题。
内存则是芝奇的两根幻光戟与两根皇家戟为主。
超频三凌镜GI-CX360一体式水冷散热器
它应该是评测室里比较好的一体式水冷了,能支持TDP350W的处理器,就是说满载的情况下可以压制更高频率的Threadripper3990X(默认全核2.9GHz,TDP是280W)。
我们想过拆了MOD主机上的Bykski分体360冷排来用,但因为冷头没有AMD扣具,且拆装要重新注水比较麻烦,就放弃这个想法了。
以下为整套测试的系统设置:
Intel与AMD阵营,电压设置为Auto,关闭防掉压。
Intel的睿频,AMD的CorePerformanceBoost默认自动。AMD的处理器打开PBO选项,PackagePowerLimitControl调整为1000W,Intel的处理器开放功耗墙。
常规测试项目,使用皇家戟与幻光戟组四通道,调整内存频率时序为3200MHzC14-14-14-34。
生产力测试项目,内存插满,频率默认2133MHz。
想详细看每项测试结果的可以看下一页,如果不想看啰嗦直接看结论可以跳到最后一页。
传统软件性能测试
理论性能测试会简单粗暴的通过跑分软件对比处理器之间的算力差距,不同处理器之间的单线程与多线程的性能差距都能通过该测试反馈出来。
为了让大家对这种超级多核怪兽的测试数据有更直观的理解,我们加入了一款AMD中端级别的处理器Ryzen53500X,请往下看吧。
CPU-Z
TR3990X的CPU-Z成绩继TR3970X之后,又创下了新的PConline评测室历史记录,将近三万分,是i9-10980XE的三倍!比TR3970X也要高出近一万分。
单线程分数,由于BOOST频率有4.3GHz,TR3990X的单线程跑分也比较高,有520分,已经接近高频游戏处理器的水准了。
CineBenchR15
跑CineBenchR15的时候,我感觉这不是在渲染,而是在双击打开一张图片:仅仅几秒钟的时间就已经跑完测试。
TR3990X以高达12775分的超高分数秒杀i9-10980XE,也是后者3倍的性能。
单线程方面,TR3990X也是略微落后于其余两款CPU,但基本上都是相近的水准了。
CineBenchR20
CineBenchR20的分数也同样震撼,十几秒就渲染完毕。
TR3990X在CineBenchR20中跑出了三万的高分,是i9-10980XE的三倍有多。
测试期间记录了各CPU的频率情况,核心数最少的Ryzen53500X的全核加速频率最高,其次就是Threadripper3970X,单核则是i9-10980XE拔下头筹。
因为CineBenchR20对Threadripper3990X来说,负载较小,在温度还没跑起来,就已经跑完测试,测得最低全核频率为3.75GHz,对于64核怪兽来说,这频率也很高了。
前三项测试的综合性能对比
小结:到这里为止,三项测试均可以吃满Threadripper3990X的多核心性能,性能表现符合预期情况。在面对较短时间的高负载,Threadripper3990X不会产生幅度太大的降频,所以可以很高效的跑完测试。
由于64核128线程确实是比软件系统超前了许多,很多软件都未能对128线程进行优化,也就会出现处理器利用率不高的情况,下面抽取了几款比较有代表性的软件。
X264FHDBenchmark
X264Benchmark不能跑满CPU所有核心,核心占用比较分散。
7-Zip基准测试(字典64MB)
7-Zip能识别128线程,但只能调用64个线程
7-Zip虽然能支持(识别)128线程,软件左下角也能认出64128T,但后面斜杠的线程数也反映出问题:只调用到64个线程,就算自己选择128线程也无济于事。
3DMarkTimeSpyExtreme
ULBenchmark之前有讲过,TimeSpyExtreme是能支持8核以上的处理器,最高到64线程(也就是128的一半)。
但实测了一下发现也只是发挥了64线程的性能。
小结:目前多核心处理器依然面对着软件多核优化差的问题,这种情况只能静待软件厂商进行适配优化,毕竟这款64核怪物推出得比较突然,软件厂商可能也在加班加点更新软件了。另一方面,这也许也要AMD主动去推进这一块的生态发展,毕竟超高线程处理器的市占率也不会很高,软件厂商自发的动力也许不会太强。
生产力性能测试
生产力测试会选取Adobe全家桶中的三款软件:PremierePro(以下简称PR)、AfterEffect(以下简称AE)与MediaEncoder(以下简称ME),使用4K与8K素材测试渲染导出速度。
上次借来测试的4根美光32GB内存还回去了,所以只能凑出4根8GB与4根16GB内存混插达到96GB总内存容量,为了稳定,频率默认2133MHz。
4K与8K素材是从REDDigital官网下载的样片,电影机买不起,样片还是能看看的。
PR导出
PR导出,几款处理器的占用率都比较低,Threadripper3990X与Threadripper3970X时长差不多。结论就是PR对多线程处理器的优化也是有限。
AE导出
AE导出,CPU占用率同样很低,这里Threadripper3990X反而不敌Threadripper3970X,i9-10980XE速度要慢不少。
ME导出PR工程
可以看到核心占用率依然不高,按25%占用率算,就是16个线程,所以有100多个线程是没能被利用上的。
用MediaEncoder导出PR序列与之前直接用PR导出的结果比较相近,两颗撕裂者强于i9。
ME导出AE序列
而导出AE序列,结果就变得非常离奇了,i9-10980XE导出8K的时间变成了三位数,Threadripper3990X反手秒了Threadripper3970X,多核的优势似乎又出现了,真是离奇。
小结:Adobe迷惑行为,吃不满核心就算了,用MediaEncoder还比AE慢了这么多,说它毒瘤不是没有原因的。
SPECworkstation3MediaandEntertainment测试
运行了SPECworkstation3中的部分测试,这几个MediaandEntertainment项目代表的是实时渲染能力,它对多核心多线程的优化很不错,所以3990X也一枝独秀,综合比10980XE强60%。
发热与功耗测试
该项会测试Prime95满载10分钟的功耗温度与待机功耗温度。
看着Threadripper3990X的满载功耗好像也没多高,才600W?你需要看看下面这张图。
测试开启的瞬间,会因为全核处于高频满载的情况,功耗会瞬间飙升至1000W,已经逼近我们电源的额定功率了。
然后随着温度的提高,频率略微下降然后稳定在600多瓦,所以全核满载的功耗还是挺惊人的,请使用3990X处理器的用户务必配一块供电优秀的主板,电源也建议1200W起步了,毕竟还要留一些给显卡。
关于超频:我就不太建议大家超频用了,除非是要用它来打破各种世界记录挑战极限的。64核的基础上,TR3990X的默认频率其实已经算是很高了。
温度方面则还是三代锐龙的老样子,95度撞墙然后降频。Threadripper3990X待机情况下频率降得比较低,在待机时还是比较凉快的。
这里也记录了全核烤机10分钟后处理器的频率,Threadripper3990X全核频率降至3.075GHz,比默认的2.9GHz要高一点,也说明我们首测用的技嘉TRX40AORUSXTREME主板性能和品质是真的很好了。
娱乐测试环节
我就想看看除了跑分与压力测试之外,怎样才能用满这颗处理器。
Chrome浏览器网页多开
Chrome浏览器有着强劲的插件扩展能力,使用便捷,但一直以来都被人诟病非常占资源,让人又爱又恨,简直是“毒瘤”一般的存在。
批处理命令可指定打开标签页的数量
测试中,仅仅打开100个网站(太平洋主页,B站等),均会出现绝大部分页面崩溃的情况,并不能确保正常使用,之后我们改用空白页测试。
打开1000个页面
打开1000个空白页压力很小,而且只有打开过程中会占用少许CPU资源,全部打开完毕后CPU几乎没有占用。
打开5000个页面
之后我们直接将数量加到5000个,这次连崩溃都懒得崩溃了,Chrome直接假死,等待10分钟后没有起色,估计是凉了。CPU占用2.6%,内存吃了8.6GB。
Chrome是不折不扣的内存杀手,开更多的页面只会吃掉更多的内存。至于CPU,只有动画与视频才能让它动一动,但实际情况是页面还没加载出动画,浏览器就崩掉了。
VMware虚拟机多开
虚拟机安装上Windows10Home64位版本,每台机分配2GB内存,2个CPU核心,全部打开Prime95烤机满载。
这里总共打开了24台虚拟机,全满载的情况下主机就只剩下36GB内存,但CPU占用还剩50%。
我想在没有用完CPU时,内存就先爆掉了。
娱乐大师
这应该是这次测试中最有意思的项目了……鲁大师竟然能完全吃满全部64核心/128线程。
快十年不用鲁大师了,我对鲁大师的分数早已没有概念。但我知道每次跑分都会出现无法击败的1%用户,即使我这次跑出了全排行榜第一的分数。
主机总分榜,依然排在第一名的位置,下面还有另一个兄弟也用Threadripper3990X跑了鲁大师,不过显示成了双路,估计也是出现了系统不能识别多核心的问题。
多开剪辑渲染软件
有网友想看8开PR,结果PR2020版已经不能在启动代码中加-m来多开了,这里就把AE,PR与AME同时渲染看看是什么效果。
相比之前单软件渲染,CPU的占用率有了提升,不过也只吃了50%,还剩下32个核心可以用,这怎么行?
最后,全部一起上……
之后我们加上了7-Zip压缩两个大文件夹并同时打开三个软件渲染,这次终于吃满CPU核心,占用率非常接近100%,不过都是给7-Zip吃掉的……
小结:真的要用满这颗CPU,对很多人来说都不可能,除非你是包办了所有后期工作的剪辑师或者是做大数据处理。但也同时说明,它的性能是非常富余的,即使未来软件继续升级,会占用更多的硬件资源,3990X给你预留了可能3-5年的升级空间。
PConline评测室总结
平时主力写文章,偶尔剪剪视频修修图,下班回家就臭打游戏的超大陆,真的想不出还有什么办法来榨干3990X的性能了。
CPU-Z、R15、R20三项软件都能完整运用上64核/128线程的优势,Threadripper3990X也与另外两款处理器拉开了很大的差距。
但在面对优化不太好的软件时,Threadripper即使只吃到64线程,也能发挥出相当于Threadripper3970X的性能。
它确实非常强,一般人用不完的核心数,以及不低的BOOST频率,无论干活还是玩游戏,它都没问题。
但我猜在座的各位,有很多人都不知道自己有没有多核心的使用需求,或者直接点,不知道多核心处理器能不能帮你赚更多的钱。
它更多的是面向专业用户的,就是自己的赚钱能力与电脑性能是相挂钩的。
▼抢先桌面端64核,意味着什么?
AMD抢先完成了桌面端64核心的成就,对个人用户、工作室或是企业用户都是一个非常大的利好消息。
对个人用户来说,AMD以64核自证,意味着它的技术能力已经到达一个新的巅峰,就会给人们留下一个好印象。反映至消费级市场,人们会更加愿意信赖AMD的产品,从而提高产品的声量与销量。
对专业的视频/媒体/实验等等的工作室来说,CPU强则意味着单位时间内能产出更多作品、计算出更多的数据,获得更多的收入。Threadripper系列的高性价比给很多资金不算充裕的工作室提供了新的选择。大型工作室也可以藉这款CPU放弃以前搭建渲染服务器的方案,人手配备一台64核主机,走到哪都是高性能渲染工作站。
而对于企业用户来说,根据上面AMD展示的KEYNOTE,单路3990X处理器的性能已经比对手双路至强8280要强,价格也低上许多,但可惜我们并没有实测过双路8280的性能,但这个结论应该是八九不离十的。
综合成本考虑,企业即使不满足Threadripper3990X的带宽通道数,他们也可以去选择“满血”的EPYC霄龙,EPYC7742只卖6950美元,比双路至强8280的两万美元便宜了不少。
今年台北电脑展,AMD会发布Zen2+的新一代处理器,号称将会继续提高IPC性能。不过我们可能只有在更新制程时才能看到核心数再翻倍了,毕竟现在的7nm还有很大的IPC提升空间,或许不用很久就能看到AMD锐龙频率赶上对手了?
▼你能用完它的64核心吗——
假如你对3990X有兴趣,花三万块,你能用它来干什么?能发挥出它几成的能力?
以下假设这些能回本的操作:
打游戏的,玩游戏用8个核就美滋滋了,结果拿这个U开了游戏工作室做代练,虚拟机多开,一屏幕控制200个小号,一个月把成本赚了回来;
跑代码的程序猿,本来8核要跑一个月,现在64核可能两三天就跑完,活做得多工资也高了;
做视频的,渲染时间缩短了十几倍,本来一周只能做两个视频,现在每天都能出一个视频,以量制胜。
但对于99.99%的吃瓜看热闹用户来说,应该都是用不完它的性能的,所以你们就来看热闹了。
这次测试没办法测完的SPECworkstation,就有一项是测试Python编译代码的,能比较科学的说明问题。
超大陆一大早回来就开着软件跑测试,中午吃完饭回来一看还没运行完,打开任务管理器发现就只吃了一个线程,顿时吐出一口老血。
等了半天终于跑完这项测试,结果下一项测试又出现了上面的情况,只用到了一半的线程。
一核有难,多核围观,在2020年这情况虽然有所改善,但软件的优化速度跟不上苏妈的堆核心速度。
比如我们上面测试到的Adobe剪辑导出视频的三个软件,少了一半核心的3970X在不少项目中都能打平3990X,换句话而言,对于很多视频剪辑领域的人来说,3970X已经够用了,而且更有性价比。
一句话,你有没有使用超多核心CPU的需求,取决于你的应用领域是否需要到这么多核心(能不能用到这么多核心)。
至于你知不知道你领域能不能用到这么多核心,我这里也无法明确给出一个参考标准,简单讲几句吧。
如果是好莱坞级别的大制作,那多核心是非常有必要的,经常高强度同时剪辑跟导出不同的片段,很容易就榨干它的性能。
如果是需要大量计算数据的情景,比如多线程编译代码,那它也是非常合适的选择。
除此之外,除深度学习之外的大数据处理也非常适合超多核心的CPU,多1个核就是实打实的生产力。
而像超大陆这种平民百姓,拿来跑个分,刷刷排行榜,已经非常知足了。
毫无疑问,AMDThreadRipper3990X,会是天梯图第一的存在,而且看势头很可能会是长期霸榜的存在...
在被32核的2990WX和3990X连续刷新性能认知之后,我甚至开始幻想128核的怪物了...