NVIDIA, FUCK YOU !

-Linux创始人Linus

1、什么是NVIDIA TESLA M40

1.1、nVidia的产品线划分

nVidia目前主要有三条产品线,分别是用于普通桌面级的Geforce系列,一般用于游戏(加密货币);用于图形设计的Quadro系列(只有丽台一家AIC获得了授权);用于服务器高性能AI和科学计算的Tesla系列(也只有丽台有授权)。现在还有个专供挖取虚拟数字货币的CMP系列。

1.2、特斯拉计算卡的简介与分类

特斯拉计算卡从最近的几代算起,大概有K、M、P、T、A、V这几代,分别对应着每一代的架构代号。K是开普勒,M是麦克斯韦,P是帕斯卡,T是图灵,A是安培,V是伏特。更古老的就暂时不提了,因为他们命名不统一,且多项参数在今天看都已过时。

由于TESLA计算卡大都用于科学计算或者AI训练(近些年开始用于虚拟化与云游戏),因此大部分TESLA计算卡都没有显示输出接口,并且由于服务器风道要求,大部分卡还是被动散热。

TESLA计算卡在Windows下有两种模式,Tesla 计算集群(Tesla Compute Cluster,简称 TCC)模式或 Windows 显示驱动模型(Windows Display Driver Model,简称 WDDM)模式。两种模式有不同适用场景。

TCC:该模式下,GPU 完全用于计算,不能作为本地显示输出。

WDDM:该模式下,GPU 既用于计算又用于本地显示输出。

一些常见的Tesla计算卡型号(包含一部分原作者个人见解):

Tesla K8 GK104:开普勒1.0架构=GTX770 但是8GB显存实际性能GTX950

Tesla K10 GK104*2:开普勒1.0架构=两个GTX770 但是双4GB显存双芯卡嘛,实际性能超过GTX1050TI 12%,低于GTX1650 10%

Tesla K20系列GK110A\B 开普勒1.0架构,不描述了,后缀型号一大堆,乱七八糟的真要买直接买Quadro K6000黑色电路板版本

Tesla K40系列GK180A\GK110B 开普勒1.0架构,一样不描述了,后缀型号一大堆,乱七八糟的真要买直接买Quadro K6000黑色电路板版本

Tesla K80 GK210*2:开普勒2.0架构完整版双芯=1.9个gtx Titan

Tesla M4 GM206:麦克斯韦2.0架构=不需要独立供电的GTX960 4GB

Tesla M6 GM204:麦克斯韦2.0架构=不需要独立供电的GTX970 8GB

Tesla M10 GM107*4:麦克斯韦1.0架构=四个750ti 2GB

Tesla M40 GM200:麦克斯韦2.0架构完整版=GTX980ti 有12G和24G两个版本

Tesla M60 GM204*2:麦克斯韦2.0架构=两个GTX970

Tesla P4 GP104:帕斯卡架构=一个不需要供电的GTX 1070实际性能比1060 6G好7%比1070低32%

Tesla P6 GP104:帕斯卡架构=一个不需要供电的GTX 1070 但是16GB显存实际性能和1070一样,Titan x按在地上摩擦

Tesla P10 GP102:帕斯卡架构=单槽位的1080ti 但是24GB显存实际性能2070super,把1080TI按地上摩擦

Tesla P40 GP102:帕斯卡架构=双槽位1080ti 但是24GB显存实际性能跟2080打平手,1080TI是个渣渣

Tesla P100 GP100:帕斯卡架构=GP100

Tesla V100系列 GV100:伏特架构,不描述了,后缀型号一大堆,压根买不起系列

Tesla T4 TU104:图灵架构=一个不需要供电的GTX 2070,实际性能也是GTX 2070但是显存16G。

Tesla A2 GA107:安培架构 RTX3050

Tesla A10 GA102:安培架构 RTX3080\TI带不带TI真没啥差距GA102核心的显卡一大堆

Tesla A16 GA107:安培架构 RTX3050TI

Tesla A30 GA100:安培架构 GA100差不多,显存多不一样而已

Tesla A40 GA102:安培架构 和RTX A6000同核心,无显示接口,被动散热,功耗不太一样

Tesla A100 GA100:安培架构 GA100

1.3、NVIDIA TESLA M40 24G的参数与基本性能

这里的数据来源于GPUZ官网的GPU数据库。

2、为什么要选择她

2.1、价格与性能的平衡

目前所有在售和退役的显卡均因为矿潮和产能不足而造成了价格疯狂上涨。和TESLA M40性能相近的显卡中,Geforce GTX 1660 SUPER的价格在2800元左右,Geforce GTX TITAN X即使是二手也在2500元左右,Geforce GTX 1660 Ti在2500元以上,Geforce GTX 980 Ti难以购买且普遍在2000元以上,只有Geforce GTX1070在1500-2000元左右,Geforce RTX3050 在2500元左右,Radeon RX Vega 56、RadeonR9 295X2和Radeon R9 295X2难以购买。而TESLA M40在1100元左右,TESLA M40 24G在1600元左右,就性价比而言,已经超出上面的这些显卡。

2.2、落后与先进的平衡

TESLA M40是Maxwell时代的产物,相较于今天来说已经过去了6-7年的时间,但是它任然支持最新的DX12和足够基础AI训练的CUDA 5.2。与最新一代的性能相近的RTX3050对比,TESLA M40在功能上最大的不足便是不支持光线追踪技术,而大部分普通人对于光线追踪技术没有太多的要求。

2.3、功耗与性能的平衡

TESLA M40的热设计功耗为250W,大致与现在在售的高端显卡Geforce RTX3070相当,因此就目前标准来看,算不上“电老虎”。但是与性能相当的显卡Geforce RTX3050对比,无疑是后者功耗120W的两倍。考虑到TESLA M40采用了GM200这样的一颗完整的Maxwell核心,只能说TESLA M40已经尽力了。毕竟28nm和8nm的制程差距是无法消除的。

2.4、稳定性与价格的平衡

之前在网上曾经流传过一个笑话:当10、20、30系不存在吧,直接从40系开始,如果40系也这样,那么就从50、60系开始。这虽然是一句玩笑话,可是也从侧面指出了当前普通用户购买显卡所面对的最大障碍-矿潮和黄牛。众多高算力的显卡都被用于挖取以太坊(ETC)。从AMD 的Radeon RX 480到Geforce GTX 1060,再到 RTX 3060。这在造成了大部分显卡溢价严重的同时,也为社会产生了大量曾经挖过数字货币的显卡,俗称“矿卡”。

这类“矿卡”在流入市场后很难被普通用户从普通显卡中挑出,而这些经过了长时间高强度运行的显卡,很容易出现花屏、黑屏等不稳定现象。

TESLA和Quadro系列显卡则很幸运,因为专业显卡本身的商业属性,专业显卡的价格会比同算力的普通Geforce、Radeon系列显卡高得多。而且专业显卡的购买渠道也比较受限。所以,退役的TESLA、Quadro显卡往往来源于工作站和服务器。这些地方相较于“矿场”,环境会优越许多。往往具有无尘机房、服务器和机柜暴力风扇、机房空调等设施,也不会像矿场一样7×24小时不间断运行几个月。

3、选择M40前需要注意什么?

3.1、机箱要求

TESLA M40的长度为26.7cm,且需要占用两个扩展卡槽位,因此,请确保机箱内有足够的空间来安装TESLA M40。由于外置供电接口在显卡后部,所以请务必确保外置供电线材能够被正确插入。此外,如果需要修改散热,那么就需要参照修改后的散热器的空间要求。如果是采用原装散热+涡轮风扇的组合,那么建议机箱宽度至少在35cm。

3.2、电源要求

使用TESLA M40建议至少600W以上的电源。如果以后需要超频,建议800W起步。由于TESLA M40的外置供电接口与普通显卡不符,因此需要购买TESLA 显卡的供电电源线(将TESLA显卡上的8pin转为普通的显卡8+8pin),一般在20-30元左右。

3.3、主板/CPU要求

TESLA M40没有显示输出接口,除了部分人自己焊接了显示接口外,就只能使用另外的显卡来输出信号,TESLA M40只负责内容的处理。所以最好选择带有核芯显卡的CPU。因为TESLA的寻址问题,还需要在主板BIOS中打开“Above 4G”或者类似的选项,并关闭CSM,即使用纯UEFI模式。

3.4、双显卡要求

如果CPU没有集成核芯显卡,那么就需要使用亮机卡(低端显卡)来完成显示输出。如果选择nVidia显卡,那么请选择近一段时间的显卡,因为较旧的显卡很可能会与TESLA M40发生驱动冲突。所以推荐使用低端的AMD Radeon显卡来当亮机卡。

3.4、操作系统要求

推荐使用Windows 11,因为Windows 11有方便的配置界面,可以让用户自由选择让哪个程序运行在哪张显卡上。Windows 10后期的dev版里也有这个功能,但是因为dev版不如正式版稳定且不提供单独的安装镜像,我也不推荐使用存在一定可能的隐患的第三方封装的镜像。

4、散热的修改

TESLA M40是纯被动散热,因此如果需要在普通台式机中使用,就必须进行散热改造。

4.1、水冷

可以使用水冷散热来替换TESLA M40默认的散热片,不过需要照顾到背面的显存。因为这张卡太小众,所以一般只能购买定制的散热器,价格高昂。

4.2、普通风冷

可以用普通的显卡风冷散热器来代替默认被动散热器,一般可以选用Geforce GTX 980 TI和Geforce GTX 1080的散热器。需要注意尾部的外置电源接口,以及风扇需要单独引入供电。当然了,如果焊工到位,也可以在显卡上找个5V输出上电。最后,还是需要注意显卡背面的显存。

4.4、外置散热(利用原散热器)

原装散热器可以非常方便地在外部加装抽气或者送气(不推荐)风扇来达到一般涡轮散热显卡地效果。一般选择在显卡尾部加装服务器风扇,或者在机箱外部,也就是TESLA M40挡板外部用风扇吸风。

5、我的折腾过程

5.1、购买

2月末,使用1500RMB于一二手平台(闲鱼)商贩处购得TESLA M40 24G,不含电源线。随后去淘宝以19RMB购得1分2电源线,10RMB购得USB小风扇,25RMB购得大口径软管,在大学超市里15RMB购得防水清洁袋,再花20RMB购得改装好USB接口的暴力风扇以及10RMB的两只USB调速板。

5.2、安装

这一部分比较顺利,就和安装普通的显卡一样。我在安装之前就下载好了TESLA驱动(注意需要安装带有desktoop字样的驱动,否则会在安装后无法调整运行模式),并在BIOS中打开了“Above 4G”。之后的安装过程很顺利,因为我是长城800W模组电源,所以再拿出了一根显卡模组线就可以了。

5.3、设置

开启了电脑并安装好TESLA M40的驱动程序后,在任务管理器里无法看到新安装的GPU,运行GPU-Z,可以看到识别到了TESLA M40,但是显示不支持DriectX和Vulkan等图形API。在命令提示符(管理员)中运行nvidia-smi命令,可以看到目前TESLA M40还处于TCC模式中,无法用于图形计算。这时运行nvidia-smi -dm 0命令,将显卡切换为WDDM,然后按照要求重启,之后就可以在任务管理器GPU中看到M40了。

在命令提示符中运行nvidia_smi,可以看到TESLA M40已处于WDDM模式。

         接下来就可以添加程序让TESLA M40处理并且用其它的显卡输出了。在桌面空白处点击鼠标右键,并且单击“显示设置(Display settings)”,在右侧主要界面的“相关设置(Related settings)”的下面会有“显示卡(Graphics)”,单击“显示卡(Graphics)”,就可以添加程序让M40运行了。可以单击“浏览(Brose)”来添加自己的游戏和需要GPU加速的程序。在添加后,程序会出现在下方的列表中,单击程序名称,然后单击“选项(Options)”,就可以选择显卡了。

由于散热风扇还未安装,所以咱只能顶着TESLA M40的高温降频,跑了一下鲁大师(Master Happiness)。

这是没有任何散热措施的成绩,不敢跑3DMark,因为我知道现在跑3DMark必过热黑屏。

这里还有一点需要提一下,如果需要使用完整的24 GB显存,需要关闭ECC功能,可以在nVidia控制面板中关闭。

5.4、散热处理

这是我最头疼的一点。目前不运行任何程序,TESLA M40的GPU温度在50度左右,而热点则在65度左右。只要稍微一运行3D程序,温度直冲90度。毕竟没有加风扇。

目前我想到的第一个方法就是使用大口径软管连接两个导风罩,一个导风罩用来固定在显卡挡板外,另一个导风罩固定风扇,这样显卡的热量就可以沿着挡板-导风罩1-软管-导风罩2-风扇带走了。

结果勉强安装好之后,虽然待机温度降到了40度,跑GPUZ烤机还是5分钟降频。最后迫不得已,上了最便宜的暴力风扇。

------------三天后···············----------------------------

事实证明,还是服务器暴力扇舒服,玩游戏开两个可以把最高温度压在80度以下,可惜就是太吵了。

5.5、超频

通常情况下,麦克斯韦架构的显卡超频能力都比较强。网上这张显卡的核心超频极限一般在1.45Ghz左右。但是因为BIOS设置了超频上限,所以如果想要完全释放这张卡的性能,就需要刷写vBIOS。我没那个心思去刷了,因为感觉目前的性能够用,就只是使用Nvidia Inspector小超了一下。

6、结论

这篇文章因为我一直没有找到合适的散热方案而拖了很久。以目前的情况看,降至1200元附近的M40 24G版还有一定性价比(你愿意折腾的话)。如果只是用来玩游戏,那么还是建议入手1070或者再等等RTX3050降价。

7、参考文献

GPU 的两种模式 TCC vs WDDM 设置指南

nvidia-smi显示解读

使用NVIDIA-SMI监控GPU利用率和温度

为什么Nvidia A40显卡的GPU一直不工作?

使用Tesla P4显卡炼丹与游戏的环境配置(CUDA9.0 \ PyTorch1.1.0 \ DirectX 12.0)

TESLA M40超频bios分享

使用Tesla P4显卡炼丹(游戏/压制)的环境配置

普通台式机上Tesla M40显卡paddleGPU深度学习柯南的变身器上机体验

丐中丐双卡个人微型工作站,二手Tesla M40 12G水冷显卡改造上机心得

NVIDIA GPGPU中Tesla系列的游戏卡用法及性能指标

NVIDIA Tesla M40 24 GB

List of Nvidia graphics processing units

最后更新于 2022-03-14