一个合格的深度学习炼丹师对于 GPU 知识的掌握是必不可少的,其中有一个拦路虎就是,如何选购显卡?

三个核心

其实选购深度学习的显卡就三个核心参数需要注意:张量核心数目,FLOPS,显存带宽。(FLOPS 为每秒浮点运算次数)

如果你是图像处理方向(CV)或者使用卷积神经网络(CNN)较多的话,这三个参数的优先程度为:

张量核心数目 > FLOPS > 显存带宽

如果你是自然语言处理方向(NLP)或者使用循环神经网络(RNN)较多的话,这三个参数的优先程度为:

显存带宽 > 张量核心数目 > FLOPS

多卡问题

一个很直观的想法是:我买多张显卡那么训练速度会更快些。快肯定是快,但快多少就不好说了。

往往不会是 1+1=2,有时连 1+1=1.5 都达不到。主要原因是很多网络都无法简单的并行训练,另外两张卡需要数据传输,由于带宽限制会进一步降低速度。

那么多卡还有必要吗?当然有,但是不是为了并行训练的。

比如可以同时跑多个实验,验证多组参数。

买哪个卡

当前情况下,只考虑英伟达就好了,下面我提到的显卡也都是英伟达的。

  • 对于普通炼丹师来说,当前消费者级的顶级显卡就 OK 了,比如当前最好的是 RTX 2080 Ti

  • 对于新手来说,RTX 2060 TiRTX 2070 Ti 是不错的选择,性价比很高。

  • 最后,不到万不得已,不要使用 Tesla 系列的显卡,相同性能下,Tesla 系列 比 RTX 系列贵很多。

参考