tNavigator-GPU选购指南-2020

乔聪颖 · 发表于 2020-4-25 21:30:47

本帖最后由乔聪颖于 2020-5-7 10:32 编辑

N年前听过的一个讲座中提到，当前人工智能迅猛发展的原因主要有三个：数据的增长、算力的提升、算法（框架）的进步。记忆犹新！

目前来看，算力的提升主要体现在硬件方面，而GPU是一个典型代表。GPU早已在各个行业得到广泛应用，若是你用的行业软件可以调用GPU进行加速运算，那么恭喜你，当前起码在算力性能方面，该款软件是处在行业前沿的。

虽然当前的GPU早已不再是那个懵懂的少年，高质量和高性能图形处理能力已不再是GPU的唯一标签，更为人知是其超强的计算能力。

笔者曾经（现在也是）被Nvidia公司花样繁多的GPU产品名称以及多样的架构所搞得晕头转向，最近花费了一点精力查阅相关资料，特作了一点总结，供大家翻阅。

本文仅以普通工程师的视角，了解下GPU的基本常识；

主要以Nvidia的GPU为主；

若是想对GPU技术有深刻的了解，请移步参考链接以及其它资源。

-------------------------------------------

GPU即GraphicsProcess Unit，最初被创造出来的初衷是为了提高图形处理，后来也被广泛用于通用计算领域，表现非常优异，

【同样是九年义务教育，为什么你如此优秀？-加速原理】

简而言之，架构不同。

CPU和GPU架构

CPU的处理单元较少，适合处理串行、逻辑复杂的任务；

GPU拥有更多的处理单元，善于处理大量的、简单的、并行处理任务。

下面的例子很生动地解释了CPU与GPU的区别：

举个例子，假设有一堆相同的加减乘除计算任务需要处理，那把这个任务交给一堆（几十个）小学生就可以了，这里小学生类似于GPU的计算单元，而对一些复杂的逻辑推理等问题，比如公式推导、科技文章写作等高度逻辑化的任务，交给小学生显然不合适，这时大学教授更适合，这里的大学教授就是CPU的计算单元了，大学教授当然能处理加减乘除的问题，单个教授计算加减乘除比单个小学生计算速度更快，但是成本显然高很多。

【GPU重要参数含义解释】

既然GPU有这么强悍的能力，我们该如何选购适合自己的那一款呢？自然是要参考GPU的参数指标：

CUDA核心：CUDA核心数量决定了GPU并行处理的能力，在深度学习、机器学习等并行计算类业务下，CUDA核心多意味着性能好一些。

显存容量：其主要功能就是暂时储存GPU要处理的数据和处理完毕的数据。显存容量大小决定了GPU能够加载的数据量大小。（在显存已经可以满足客户业务的情况下，提升显存不会对业务性能带来大的提升。在深度学习、机器学习的训练场景，显存的大小决定了一次能够加载训练数据的量，在大规模训练时，显存会显得比较重要。

显存位宽：显存在一个时钟周期内所能传送数据的位数，位数越大则瞬间所能传输的数据量越大，这是显存的重要参数之一。

显存频率：一定程度上反应着该显存的速度，以MHz（兆赫兹）为单位,显存频率随着显存的类型、性能的不同而不同。显存频率和位宽决定显存带宽。

显存带宽：指显示芯片与显存之间的数据传输速率，它以字节/秒为单位。显存带宽是决定显卡性能和速度最重要的因素之一。

其他指标：除了显卡通用指标外，NVIDIA还有一些针对特定场景优化的指标，例如TsnsoCore、RTCoreRT等能力。例如TensenCore专门用于加速深度学习中的张量运算。

【产品系列-应用方向-用户群体】

Nvidia的GPU主要有几个系列，不同的系列的应用方向和针对的用户群体会有较大的差异，弄懂这些会对我们的选购提供一些指导：

GeForce系列：主要面向3D游戏应用的GeForce系列，有GTX1080TI、Titan XP、GTX1080和RTX 2080TI等，也经常被用于深度学习、人工智能、计算机视觉等。

Quadro系列：主要面向专业图形工作站应用，具备强大的数据运算与图形、图像处理能力。

GPU加速计算Tesla系列：专用GPU加速计算，如V100、P100、K40/K80、M40/M60等。K系列更适合用作HPC科学计算，M系列则更适合机器学习用途。

GPU虚拟化系列：Nvidia专门针对虚拟化环境应用设计GRID GPU产品。

在电商平台查询时，很可能被GPU的各种架构和系列搞得痛不欲生！因为这二者是“混搭”的，同一个系列中可能会包含多种架构的产品。下图可能会让你拨云见日：

【搭配tNavigator时的GPU选购指导】

tNavigator是行业领先的GPU级精细油气藏建模数模一体化智能技术，从17.x版本起支持调用GPU，为建模/数模工作提供了强大的算力支持！

最近释放的版本中，Full GPU模式功能更加完善，运算效率进一步提升！

tNavigator支持具有Pascal，Volta和Turing架构的最新GPU，以及最新的CUDA驱动程序；
与Pascal相比，tNavigator在Turing类GPU上运行更好；
最佳的GPU配置是每个工作站2个GPU。随着将越来越多的计算推向GPU，建议选购具有更大显存的GPU：RTX8000（48GB）或GV100（32G）；
可配置多GPU的工作站性能更好：如DGX station，既可用于独立工作站也可用作HPC集群节点；
当在一个工作站上调用多个显卡同时工作时，统一型号的显卡可能表现会更出色。

需要注意的是，tNavigator仅支持Pascal及以后发布的架构的显卡，并不支持Kepler架构的显卡。

【参考链接】

https://blog.csdn.net/u013165704/article/details/80569424）

https://blog.csdn.net/BtB5e6Nsu1g511Eg5XEg/java/article/details/99131756），本文多处内容出自于此

https://blog.csdn.net/weiweigfkd/article/details/23051255

https://blog.csdn.net/u013165704/article/details/80569424

https://www.cnblogs.com/timlly/p/11471507.html

https://www.jianshu.com/p/87cf95b1faa0

微文《GPU选购指南》

-------------------------------------------

欢迎提出任何相关功能需求、应用实现，请在文末留言。