本帖最后由 乔聪颖 于 2020-5-7 10:32 编辑
N年前听过的一个讲座中提到,当前人工智能迅猛发展的原因主要有三个:数据的增长、算力的提升、算法(框架)的进步。记忆犹新! 目前来看,算力的提升主要体现在硬件方面,而GPU是一个典型代表。GPU早已在各个行业得到广泛应用,若是你用的行业软件可以调用GPU进行加速运算,那么恭喜你,当前起码在算力性能方面,该款软件是处在行业前沿的。 虽然当前的GPU早已不再是那个懵懂的少年,高质量和高性能图形处理能力已不再是GPU的唯一标签,更为人知是其超强的计算能力。 笔者曾经(现在也是)被Nvidia公司花样繁多的GPU产品名称以及多样的架构所搞得晕头转向,最近花费了一点精力查阅相关资料,特作了一点总结,供大家翻阅。
本文仅以普通工程师的视角,了解下GPU的基本常识; 主要以Nvidia的GPU为主; 若是想对GPU技术有深刻的了解,请移步参考链接以及其它资源。 ------------------------------------------- GPU即GraphicsProcess Unit,最初被创造出来的初衷是为了提高图形处理,后来也被广泛用于通用计算领域,表现非常优异, 【同样是九年义务教育,为什么你如此优秀?-加速原理】简而言之,架构不同。 CPU和GPU架构 CPU的处理单元较少,适合处理串行、逻辑复杂的任务; GPU拥有更多的处理单元,善于处理大量的、简单的、并行处理任务。 下面的例子很生动地解释了CPU与GPU的区别: 举个例子,假设有一堆相同的加减乘除计算任务需要处理,那把这个任务交给一堆(几十个)小学生就可以了,这里小学生类似于GPU的计算单元,而对一些复杂的逻辑推理等问题,比如公式推导、科技文章写作等高度逻辑化的任务,交给小学生显然不合适,这时大学教授更适合,这里的大学教授就是CPU的计算单元了,大学教授当然能处理加减乘除的问题,单个教授计算加减乘除比单个小学生计算速度更快,但是成本显然高很多。
【GPU重要参数含义解释】既然GPU有这么强悍的能力,我们该如何选购适合自己的那一款呢?自然是要参考GPU的参数指标: CUDA核心:CUDA核心数量决定了GPU并行处理的能力,在深度学习、机器学习等并行计算类业务下,CUDA核心多意味着性能好一些。 显存容量:其主要功能就是暂时储存GPU要处理的数据和处理完毕的数据。显存容量大小决定了GPU能够加载的数据量大小。(在显存已经可以满足客户业务的情况下,提升显存不会对业务性能带来大的提升。在深度学习、机器学习的训练场景,显存的大小决定了一次能够加载训练数据的量,在大规模训练时,显存会显得比较重要。 显存位宽:显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。 显存频率:一定程度上反应着该显存的速度,以MHz(兆赫兹)为单位,显存频率随着显存的类型、性能的不同而不同。显存频率和位宽决定显存带宽。 显存带宽:指显示芯片与显存之间的数据传输速率,它以字节/秒为单位。显存带宽是决定显卡性能和速度最重要的因素之一。
其他指标:除了显卡通用指标外,NVIDIA还有一些针对特定场景优化的指标,例如TsnsoCore、RTCoreRT等能力。例如TensenCore专门用于加速深度学习中的张量运算。
【产品系列-应用方向-用户群体】Nvidia的GPU主要有几个系列,不同的系列的应用方向和针对的用户群体会有较大的差异,弄懂这些会对我们的选购提供一些指导: GeForce系列:主要面向3D游戏应用的GeForce系列,有GTX1080TI、Titan XP、GTX1080和RTX 2080TI等,也经常被用于深度学习、人工智能、计算机视觉等。 Quadro系列:主要面向专业图形工作站应用,具备强大的数据运算与图形、图像处理能力。 GPU加速计算Tesla系列:专用GPU加速计算,如V100、P100、K40/K80、M40/M60等。K系列更适合用作HPC科学计算,M系列则更适合机器学习用途。 GPU虚拟化系列:Nvidia专门针对虚拟化环境应用设计GRID GPU产品。
在电商平台查询时,很可能被GPU的各种架构和系列搞得痛不欲生!因为这二者是“混搭”的,同一个系列中可能会包含多种架构的产品。下图可能会让你拨云见日:
【搭配tNavigator时的GPU选购指导】tNavigator是行业领先的GPU级精细油气藏建模数模一体化智能技术,从17.x版本起支持调用GPU,为建模/数模工作提供了强大的算力支持! 最近释放的版本中,Full GPU模式功能更加完善,运算效率进一步提升! - tNavigator支持具有Pascal,Volta和Turing架构的最新GPU,以及最新的CUDA驱动程序;
- 与Pascal相比,tNavigator在Turing类GPU上运行更好;
- 最佳的GPU配置是每个工作站2个GPU。随着将越来越多的计算推向GPU,建议选购具有更大显存的GPU:RTX8000(48GB)或GV100(32G);
- 可配置多GPU的工作站性能更好:如DGX station,既可用于独立工作站也可用作HPC集群节点;
- 当在一个工作站上调用多个显卡同时工作时,统一型号的显卡可能表现会更出色。
需要注意的是,tNavigator仅支持Pascal及以后发布的架构的显卡,并不支持Kepler架构的显卡。
【参考链接】https://blog.csdn.net/u013165704/article/details/80569424) https://blog.csdn.net/BtB5e6Nsu1g511Eg5XEg/java/article/details/99131756),本文多处内容出自于此 https://blog.csdn.net/weiweigfkd/article/details/23051255 https://blog.csdn.net/u013165704/article/details/80569424 https://www.cnblogs.com/timlly/p/11471507.html https://www.jianshu.com/p/87cf95b1faa0
------------------------------------------- 欢迎提出任何相关功能需求、应用实现,请在文末留言。 更多精彩,尽在科吉思! |