微信一键登录

科吉思石油论坛

搜索
查看: 3625|回复: 0
打印 上一主题 下一主题

tNavigator-GPU选购指南-2020

[复制链接]

136

主题

205

帖子

264

积分

中级会员

Rank: 3Rank: 3

积分
264
跳转到指定楼层
楼主
发表于 2020-4-25 21:30:47 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 乔聪颖 于 2020-5-7 10:32 编辑

N年前听过的一个讲座中提到,当前人工智能迅猛发展的原因主要有三个:数据的增长、算力的提升、算法(框架)的进步。记忆犹新!
目前来看,算力的提升主要体现在硬件方面,而GPU是一个典型代表。GPU早已在各个行业得到广泛应用,若是你用的行业软件可以调用GPU进行加速运算,那么恭喜你,当前起码在算力性能方面,该款软件是处在行业前沿的。
虽然当前的GPU早已不再是那个懵懂的少年,高质量和高性能图形处理能力已不再是GPU的唯一标签,更为人知是其超强的计算能力。
笔者曾经(现在也是)被Nvidia公司花样繁多的GPU产品名称以及多样的架构所搞得晕头转向,最近花费了一点精力查阅相关资料,特作了一点总结,供大家翻阅。

本文仅以普通工程师的视角,了解下GPU的基本常识;
主要以Nvidia的GPU为主;
若是想对GPU技术有深刻的了解,请移步参考链接以及其它资源。
-------------------------------------------
GPU即GraphicsProcess Unit,最初被创造出来的初衷是为了提高图形处理,后来也被广泛用于通用计算领域,表现非常优异,
【同样是九年义务教育,为什么你如此优秀?-加速原理】
简而言之,架构不同。
CPU和GPU架构
CPU的处理单元较少,适合处理串行、逻辑复杂的任务;
GPU拥有更多的处理单元,善于处理大量的、简单的、并行处理任务。
下面的例子很生动地解释了CPU与GPU的区别:
举个例子,假设有一堆相同的加减乘除计算任务需要处理,那把这个任务交给一堆(几十个)小学生就可以了,这里小学生类似于GPU的计算单元,而对一些复杂的逻辑推理等问题,比如公式推导、科技文章写作等高度逻辑化的任务,交给小学生显然不合适,这时大学教授更适合,这里的大学教授就是CPU的计算单元了,大学教授当然能处理加减乘除的问题,单个教授计算加减乘除比单个小学生计算速度更快,但是成本显然高很多。

【GPU重要参数含义解释】
既然GPU有这么强悍的能力,我们该如何选购适合自己的那一款呢?自然是要参考GPU的参数指标:
CUDA核心:CUDA核心数量决定了GPU并行处理的能力,在深度学习、机器学习等并行计算类业务下,CUDA核心多意味着性能好一些。
显存容量:其主要功能就是暂时储存GPU要处理的数据和处理完毕的数据。显存容量大小决定了GPU能够加载的数据量大小。(在显存已经可以满足客户业务的情况下,提升显存不会对业务性能带来大的提升。在深度学习、机器学习的训练场景,显存的大小决定了一次能够加载训练数据的量,在大规模训练时,显存会显得比较重要。
显存位宽:显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。
显存频率:一定程度上反应着该显存的速度,以MHz(兆赫兹)为单位,显存频率随着显存的类型、性能的不同而不同。显存频率和位宽决定显存带宽。
显存带宽:指显示芯片与显存之间的数据传输速率,它以字节/秒为单位。显存带宽是决定显卡性能和速度最重要的因素之一。

其他指标:除了显卡通用指标外,NVIDIA还有一些针对特定场景优化的指标,例如TsnsoCore、RTCoreRT等能力。例如TensenCore专门用于加速深度学习中的张量运算。

【产品系列-应用方向-用户群体】
Nvidia的GPU主要有几个系列,不同的系列的应用方向和针对的用户群体会有较大的差异,弄懂这些会对我们的选购提供一些指导:
GeForce系列:主要面向3D游戏应用的GeForce系列,有GTX1080TI、Titan XP、GTX1080和RTX 2080TI等,也经常被用于深度学习、人工智能、计算机视觉等。
Quadro系列:主要面向专业图形工作站应用,具备强大的数据运算与图形、图像处理能力。
GPU加速计算Tesla系列:专用GPU加速计算,如V100、P100、K40/K80、M40/M60等。K系列更适合用作HPC科学计算,M系列则更适合机器学习用途。
GPU虚拟化系列:Nvidia专门针对虚拟化环境应用设计GRID GPU产品。

在电商平台查询时,很可能被GPU的各种架构和系列搞得痛不欲生!因为这二者是“混搭”的,同一个系列中可能会包含多种架构的产品。下图可能会让你拨云见日:

【搭配tNavigator时的GPU选购指导】
tNavigator是行业领先的GPU级精细油气藏建模数模一体化智能技术,从17.x版本起支持调用GPU,为建模/数模工作提供了强大的算力支持!
最近释放的版本中,Full GPU模式功能更加完善,运算效率进一步提升!
  • tNavigator支持具有Pascal,Volta和Turing架构的最新GPU,以及最新的CUDA驱动程序;
  • 与Pascal相比,tNavigator在Turing类GPU上运行更好;
  • 最佳的GPU配置是每个工作站2个GPU。随着将越来越多的计算推向GPU,建议选购具有更大显存的GPU:RTX8000(48GB)或GV100(32G);
  • 可配置多GPU的工作站性能更好:如DGX station,既可用于独立工作站也可用作HPC集群节点;
  • 当在一个工作站上调用多个显卡同时工作时,统一型号的显卡可能表现会更出色。
需要注意的是,tNavigator仅支持Pascal及以后发布的架构的显卡,并不支持Kepler架构的显卡。

【参考链接】
https://blog.csdn.net/u013165704/article/details/80569424)
https://blog.csdn.net/BtB5e6Nsu1g511Eg5XEg/java/article/details/99131756),本文多处内容出自于此
https://blog.csdn.net/weiweigfkd/article/details/23051255
https://blog.csdn.net/u013165704/article/details/80569424
https://www.cnblogs.com/timlly/p/11471507.html
https://www.jianshu.com/p/87cf95b1faa0

-------------------------------------------
欢迎提出任何相关功能需求、应用实现,请在文末留言。
更多精彩,尽在科吉思!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|服务支持:DZ动力|科吉思石油技术咨询有限公司 ( 京ICP备15057753号

GMT+8, 2024-5-8 01:24 , Processed in 0.203125 second(s), 32 queries .

Powered by Discuz! X3.2 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表