加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

CPU、GPU之外,IPU能否撑起AI芯片市场的第三极?

发布时间:2020-06-17 23:43:33 所属栏目:业界 来源:站长网
导读:人工智能(AI)的鼓起发动市场对AI芯片的需求,NVIDIA的GPU真正借着这股春风敏捷成为AI市场的主流产物之一,其势头乃至盖过了CPU。不外,GPU还不能算是真正的AI芯片,此刻一大波新兴的AI专用芯片正在路上,而IPU(智能处理赏罚器)在这之中相比拟力成熟。今朝

人工智能(AI)的鼓起发动市场对AI芯片的需求,NVIDIA的GPU真正借着这股“春风”敏捷成为AI市场的主流产物之一,其势头乃至盖过了CPU。不外,GPU还不能算是真正的AI芯片,此刻一大波新兴的AI专用芯片正在路上,而IPU(智能处理赏罚器)在这之中相比拟力成熟。今朝,来自Graphcore的IPU芯片已真正量产,应用结果很是好,由此也被不少人看好。

专为呆板智能计划

Graphcore是IPU的扛旗人。Graphcore是一家来自英国的明星初创公司,到今朝为止,公司总共融资高出4.5亿美金,个中包罗一些很是知名的金融投资者、计谋投资者,好比,微软、三星、博世、宝马、戴尔等。IPU是一种专为呆板智能计划的全新芯片范例,回收的是完全差异于CPU、GPU的全新处理赏罚器架构,专门合用于AI负载。

Graphcore高级副总裁兼中国区总司理卢涛汇报记者,呆板智能是一类全新的计较负载,有本身的特点。好比,AI算法凡是涉及大局限的并行计较;数据布局凡是长短常稀少的矩阵;和传统的科学计较可能高机能计较(HPC)对比,智能计较广泛都是低精度计较。其它,AI应用常常会稀有据参数复用、静态图布局。因为这些特点的存在,使得传统CPU、GPU在处理赏罚这类事变负载的结果并不抱负,而IPU则有明明上风。

CPU、GPU之外,IPU可否撑起AI芯片市场的第三极?

Graphcore高级副总裁兼中国区总司理卢涛

“CPU是面向应用和收集计划的处理赏罚器,是一个标量处理赏罚器;GPU是面向图形和高机能计较、以向量处理赏罚为焦点的处理赏罚器。AI是一个全新的负载、是以计较图作为表征,因此必要一种全新的处理赏罚器架构,而Graphcore开创的IPU就是针对计较图的处理赏罚来计划的专用处理赏罚器。”卢涛说。

据卢涛先容,Graphcore的IPU在架构上做了大量创新。个中一大创新是,IPU内核回收了大局限并行MIMD,有一个很是大的漫衍式片上SRAM,这个SRAM高达300 MB。因此,对比CPU+DDR2可能GPU+GDDR/HBM,IPU可以或许实现10到320倍的机能晋升。

“近些年,芯片的计较手段晋升很快,但内存的机能晋升却相对迟钝。IPU的一个创新计划就是回收了大局限并行MIMD和复杂的漫衍式片上SRAM。”卢涛说。

Graphcore IPU的另一大架构创新是回收了构建大局限数据中心集群的BSP技能(Bulk Synchronous Parallel),这种技能今朝在谷歌、Facebook、百度这样的大局限数据中心都在行使。IPU也是今朝天下上首款BSP处理赏罚器,通过硬件来支持BSP协议,并通过BSP协议把整个计较逻辑分为计较、同步、互换三方面。

据悉,Graphcore IPU已经量产的GC2处理赏罚器拥有236亿个晶体管的芯片,在120瓦的功耗下有125 TFlops的殽杂精度、1216个独立的处理赏罚器焦点(Tile),300 M的SRAM可以或许把完备的计较模子放在片内。其它,内存的带宽有45 TB/s、片上的互换是8 TB/s、片间的IPU-Links是2.5 TB/s。Graphcore IPU的这些硬件前提为其最后高机能地完成AI应用奠基了很是强盛的基本。

一款全新架构的处理赏罚器要想真正落地,配套的软件天然必不行少,个中就包罗编译器、开拓平台以及其他相干的各类配套软件和器材。对此,Graphcore推出了IPU配套的开拓平台——Poplar SDK。Poplar是架构在呆板进修的框架软件(好比TensorFlow、ONNX、PyTorch和PaddlePaddle)和硬件之间的一个基于计较图的器材和库,今朝提供750个高机能计较元素的50多种优化成果,可以支持各类尺度的呆板进修框架,包罗TensorFlow 1/2、ONNX和PyTorch,很快也会支持百度飞桨。在陈设方面,Poplar今朝可以支持容器化陈设,可以或许快速启动并运行。本年5月,Graphcore还推出了一款名为PopVision Graph Analyser的说明器材。开拓职员在行使IPU举办编程的时辰,可以通过PopVision这个可视化的图形展示器材来说明软件的运行环境、调试服从。

上风起源揭示

硬件架构的创新加上配套软件使得IPU在人工智能的应用上示意优秀。好比,在BERT实习方面,回收NVLink-enabled的GPU平台凡是必要50多个小时才气到达必然精度,而IPU平台只需36.3小时。在BERT推理方面,IPU今朝在 BERT 上实习的时刻可以或许比 GPU 收缩 25%以上。

微软的一位呆板进修专家在5月27日进行的Intelligent Health峰会上分享了怎样行使IPU实习CXR(胸部X光射线样片)。在微软本身专门创新的SONIC CV 模子里,IPU只要30分钟就可以或许完成传统的GPU必要5个小时才气完成实习的事变量。

卢涛先容,今朝基于IPU的应用已经包围了呆板进修的各个应用规模,包罗天然说话处理赏罚、图像/视频处理赏罚、时序说明、保举/排名及概率模子,普及应用于医疗、金融、制造以及5G等多个行业,极大低落了开拓者和用户的决定与开拓本钱。

卢涛暗示,今朝中国企业行使IPU分为两个渠道,其一是购置IPU处事器,戴尔已提供此类处事器;另一渠道是通过云处事商购置基于IPU的云处事。为了进一步共同IPU在中国的落地,Graphcore在中国已成立起两支技能处事团队——一支是以定制开拓为首要使命的工程技能团队,另一支是以客户技能处事为主的现场应用团队。

“AI应用必要专门的处理赏罚器,而IPU正是这样的处理赏罚器。今朝,AI在各行各业均获得普及应用,IPU可以基于自身上风为天下的智能化历程增加不竭动力。”卢涛最后总结道。

 

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读