加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 正文

性能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

发布时间:2020-04-04 05:18:25 所属栏目:创业 来源:互联网
导读:2018年的百度AI开拓者大会上,百度首创人、董事长兼CEO李彦宏公布推出自研AI芯片昆仑。百度研发AI芯片的蕴蓄得益于其用FPGA做AI加快的蕴蓄,也得益于其在软件界说加快器和XPU架构的多年蕴蓄。 百度最早在2010年开始用FPGA做AI架构的研发,2011年开展小局限

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

2018年的百度AI开拓者大会上,百度首创人、董事长兼CEO李彦宏公布推出自研AI芯片昆仑。百度研发AI芯片的蕴蓄得益于其用FPGA做AI加快的蕴蓄,也得益于其在软件界说加快器和XPU架构的多年蕴蓄。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

百度最早在2010年开始用FPGA做AI架构的研发,2011年开展小局限陈设上线,2017年陈设高出了10000片FPGA,2018年宣布自主研发AI芯片,2019年下半年流片乐成,2020年开始量产。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

昆仑芯片的定位是通用AI芯片,方针是提供高机能、低本钱、高机动性的AI芯片。欧阳剑在分享中说:“对比GPU,昆仑芯片的通用性和可编程性都做的不错,而且我们还在全力把编程性做的更好。”

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

昆仑宣布之后,其相干动静延续发布。架构方面,昆仑有2个计较单位,512GB/S的内存带宽,16MB SRAM/unit。欧阳剑先容,16MB的SRAM对AI推理很有辅佐,XPU架构上的XPU-SDNN是为Tensor等而计划,XPU-Cluster则可以或许满意通用处理赏罚的需求。

昆仑第一代芯片并没有回收NVLink,而是通过PCIE 4.0接口举办互联。在三星14nm的制造工艺和2.5D封装的支持下,昆仑芯片峰值机能可以到达260TOPS,功耗为150W。

在机动性和易用性方面,昆仑面向开拓者提供相同英伟达CUDA的软件栈,可以通过C/C++说话举办编程,低落开拓者的开举事度。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

今朝,基于第一代昆仑芯片,百度推出了两款AI加快卡,K100和K200,前者算力和功耗都是后者的两倍。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

在本日的分享中,欧阳剑给出了一系列K200比拟英伟达T4的数据,个中在Gemm-Int8数据范例,4K X 4K的矩阵下,昆仑K200的Benchmark分出高出2000,是英伟达T4的3倍多。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

在语音常用的Bert/Ernie测试模子下,昆仑也有明明机能上风。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

在线上机能数据的示意上,昆仑的示意对比英伟达T4越发不变,且耽误也有上风。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

在图像支解YOLOV3算法中,昆仑固然有上风,但上风已经不那么明明。不外欧阳剑暗示百度如故在通过一连的优化进步昆仑的机能。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

他同时暗示,昆仑已经在百度内部局限应用。至于对外提供AI算力,客岁12月13日百度通过定向约请的方法通过百度云提供昆仑的算力。通过百度云提供昆仑AI算力今朝如故是定向约请的方法,且首要是私有陈设的方法。百度会通过定向约请的客户的反馈动静,再通过百度云大局限向外提供昆仑的算力,但他没有给出详细的时刻线。

除了通过百度云提供昆仑的算力,欧阳剑也展示了昆仑加快卡在家产智能装备中的应用。欧阳剑演示的是用CPU和昆仑加快卡去举办产物缺陷检测,昆仑可以大幅晋升速率,但并没有给出详细的比拟数据。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

其它一个展示则是昆仑的杀手锏,那就是和国产处理赏罚器平台热潮的适配。在2019热潮生态搭档大会上,欧阳剑就透露昆仑AI芯片正在适配国产热潮处事器,做机能调优事变。在本日的线上分享中,欧阳剑展示了回收昆仑加快卡带来的图像支解速率的明显加快。

机能最高比英伟达T4强三倍 百度昆仑AI芯片进一步展示“杀手锏”应用

热潮CPU处理赏罚器回收的是Armv8指令级,首要用在数据中心和云计较中心,作为国产芯的代表,昆仑选择与热潮举办很好地适配显然是看中了国产自研芯片的大市场。

通过热潮CPU+昆仑AI加快器的方法,两边可以更好的实现国产芯片在处事器市场的国产化,也可以视为昆仑AI芯片和加快卡将来增添的一个重要动力和杀手锏。

本文素材来自互联网

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读