加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

从芯片到模组、加快卡,企业要怎样构建AI生态

发布时间:2020-04-24 20:26:28 所属栏目:运营 来源:站长网
导读:副问题#e# 跟着AI在各个规模的一连深入应用,AI技能与传统行业不绝的融合,智能期间成为天下新出发点。而都市大脑、安防视频布局化、人脸辨认、伶俐制造、金融建模、智能呆板人、新原料发明、脑神经科学、医学影像说明等,人工智能期间的科学研究和工程实践都
副问题[/!--empirenews.page--]

  跟着AI在各个规模的一连深入应用,AI技能与传统行业不绝的融合,智能期间成为天下新出发点。而都市大脑、安防视频布局化、人脸辨认、伶俐制造、金融建模、智能呆板人、新原料发明、脑神经科学、医学影像说明等,人工智能期间的科学研究和工程实践都十分依靠计较力的支持。

  在智能安防相干项目中,因为摄像头数目庞大、品牌错乱、统一起图像必要多种布局化说明、布局化前端可执行的布局化内容有限、非布局化数据量大等题目,大大都用户如故首要依赖后端举办数据布局化处理赏罚。

  本日我们给各人带来的是一款全新的依托国产AI芯片计划的超强算力云端AI计较加快卡,比特大陆算丰SC5+,其在评测中浮现出的高算力、高机能功耗比、强劲视频解码手段、全链路加快手段、友爱的器材链等诸多让人面前一亮的特征,都使得该装备成为一款云端AI计较基本办法的上佳选择。

  尺度类型计划 普及兼容适配

  此次测试编辑拿得手上的比特大陆算丰SC5+云端AI计较加快卡外面计划简约大气,回收尺度半高半长尺寸计划,通过实物较量,该加快卡和英伟达的P4、T4等是统一规格尺寸,据比特大陆技强职员先容,该加快卡还可以和英伟达的P4、T4等在统一台算力处事器中殽杂行使,充实地思量了客户的利旧应用。

比特大陆SC5+ AI加快卡外面.jpg

  和华为Atlas300 AI加快卡的计划很相似,SC5+加快卡上搭载了3颗比特大陆自研的BM1684高机能计较芯片,该芯片已经是比特大陆最近三年中推出的第三代云端AI芯片,其靠得住性和不变性都已经获得了充实的市场验证和承认。

  其它,该加快卡还可适配种种x86处事器,国产CPU体系如热潮、申威、兆芯等;适配种种主流Linux操纵体系(CentOS/Ubuntu /Debian),包罗国产麒麟、Deepin;同时算丰SC系列加快卡产物也是海内首批支持百度PaddlePaddle深度进修开源框架的硬件产物之一。在2020年3月,百度的Paddle Lite推理开源框架公布和比特大陆实现全面适配。

  令人惊喜的汹涌算力

  全国武功,唯快不破。对安防种种以视频、图片为焦点AI说明要素的营业场景而言,每秒的图片吞吐量(image/second)指标至关重要,这意味着单张云端加快卡最大的峰值AI说明处理赏罚手段指标越高算力越强。

  从标称算力来看,该加快卡可提供高达105.6T INT8算力(Winograd 加快器打开的前提下),以及6.6T FP32算力,支持高精度的浮点计较和大容量的整型数值计较。

  a&s此次选择了评价AI芯片最常用的RESNET50开源模子,回收业界通用的ImageNet尺度的果真数据集(5万张图片),在SC5+加快卡标称最强的INT8计较机能长举办了实跑测试。在INT8,RESNET 50,Batch=4前提下SC5+图片吞吐机能到达3000+ image/second,高出NVIDIA T4约10%。其他种种模子下的吞吐机能也同样高出T4(如下图)。在Mobilenet v1模子下,SC5+的吞吐机能则更是到达了惊人的9000张以上。

图1 算力机能比拟:TESLA T4 vs SC5+.png

算力机能比拟:TESLA T4 vs SC5+

  超高算力得到比

  表里兼修,方成好手。通过计较得知,SC5+加快卡在VGG16等模子下的现实算力输出可以到达70T以上,这意味着其所行使的BM1684芯片的现实操作率到达了惊人的75%以上,对比之下,英伟达GPU的操作率则处于40%-50%的区间。

  以VGG19算力机能实测为例:

  初始配置:输入人脸图片数目为50,000张(判别率为224×224,RGB 3通道模式),线程数为3;计较精度:整数数据计较INT8;

  VGG19模子配置:

  基于Caffe 1.0.0-rc3(Convolutional Architecture for Fast Feature Embedding,卷积神经收集框架),Batch Size为32,别的为设置文件默认参数,模子单次运行所耗损的算力为39.26Gops;

  通过上述情形设置,可以准确计较出,在举办尺度的VGG19模子运算时,SC5+加快卡输出的现实算力为75.2T。

  换句话说,固然英伟达的GPU标称算力指标远远高于比特大陆提供的SC5+加快卡,而通过实测得出的结论来看,现实的算力得到比显然是比特大陆遥遥领先,由此也可以看出比特大陆的AI芯片架构计划确实有其独到之处。对最终客户来说,同样花一块钱,现实得到的算力远远高出同类产物,信托全部的客户城市乐意本身耗费真金白银买到的是现实算力而非是纸面上标称很高的算力指标。

  上风尽显的机能功耗比

  同样的,在机能功耗例如面,单元功耗下的SC5+输出现实算力超出NVIDIA T4的指标靠近一倍,证明SOPHON AI芯片框架的能效比上风明明(如下图)。

图2 机能功耗比:TESLA T4 vs SC5+.png

机能功耗比:TESLA T4 vs SC5+

  强盛的视频解码手段

  对安防应用场景而言,大量高清收集视频流的接入是最广泛应用的场景,摄像头的图像名目更是与日俱新,不绝晋升,从200万,300万,500万,到此刻的800万以致万万级像素的收集摄像机已经开始应用,AI理会起首必要对这些超高判别率的视频可能图像举办解码还原,再举办种种AI算法的理会计较。

  SC5+具备高达2880fps,约合114路1080P@25fps高清视频流的硬解码手段,堪称国产解码手段最强的AI加快卡。最大解码判别率可支持到8K级别(半及时)。

  在图片解码手段方面,SC5+单卡具备1440 img/s以上的图片解码手段。最大图片解码判别率可以到达32768*32768 pixels。这使得SC5+ 在理会某些超大型的拼接图像时,如家产流水线的长画幅持续检测图像、高判别率全景摄像机天生的多画面拼接图像等,具备富裕的解码手段。

  高度可扩展的视频转码手段

  SC5+具备支持将接入的所有视频资源转换为不低于32Kbps低码流(25帧、CIF判别率)和不低于1Mbps高码流(25帧)两种切合H.264尺度的码流。并可随板卡的数目增进举办线性扩展,支持超大容量的视频接入转码。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读