加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 正文

生命科学领域的“超存”挑战:数据如何存储100年?

发布时间:2019-12-24 02:29:39 所属栏目:创业 来源:互联网
导读:大咖先容:(从左往右) 宋家雨,Dostor存储在线总编辑 谢永生,华中科技大学武汉光电国度研究中心传授 曾文君,深圳国度基因库生物信息数据库主任 孙 斌,海潮存储产物线副总司理 正文: 克日,在DOIT存储峰会上,海潮存储产物线副总司理孙斌、华中科技大学
生命科学规模的“超存”挑衅:数据怎样存储100年?

大咖先容:(从左往右)

宋家雨,Dostor存储在线总编辑

谢永生,华中科技大学武汉光电国度研究中心传授

曾文君,深圳国度基因库生物信息数据库主任

孙 斌,海潮存储产物线副总司理

正文:

克日,在DOIT存储峰会上,海潮存储产物线副总司理孙斌、华中科技大学武汉光电国度研究中心传授谢永生、深圳国度基因库生物信息数据库主任曾文君,配合就基因研究带来的数据存储挑衅接管了媒体采访。

基因库建树对付社会成长具有重要意义,而基因库的背后承载的是海量的数据存储。2019年是国度基因库建成的第3周年,现已具备88PB数据存储手段、691万亿次/秒计较手段。制止今朝,国度基因库支持着海表里600多个项目,那么在技能上怎样同时满意这些营业的必要?基因库数据有哪些差异的特性?基因数据在数据存储、数据掩护和数据迁徙上面对着哪些技能挑衅?让我们听听大咖的解答。

宋家雨:基因是一个出格热的话题,它使人类在消病延年的路上不绝向前推进,在生命科学基因研究规模,有什么样的应用?对存储提出奈何的需求和挑衅?

生命科学规模的“超存”挑衅:数据怎样存储100年?

深圳国际基因库生物信息数据库主任 曾文君

曾文君:BT(生物技能)的成长拉着IT在走,在生命科学规模,有个词叫“超存”,由于对存储的要求很是庞大,远超对算力的要求。

一小我私人的基因组,它的原始巨细或许是3个GB阁下,包括了30亿个碱基,由A、T、C、G四个碱基对构成的。在全基因测序进程中,为了担保基因数据的完备性,必要平行测序30次,当最终测序完成后,全基因组数据将到达或许100GB阁下,只仅仅是一个单体,可想而知在普及的生齿中,这是一个很是复杂的数据量。

整个基因说明研究,分为基因测序、基因数据说明和基因数据归档三个阶段。其一,基因测序的整个进程是不应承被间断的,这就要求支撑测序应用的存储体系,具备极致的不变性和靠得住性;其它,基因测序25微秒收罗一幅高清楚图像,对机能要求也高出了现有闪存固态盘的最高带宽,必需回收更快的傲腾固态盘;其二,基因数据说明事变中,对存储体系的机能、小文件处理赏罚手段提出很高要求;其三,在数据归档阶段,必要将海量基因数据恒久、完备、安详的生涯起来,存储体系的采购本钱、能耗,是一个很大的挑衅。

总的来说,BT(生物技能)的成长拉着IT在走,数据怎么存、怎么算、怎么恒久生涯,对IT来说,尤其存储来说,是个很是庞大的挑衅。我们知道“超算”,它是对算力的要求,可是在生命科学规模,有个词叫“超存”,由于对存储的要求很是庞大,远超对算力的要求。

宋家雨:生命科学基因研究背后,面对着海量数据存储和应用的挑衅,学术界有哪些新的存储技能趋势?

生命科学规模的“超存”挑衅:数据怎样存储100年?

华中科技大学武汉光电国度研究中心传授 谢永生

谢永生:“数据怎样存储100年,是个具有挑衅性的题目,出格是基因说明研究这种必要恒久存储的应用。全息存储、玻璃存储、打破光学的超衍……这些技能,很是值得我们加速速率去研究。”

计较机和数据专家提出怎样停止数字暗中期间的命题,是指跟着IT硬件的失效和软件的过期,很大都字信息在将来也许由于呆板和软件措施无法读取而丢失。“数据怎样存储100年”,是个具有挑衅性的题目。正云云刻的基因数据,理论上说应该是永久生涯下去的。

针对这一命题,有三种主流的将来技能。

起首,最靠近产物化的是全息存储技能。用这种技能可以生涯50年。全息存储办理了光盘介质容量小、密度低的题目,今朝全息存储技能已经可以做到单张光盘存储1.5TB容量,再今后成长,方针是8TB,这样就办理了存储容量的题目。

其次,玻璃盘技能。5微米可以记一层,2毫米可以记几百层,以是理论上它的容量可以做到很大,一张盘可以存300TB,并且玻璃是很不变的介质,可以永世生涯。

再次,打破光学衍射极限的超判别光存储技能。该技能用双光束的要领打破了光学衍射物理极限,将光点缩小到此刻的1%。这个技能上已经实现了,比此刻光盘面密度进步了100倍,它还可以多层,实现几个数目级的进步。

这些技能,很是值得我们加速速率去研究,由于存储的需求在哪里,出格是基因说明研究这种必要恒久存储的应用,在测序时要求存储高机能、高靠得住,恒久生涯时,要求存储大容量、高性价比,以是面临这些挑衅,我们有技能正在应对,可是这必要时刻的守候。

宋家雨:面临生命科学规模的海量数据存储和应用需求,海潮拥有完美的存储产物线,既有漫衍式存储也有齐集式存储,客户到底该怎样选择?

生命科学规模的“超存”挑衅:数据怎样存储100年?

海潮存储产物线副总司理 孙斌

孙斌:到底是行使漫衍式架构照旧齐集式架构,每每是由客户的应用范例、应用情形和所必要的存储机能、容量、本钱、功耗等等这些身分抉择的,我们会按照各种需求给出最得当营业应用的办理方案。

我们称2019年是新数据期间元年,在新数据期间,必要有与之对应的新存储之道,海潮会针对差异行业、差异规模和差异客户应用梳理我们的存储办理方案。而生命科学规模,是海潮很是垂青的规模,今朝我们的客户包罗生命科学研究体系、芯片研究企业、高校等等。

我们发明生命科学规模所行使的存储的架构,大都是漫衍式存储,但尚有一部门是齐集式存储架构。到底是行使漫衍式架构照旧齐集式架构,每每是由客户的应用范例、应用情形和所必要的存储机能、容量、本钱、功耗等等这些身分抉择的,我们会按照各种需求给出最得当营业应用的办理方案。

生命科学规模的“超存”挑衅:数据怎样存储100年?

Dostor存储在线总编辑 宋家雨

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读