您好,欢迎访问开云网站!

集团动态

联系开云

开云
联系人:杜经理
手机:18755199984
电话:0551-82601881
邮箱:sale.zcjd@qq.com
地址:合肥市巢湖市团结路与东塘路交口东方国际大厦8层
开云首页>>开云新闻>>集团动态>>开云-新工具可轻松搜索世界已知10%的基因—新闻—科学网

开云-新工具可轻松搜索世界已知10%的基因—新闻—科学网

发布日期:2024-06-23 作者:开云

一种功能近似在谷歌搜刮的计较东西已证实了它的前景——可以便宜且轻易地搜刮生物序列数据。开辟该东西的瑞士团队暗示,在一项道理验证研究中,他们操纵该东西成功索引了10%世界已知DNA、RNA和卵白质序列,一样的方式也能够用在完成其余部门。

日前,该进展在预印本平台bioRxiv上发布。这款名为MetaGraph的计较东西,可以将公然的序列数据组织并紧缩为可搜刮的格局,就像互联网搜刮引擎对网页和其内容所做的那样。由此发生的索引可供下载,也可经由过程门户网站取得,用户可以扫描包括数万亿对碱基对和数十亿个氨基酸的序列。

没有介入该工作的美国马里兰年夜学的计较生物学家Rob Patro说,这项研究“是一项庞大成绩,是对所有公然的测序数据进行索引这一重年夜挑战的里程碑。”如许的资本可以助力无数范畴的研究,从判定新病毒到揭露与疾病相干的RNA序列。固然MetaGraph其实不是独一一个旨在实现这一方针的项目,但该团队已建立了迄今最年夜的索引,而且利用本钱相对较低。

Patro指出,今朝,存储DNA、RNA和卵白质序列数据的存储库呈指数级增加。序列读取档案(SRA)是一个由美国国立卫生研究院国度生物手艺信息中间(NCBI)和其合作者运营的基因数据库,包括了来自人类和其他动物、植物和细菌等生物体的跨越5万亿个碱基对(50 PB碱基)。

今朝的生物信息学东西没法同时扫描这么大都据,特别是对那些还没有组装成基因组的序列,研究人员必需缩弁言列调集的规模。一些研究小组但愿经由过程将较年夜数据库中的序列紧缩成更有组织的数据布局或索引来解决这个问题,以便在可下载文件或在线门户中轻松搜刮。

2020年,瑞士苏黎世联邦理工学院的生物信息学家AndréKahles和计较机科学家Gunnar R?tsch和其同事展现了MetaGraph的初期版本。该团队利用称为德布鲁因图的数学布局暗示序列之间的堆叠,从SRA中索引了100多万笔记录,总计约3 PB。

此刻,该团队操纵MetaGraph的改良版本索引来自SRA和其他数据库的5个pb碱基,包罗来自微生物、真菌、植物、人类和人类肠道微生物组的序列。新发布的东西可以将几十太字节的数据紧缩到年夜约10gb——小到足以在一台小我电脑上运行。构建初始索引是很坚苦且昂贵的,所有SRA都要破费数十万美元,但此刻用户可以比现有手艺更廉价地查询数据集。

英国诺丁汉特伦特年夜学的生物信息学家和微生物学家Lesley Hoyles说,这项工作“很是使人兴奋”。跟着数据存储库的范围不竭膨胀,“任何可以削减计较存储和能源本钱的工具……对全球的研究人员来讲都是一个庞大优势。”Hoyles说,这类方式可以削减低收入和中等收入国度的科学家进行基因组研究的障碍。“工作可以在廉价的笔记本电脑上轻松完成。”

无独有偶,其他研究小组也在获得进展。客岁,法国巴斯德研究所从欧洲研究委员会取得了200万欧元,启动了IndexThePlanet项目,对SRA中的所稀有据进行编目。NCBI的研究开云体育app人员正在开辟索引东西Pebblescout。“今朝这是一个很是活跃的范畴。”英国巴斯年夜学的计较生物学家Zamin Iqbal说。他曾介入“所有细菌”项目,该项目旨在搜集细菌序列数据,使其更轻易搜刮。

Patro认为,因为受MetaGraph索引巨细的限制,其在一些特殊年夜的使命上可能比其他东西慢,好比同时从一个样本中查找数百万个序列。他弥补说,今朝还不清晰若何最好地用新的序列数据更新索引。还一个挑战是为项目供给资金,和随之而来的所有计较本钱。事实上,该东西终究是不是被普遍采取,将部门取决在“若何解决社会和行政方面的问题,即若何利用如斯年夜量的资本”。

Kahles和R?tsch对此暗示附和,他们但愿这项工作能鼓励其他集体,和NCBI或SRA等更年夜的组织的介入,并帮忙索引残剩90%的序列数据,供研究人员利用。

版权声明:凡本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来历和作者,且不得对内容作本色性改动;微信公家号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。


开云
专业 规范 诚信 共赢 创新 发展

18755199984/0551-82601881

( 服务咨询热线 )
地址:合肥市巢湖市团结路与东塘路交口东方国际大厦8层
Copyright © 2022 All Rights Reserved.
技术支持:无忧资源网   皖ICP备2023013513号-1