用云开裂基因组码
CIO需要冠军数字变革,因为它领导力量发展
顾问说,银行理想地放置在填补身份无效的银行
神奇宝贝Go Guide App随半百万的下载Hacks Android设备
Mobileye即将到来的自动驾驶汽车芯片将打开一个新的MIPS CPU
CBI说,慢速技术采用与英国商业中的低生产率相关联。
这种新的编程语言有助于在大数据上提升4倍
伦敦的三分之一技术公司因Brexit而失去潜在的雇用
人力资源科技的转型议程“正在收集步伐”
你想要炸薯条吗?Inkling的目标是重新验证的内容
可再生能源占世界电力容量的近三分之一
Adobe修复了Flash Player和Digital Editions中的临界缺陷
黑客在比特币偷了近80米
微软终于修复了双重打印错误,但更多的修补问题织布机
以下是思科网络将为Apple Devices提供有利的状态
黑客对他们被盗的NSA黑客工具的需求很少
医生:电子健康记录提高成本,不要帮助患者结果
近70%的老师认为他们没有教学编码的技能
由于Brexit不确定性,英国初创公司转向欧盟资助后挤满了众所周知
皇家伦敦医院使用虚拟现实在患者身上运营
HPE Exec表示,现在为欧盟的隐私法规革命计划
CCS将G-Cloud 9延伸至2019年5月
AT&T即将到来的SD-WAN服务将分布到FlexWare中
政府Brexit研究仅提供技术部门的背景
£115构造的面具绕过iphone x面部ID验证
2017年十大存储和备份故事
空间组织转储NAS进行对象存储以获得空间
IBM的Joanna Davinson成为新的家庭办公室技术老板
这种智能光线比一个更明亮
美国和工程工资在2015年上涨近4%
伦敦在2017年吸引了纪录科技投资
AWS宣布为情报社区机构宣布秘密云区域
由美国一个20岁男子被砍塞的优步
Facebook Spins Yarn替换NPM JavaScript Packager
伦敦在2017年吸引了纪录科技投资
汇丰招聘来自谷歌的CIO
Yoox Net-A-Porter Group任命第一首席数据和分析官
野外的代码来感染数百万个IOT设备进行攻击DDOS攻击
对于新角色,它是神奇宝贝等待
CA Technologies CEO说,创新的创新键
英格兰银行希望下一个支付系统被布置准备就绪
Wi-Fi与LTE可以是移动过山车的开始
迪拜电力和水务局继续智能转型和测试区块链
2017年十大CIO访谈
作为自动驾驶汽车打到匹兹堡的道路,波士顿希望下一步
D-Wave将于明年发货了2,000 QUBITUMPORM计算机
法院日期为邮局会计系统试验
Snapchat的眼镜 - 我们到目前为止所知道的
优步漏洞影响了270万英国人
大众汽车启动了一个新的网络安全公司,以防止汽车黑客攻击
您的位置:首页 >行业动态 >

用云开裂基因组码

2021-07-24 11:44:02 [来源]:

随着世界上有一半的人口的基因组预计将被2025年被测序,科学家正在为他们需要处理的数据量交错。

预测每年30个菌尿率的基因组数据已经被丹尼斯鲍尔等研究人员使用,以解锁疾病的疾病等疾病的基因组代码,这影响着名的英国理论物理学家斯蒂芬霍金。

嘎吱嘎吱的基因组数据可能是一个繁琐的过程。随着含有30亿DNA“字母”的人类基因组,单挑出导致诸如大型样品大小的疾病的基因类似于在大海捞针中寻找针。

据鲍尔介绍,澳大利亚英联邦科学和工业研究组织(CSIRO)的国际认可的生物信息学研究员和团队领导者,以前的机器学习技术无法应对纯粹的基因组数据。

例如,谷歌的行星算法擅长解决涉及数十万个样本的机器学习任务,比如每种样品,比如每种样本的1,000个数据点,“Bauer说。“但我们每个样本有30亿数据点。”

为了克服CSIRO创建Variantspark的鲍尔和她的团队,一种机器学习库,可用于使用Apache Spark Engine实时分析基因组数据以进行大数据处理。VariantSpark还可用于在其他应用中进行分裂数据,例如转录。

通过鉴定和分析疾病引起的基因,下一步是测试使用称为Crispr的基因组工程技术,以编辑导致人类某些疾病的基因。这种微妙的任务必须以高水平的精度进行,没有错误的空间。

为了提高成功率,Bauer表示有必要加快识别可以进行基因编辑的位置的过程。

“这样做对于一个基因很容易,并且可以通过平行化在几秒钟内完成。但是,对于使用Web服务的人类基因组中的所有基因很难这样做,“她说,并指出与亚马逊Web服务(AWS)Lambda无法计算服务,现在可以”触发许多函数并行触发并且足够便宜“。

那个说,鲍尔,谁会在Yow讲话!2017年在悉尼的会议上,承认兰姆达服务有局限性。“只有那么多的数据和请求,您可以使用Lambda函数来处理,因此我们必须提出替代方法,并将其并行为工作量,”她说。

Bauer的团队必须找到巧妙的方式来使他们的复杂研究工作适应AWS和其他人提供的,因为云提供商大多迎合了通用用例。

除了嘎吱嘎吱的基因组数据外,Bauer还使用AWS以安全的方式与世界各地的其他研究人员共享数据。

“我们上传到S3存储的数据被加密并保持加密,它只在计算节点上解密。我们还可以拥有日志文件和记录审计报告,以证明没有人可以访问处理管道,“Bauer说。

向前迈进,鲍尔不会认为,AWS的喜欢将开始提供专业的云服务,该专业云服务往往是往往是知识和技术的最前沿。

“即使云提供商要满足我们的需求,我们明天会有很大的要求。这也是为什么我们是第一个采用云并租用最新技术的原因是我们所做的事情,“她说。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。