澳大利亚基因组研究人员解决了大数据问题
澳大利亚基因组研究人员已经开发了解决方案,以解决大数据挑战,比以前可能的秩序更复杂。
在Yow讲话!2017年澳大利亚英联邦科学研究组织生物信息学高级研究科学家和研究团队领导者悉尼的软件开发人员会议(CSIRO)表示,对人类健康的关注导致了“实验以前无法使用大数据”。
为了解释数据问题的纯粹规模,虽然估计有关YouTube上的两个exabytes和Twitter上的一个Exabyte到2025年,那么当时人们寻求更好的健康结果产生了20个基因组数据。 。
Csiro一直在研究一个看起来肌营养侧面硬化剂(ALS)或运动神经元病的基因组标记物的项目。为此,它必须梳理到22,000个DNA配置文件或1.7万亿数据点,以寻找她所说的“大海捞针”的“针头”将识别倾向于ALS的人。
使用大数据和云建筑师Lynn Langit,也是一种扬声器,也是一个扬声器!,Csiro已经开发并部署了Variantspark以通过基因组数据进行搜索。基本上是一种用于基因组变体的机器学习平台,可降低误报的风险,VariantSpark对其他大规模数据分析,Langit和Bauer表示。
物联网(IoT)的出现和被描述为“所有内容的数据化”的langit将需要使用variantspark等工具,该工具已部署在Amazon Web服务(AWS)上,并且可能会削减执行时间探索性分析工作从小到几分钟。
鲍尔和她的团队计划在2018年在亚马逊市场上作为开源代码提供Variantspark。她说,在长期内,CSIRO计划在其周围开发一系列的商业工具和服务。
同时,CSIRO还在开发工具,以便为筛选胚胎具有特定疾病标记的胚胎。“将此视为基因组的搜索引擎,”Bauer说。
Bauer和Langit派遣了开幕式的YOW!这使得从良好的全球扬声器提供尖端软件开发见解的强大声誉。
在悉尼活动中,今年的其他高调演示者包括木质Zuill,Mob编程的先驱,开发人员在单个PC上将代码写在一起。
Zuill还支持Twitter上的#Noestimates运动,相信估算开发工作的成本,时间,风险和价值并不是对成功的软件开发的帮助。
该活动的家庭成长扬声器包括Data61的Tony Morris,他们在航空和解决该部门的数据管理问题方面解决了功能规划,以及Rea Group的Ken Scrambler,他详细介绍了功能规划的四年举措。
Greer Lucas,NAB的数字技术能力经理赞助了会议,该会议表示,随着对软件的投资现在,在Y2K以来的规模上,该会议是及时的,并且该公司被“进入酷炫的事情而不是维护”。