基因组学领域已经成熟到一个阶段,DNA测序项目已经达到人口规模。虽然许多组织已经投资于像英国生物银行这样的大型基因组数据集,但很少有专业知识或适当的技术架构来将这些大量的原始DNAseq数据转化为可操作的见解。
Regeneron是一家领先的生物技术公司,致力于创造治疗创新,已经建立了世界上最全面的基因数据库之一,拥有超过50万个外显子组。在将这些数据转化为新的治疗方法的过程中,Regeneron遇到了许多挑战。例如,如何对>300B数据点进行快速而准确的查询?如何加快对结核病规模数据进行新颖的统计检验?
在本次会议上,Regeneron将分享他们在建立世界上最大的基因数据库时所面临的挑战,他们如何通过由Apache Spark™、Databricks和AWS支持的可扩展和高性能的信息基础设施克服这些挑战,以及一路走来学到的关键经验教训。
参加本次网络研讨会,了解: