目前医疗系统工程来处理当前情况(N = 1)。他们显示的数据对于一个给定的病人,他们打开记录对于一个给定的病人,他们回到存储新的数据记录。卫生保健提供者将保持他们的头病人历史和每个病人他们看到的结果。专业医疗机构,像梅奥,依靠这些知识在每个医生为患者提供最好的治疗罕见,罕见的情况。然而,无论多么聪明的头脑,不能将提供高质量的卫生保健提供者在海量数据中发现的比较基因组学。只是变体在病人代表~ 500万患者之间的差异。分析工具需要让研究者和临床医生大型数据集可以理解。这些分析工具前所未有的性能需求。在未来,个性化医学要求医生使用数据从以前类似案件优化当前的护理个人(N + 1)。有两个重要的功能,必须完成1)构建实时数据驱动的工具提供价值的治疗,改善和2)提供先进的分析结果对个别研究人员和联盟,使更多的数据驱动的探索和发现改善护理。 This presentation will discuss 9 important data management problems once we can identify variants (using tools such as Adam on Spark). Our group is using Spark to solve each of these problems. We are seeking engagement from the open source community to help us solve these problems and provide an open platform for personalized genomics.
翻译我的生活工作都在建模和计算系统遗传学的实际应用。我已经建立了基因组注释引擎用于更好地理解微生物。这已经应用在生物能源、bio-terroism和临床疫情监测和预防。我也应用这些技能在构建小说注释引擎分析人类变异。在临床中,我们想知道如果一个变化可能导致疾病和自然发生的人群中;我们希望滤波器数以百万计的变体找到那些最有可能导致疾病。