Amir Kermany是Databricks的健康和生命科学解决方案架构师,他利用自己在基因组学和机器学习方面的专业知识,帮助该领域的公司解决问题,从大量健康相关数据集中生成可操作的见解。
Amir过去的职位包括AncestryDNA的高级科学家,Shopify的高级数据科学家,霍华德休斯医学研究所和蒙特利尔大学的博士后学者。他拥有数学生物学博士学位,电气工程硕士学位和理学士学位。在物理。
太平洋时间2020年11月17日下午04:00
无论是通过基因组测序、电子健康记录、成像系统还是医疗物联网,医疗保健、生命科学和农业公司都在生成pb级的数据。当我们能够将这些数据集混合在一起时,这些数据集的价值就会增长,例如将基因组学和ehr衍生的表型集成在一起以发现目标,或将IoMT数据与医学图像混合以预测患者的疾病严重程度。在本节课中,我们将讨论客户在混合这些数据类型时所面临的挑战。然后,我们将介绍一个使用Databricks Unified Data Analytics Platform将这些数据类型统一到单个数据湖的体系结构,并讨论该体系结构可以bob体育客户端下载支持的用例。然后,我们将深入研究使用Glow项目的全基因组回归方法来加速基因型和表型数据的联合分析的工作量。随后,医疗保健和生命科学技术总监Frank Austin Nothaft将回答有关此解决方案或您在医疗保健、生命科学或农业领域可能遇到的任何其他用例问题。
主讲人:Amir Kermany
SEIR模型是一种广泛用于模拟传染病传播的模型。在最简单的形式中,SEIR模型假设种群中的个体可以假设四种状态中的任何一种:易感、暴露、感染和恢复(或去除),系统的演化被建模为常微分方程系统。虽然这个简单的模型在模拟大型密集种群时表现良好,但它没有捕捉到种群子结构和相互作用中变化的影响。
为了解决这些问题,一般的SEIR模型将人口建模为一个网络,其中节点是个体,边表示个体之间的交互。该模型在covid - 19大流行期间引起了更多关注,有一些python实现可以在单个节点上运行模拟。
在本次演讲中,我们将讨论使用Spark和GraphFrames等图形分析库实现广义SEIR模型,并使用Databricks使用随机模拟方法预测Covid19的传播。