可按需
医疗数字化导致了数据的爆炸式增长。付款人、供应商和制药组织都在生成pb级的数据,从电子健康记录(EHR)到医疗图像,再到DNA序列数据等等。今天的挑战是如何为大规模的分析和机器学习(ML)准备这些大型、多样化的数据集,以解锁新的患者见解。不幸的是,传统技术投资创造了一种环境,数据被锁在竖井中,使得很难联合数据和扩展分析。许多组织试图通过跨数据仓库复制数据来缓解这一问题,但这导致了更高的成本和数据治理问题。由于缺乏对高级分析和机器学习的支持,这些挑战更加复杂。解决方案是在云中建立一个现代临床数据湖。
在本次虚拟研讨会中,我们将分享数据分析的统一方法如何加速分析和ML项目,以交付医疗保健和生命科学行业的广泛用例。更具体地说,你将学习如何:
-使用强大的开源技术(如Delta lake和Apache SparkTM)构建可扩展的临床数据湖
-摄取和准备流EHR数据用于下游分析
-构建患者队列浏览器,并使用ML预测疾病风险和护理利用率
-使用MLflow在可重复和符合hipaa的环境中协作构建和跟踪ML实验
现在看!