Databricks运行时6.2 for Genomics(不支持)
Databricks于2019年12月发布了这张图片。
Databricks Runtime for Genomics (Databricks Runtime Genomics)是一种变体Databricks Runtime 6.2(不支持)针对基因组和生物医学数据进行了优化。它是Databricks基因组学统一分析平台的一个组成部分。bob体育亚洲版bob体育客户端下载
有关更多信息,包括创建Databricks用于基因组学集群的运行时的说明,请参见基因组学导游.有关开发基因组学应用程序的更多信息,请参见基因组学导游.
新功能
Databricks Runtime 6.2 for Genomics是建立在Databricks Runtime 6.2之上的。有关Databricks Runtime 6.2中的新功能的信息,请参见Databricks Runtime 6.2(不支持)发行说明。
弗斯logistic回归
版本发光包含在Databricks运行时6.2 for Genomics提供了一个弗斯logistic回归检验.
用户定义的样品质量控制指标
您可以在数据框架中为每个样本聚合多个基因型aggregate_by_index.此函数允许您计算内置QC函数中包含的每个样品质量控制(QC)指标。
改进
管道变压器性能
的开销管变压器已经减少了大约一半。这种加速意味着您可以使用Databricks Runtime for Genomics来并行化命令行工具,而不会牺牲每核效率。
联合基因分型的鲁棒性
的联合基因分型Databricks Runtime 6.2 for Genomics提供的更有效地处理包含数千个条目的样本清单。此外,管道现在通过插入显式的no-calls优雅地处理缺失的gVCF块。
简化与LOFTEE的集成
Databricks Runtime for Genomics中包含的VEP注释管道提供了与LOFTEE.
Samtools 1.9
Samtools 1.9现在已安装。