亚当

亚当是基因组数据处理库在Apache火花。是用来实现管道操作基因如BAM读取数据,萨姆和补习的文件。

用亚当在砖:

  1. 启动一个砖与这些集群运行时火花配置:

    # Hadoop配置org.apache.spark.serializer.KryoSerializerspark.kryo.registrator org.bdgenomics.adam.serialization.ADAMKryoRegistratorspark.hadoop.hadoopbam.bam。enable-bai-splitter真实
  2. 安装集群库:

    • Maven:org.bdgenomics.adam: adam-apis-spark3_2.12: <版本>

    • PyPI:bdgenomics.adam