准备数据和环境毫升和DL
本节描述如何准备你的数据和你的数据砖机器学习更深的学习环境。
准备环境
砖运行时机器学习(砖运行时的ML)是一个准备好环境优化的机器学习和数据科学。砖运行时毫升包含许多外部库,包括TensorFlow PyTorch, Horovod, scikit-learn XGBoost,提高性能和提供扩展,包括GPU加速XGBoost、分布式深度学习使用HorovodRunner,检查点使用模型砖(DBFS)保险丝挂载文件系统。
使用砖运行时毫升,选择ML版本的运行时当你创建您的集群。
请注意
在统一目录访问数据机器学习工作流,您必须使用一个单用户访问。共享集群不兼容数据砖运行时机器学习。
使用GPU集群
您可以创建集群GPU加速深度学习任务。创建砖GPU集群的信息,请参阅GPU-enabled集群。砖运行时毫升包括GPU硬件驱动程序和NVIDIA CUDA等库。