砖资产包的是什么?
预览
这个特性是在私人预览。尝试它,伸出你的砖接触。
砖资产包也简称为包,使您能够以编程方式验证、部署和运行砖砖等工作流的工作,δ生活表管道和MLOps堆栈。一捆是一家集包含一个或多个相关文件:
任何本地构件(如源代码)部署到一个远程数据砖工作区之前运行任何相关数据砖工作流。
砖的声明和设置工作,三角洲生活表管道,或MLOps栈行动部署的工件进入工作区。
使用包的好处是什么?
包是很有用的建模和自动化的工作流代码。这允许您以避免手动点击用户界面设置和管理工作,管道和堆栈。主要优点包括:
消除手工流程。基于代码的方法使它更容易在较短的时间内做更多的事情。
开发人员的工作关注编码任务,而不是基础设施维护。
IT专业人士的工作关注建模基础设施而不是手动点击屏幕的设置。
确保一致的可重复性在频繁的调动和re-execution代码。
提供的代码版本历史和基础设施为更好的故障排除工作,治理和灾难恢复。
当我应该使用包?
对包一些理想的场景包括:
经常部署本地Python文件或Python, R, Scala,或SQL笔记本从你当地的开发机砖工作区,运行部署文件或笔记本砖的工作,做出任何必要的代码更改,并再次部署和运行。
经常部署本地Python或SQL笔记本从你当地的开发机砖工作区,运行部署笔记本三角洲住表管道,使任何必要的管道更新和重新部署和运行。
经常运行多任务数据砖砖工作空间内工作,修改作业的设置,并再次运行。
迭代运行一个砖砖非生产的工作区,然后工作,如果测试通过,再次运行该工作,但使用不同的设置在一个单独的砖生产工作区。
迭代ML问题更快,ML管线资源管理(培训、批量推理工作等等)通过ML的项目从一开始就遵循生产最佳实践。
我如何使用包?
一个包设置文件定义了构件部署,砖工作区部署的工件,砖的工作流的行动部署的工件。
工件可以是任何砖工作流支持的文件类型(比如笔记本电脑)。YAML格式和表达的工作流设置必须坚持包设置语法。
在您创建一个包,你验证它,部署,并运行它。的包
命令组内数据砖CLI 0.200及以上版本允许您以编程方式验证、部署和运行bundle。
创建、验证、部署和运行一个包,看到的砖资产包的开发工作任务。
下一个步骤
创建一个部署包砖的工作空间,然后运行一个笔记本,笔记本作为一个砖的工作部署。看到砖与砖资产包工作自动化。
创建一个部署一个笔记本包砖工作区,然后运行,部署笔记本三角洲住表管道。看到自动化δ生活表管道砖资产包。
创建一个包,一个部署和运行MLOps堆栈。看到砖资产包MLOps堆栈。
包添加到CI / CD(持续集成/持续部署)在GitHub工作流。看到运行CI / CD工作流与数据砖资产包和GitHub的行动。