在砖使用源代码版本控制工作
您可以运行工作使用笔记本或Python代码位于一个偏远的Git存储库或砖回购。这个特性简化了创建和管理的生产工作和自动化持续部署:
你不需要创建一个单独的生产砖的回购,管理权限,并保持更新。
你可以防止意外更改生产工作,如本地编辑生产回购或改变开关的一个分支。
真理的工作过程定义单个源的远程存储库,并且每个工作运行与散列。
使用远程Git存储库中的源代码,你必须设置数据砖回购。
用笔记本从远程Git存储库
创建一个任务和一个笔记本位于一个偏远的Git存储库:
点击工作流在侧边栏,然后单击或者去一个现有的工作和添加一个新的任务。
如果这是一个新的工作,替换添加一个名称为你的工作…对你的工作名称。
输入一个名称的任务任务名称字段。
在类型下拉菜单,选择笔记本。
在源下拉菜单,选择Git提供者并点击编辑或添加一个git参考。的Git信息对话框出现了。
在Git信息为存储库对话框中,输入详细信息,包括存储库URL, Git提供者,Git参考。这个Git引用可以是一个分支,标签,或提交。
为路径笔记本电脑,进入一个相对路径位置,等
etl /笔记本电脑/
。当你进入相对路径,不要开始
/
或。/
,不包括笔记本文件扩展名,如. py
。例如,如果笔记本你想的绝对路径访问/笔记本电脑/ covid_eda_raw.py
,输入笔记本/ covid_eda_raw
在路径字段。点击创建。
使用Python代码从一个远程Git存储库
与Python代码创建一个任务位于一个偏远的Git存储库:
点击工作流在侧边栏,然后单击或者去一个现有的工作和添加一个新的任务。
如果这是一个新的工作,替换添加一个名称为你的工作…对你的工作名称。
输入一个名称的任务任务名称字段。
在类型下拉菜单,选择Python脚本。
在源下拉菜单,选择Git提供者并点击编辑或添加一个git参考。的Git信息对话框出现了。
在Git信息为存储库对话框中,输入详细信息,包括存储库URL, Git提供者,Git参考。这个Git引用可以是一个分支,标签,或提交。
为路径源位置,输入一个相对路径,如
etl / python / python_etl.py
。当你进入相对路径,不要开始
/
或。/
。例如,如果你想要的Python代码的绝对路径访问/ python / covid_eda_raw.py
,输入python / covid_eda_raw.py
在路径字段。点击创建。
当你查看运行历史任务运行的Python代码存储在远程Git存储库,任务运行细节面板包括Git细节,包括提交沙与运行。
从一个远程Git存储库添加额外的任务
额外的任务在一个多任务工作可以引用相同的远程存储库提交下列方法之一:
沙
的$分支/头
当git_branch
设置沙
的美元的标记
当git_tag
设置的价值
git_commit
你可以把笔记本和Python任务砖的工作,但是他们必须使用相同的Git参考。
使用一个砖回购
如果你喜欢使用砖回购的源代码,你可以克隆存储库成砖回购:
在侧边栏,去工作区>回购。选择添加按钮,并选择回购。
确保通过复制Git存储库创建回购选择并输入Git存储库的细节。
添加一个笔记本或Python代码从一个砖回购的工作任务,源下拉菜单,选择工作空间并输入到笔记本或Python代码的路径路径。