在砖使用源代码版本控制工作

您可以运行工作使用笔记本或Python代码位于一个偏远的Git存储库或砖回购。这个特性简化了创建和管理的生产工作和自动化持续部署:

  • 你不需要创建一个单独的生产砖的回购,管理权限,并保持更新。

  • 你可以防止意外更改生产工作,如本地编辑生产回购或改变开关的一个分支。

  • 真理的工作过程定义单个源的远程存储库,并且每个工作运行与散列。

使用远程Git存储库中的源代码,你必须设置数据砖回购

用笔记本从远程Git存储库

创建一个任务和一个笔记本位于一个偏远的Git存储库:

  1. 点击工作图标工作流在侧边栏,然后单击创建工作按钮或者去一个现有的工作和添加一个新的任务。

  2. 如果这是一个新的工作,替换添加一个名称为你的工作…对你的工作名称。

  3. 输入一个名称的任务任务名称字段。

  4. 类型下拉菜单,选择笔记本

  5. 下拉菜单,选择Git提供者并点击编辑添加一个git参考。的Git信息对话框出现了。

  6. Git信息为存储库对话框中,输入详细信息,包括存储库URL, Git提供者,Git参考。这个Git引用可以是一个分支,标签,或提交。

    路径笔记本电脑,进入一个相对路径位置,等etl /笔记本电脑/

    当你进入相对路径,不要开始/。/,不包括笔记本文件扩展名,如. py。例如,如果笔记本你想的绝对路径访问/笔记本电脑/ covid_eda_raw.py,输入笔记本/ covid_eda_raw在路径字段。

  7. 点击创建

使用Python代码从一个远程Git存储库

与Python代码创建一个任务位于一个偏远的Git存储库:

  1. 点击工作图标工作流在侧边栏,然后单击创建工作按钮或者去一个现有的工作和添加一个新的任务。

  2. 如果这是一个新的工作,替换添加一个名称为你的工作…对你的工作名称。

  3. 输入一个名称的任务任务名称字段。

  4. 类型下拉菜单,选择Python脚本

  5. 下拉菜单,选择Git提供者并点击编辑添加一个git参考。的Git信息对话框出现了。

  6. Git信息为存储库对话框中,输入详细信息,包括存储库URL, Git提供者,Git参考。这个Git引用可以是一个分支,标签,或提交。

    路径源位置,输入一个相对路径,如etl / python / python_etl.py

    当你进入相对路径,不要开始/。/。例如,如果你想要的Python代码的绝对路径访问/ python / covid_eda_raw.py,输入python / covid_eda_raw.py在路径字段。

  7. 点击创建

当你查看运行历史任务运行的Python代码存储在远程Git存储库,任务运行细节面板包括Git细节,包括提交沙与运行。

从一个远程Git存储库添加额外的任务

额外的任务在一个多任务工作可以引用相同的远程存储库提交下列方法之一:

  • $分支/头git_branch设置

  • 美元的标记git_tag设置

  • 的价值git_commit

你可以把笔记本和Python任务砖的工作,但是他们必须使用相同的Git参考。

使用一个砖回购

如果你喜欢使用砖回购的源代码,你可以克隆存储库成砖回购:

  1. 在侧边栏,去工作区>回购。选择添加按钮,并选择回购

  2. 确保通过复制Git存储库创建回购选择并输入Git存储库的细节。

添加一个笔记本或Python代码从一个砖回购的工作任务,下拉菜单,选择工作空间并输入到笔记本或Python代码的路径路径

从IDE访问笔记本

如果你需要访问笔记本电脑从一个集成开发环境,确保你有发表评论#笔记本顶部的笔记本源代码文件。区分普通Python文件和一个砖Python语言的笔记本以源代码格式导出数据砖补充道#笔记本顶部的笔记本源代码文件。当你导入笔记本,砖承认它和进口的笔记本电脑,而不是作为一个Python模块。

故障排除

错误消息:

运行结果不可用:工作失败与错误消息笔记本了path-to-your-notebook

可能的原因:

你的笔记本是失踪的评论#笔记本在笔记本的源代码文件的顶部,或在评论笔记本资本化必须以小写字母开始的时候吗n