用dbx同步本地文件与远程实时工作区
提示
本文描述了如何使用dbx同步
本身。的砖扩展Visual Studio代码已包括功能类似dbx同步
代码集成到Visual Studio IDE。
另外,请注意,dbx同步
可以从本地同步文件更改开发机器DBFS、空间位置和砖回购在你的砖工作区。< vscode-ext >支持同步文件更改只工作空间用户(/用户
)文件和数据砖回购(/回购
)。
请注意
本文将介绍dbx
砖实验室,是按原样提供,不支持通过客户技术支持渠道砖。问题和特性请求可以通过沟通问题页面的databrickslabs / dbx在GitHub回购。
您可以执行实时同步的变化与相应的文件在您的本地开发机器砖工作区使用的文件dbx通过砖实验室。这些可以在工作区文件DBFS或在砖回购。
实时文件同步dbx
(也称为dbx同步
)对代码快速发展的情况下是很有用的。例如,您可以使用当地的集成开发环境(IDE)生产力特性,比如语法高亮显示、智能代码补全,代码产品毛羽,测试和调试。然后您可以立即进入工作区和运行您的代码更新。
dbx同步
开发工作流程
有两个开发工作流dbx同步
,一个DBFS和另一个砖回购。
典型的开发流程dbx同步
和DBFS是:
确定一个本地目录,其中包含您想要同步的文件DBFS。
确定你想要的路径DBFS同步(或者让你当地的目录
dbx同步
为你创建一个默认DBFS路径)。运行
dbx同步dbfs
同步你的本地目录DBFS路径。dbx同步
开始看您的本地目录的任何文件更改。根据需要更改文件在您的本地目录。
dbx同步
这些变化适用于相应的实时DBFS路径中的文件。
典型的开发流程dbx同步
和砖回购是:
创建一个存储库和一个Git提供者砖回购协议的支持,如果你已经没有可用的存储库。
克隆回购到砖工作区中。
克隆回购到本地开发的机器。
运行
dbx同步回购
把当地的克隆回购和工作区克隆回购。dbx同步
开始看您的本地目录的任何文件更改。更改文件在您的本地克隆回购。
dbx同步
这些变化适用于相应的文件实时数据砖回购。定期推送更新文件从您的工作区中克隆的回购Git提供者,因此回购保持最新Git提供者。
重要的
dbx同步
只执行单向的、实时的同步文件更改从你当地的开发机远程工作区。因此,砖不建议你开始改变砖工作区所监视的文件dbx同步
。如果你必须这样workspace-initiated文件更改,那么您还必须做到以下几点:
文件DBFS变化,使相应的手动修改本地文件。
砖回购的文件更改,把文件从您的工作空间变为你的Git提供者。本地开发机器上,拉出这些文件从你的Git提供者。
需求
如果你想使用dbx同步
砖回购,砖工作区必须符合下列要求:
一个克隆与Git存储库的提供者,而不是必需的,是建议。
本地开发机器上,您必须安装以下:
Python版本3.8或更高版本。检查是否安装Python,检查你的安装Python版本,运行
python——版本
在你的终端或PowerShell。python的版本
请注意
一些设施
python
你可能需要使用吗python3
而不是python
。如果是这样,替代python
与python3
在这篇文章。皮普。检查是否
皮普
安装,检查你的安装吗皮普
版本,运行皮普——版本
或python- m皮普——版本
。皮普,版本#还是……python - m pip -版本
请注意
一些设施
皮普
你可能需要使用吗pip3
而不是皮普
。如果是这样,替代皮普
与pip3
在这篇文章。dbx0.8.0或以上版本。检查是否
dbx
安装,检查你的安装吗dbx
版本,运行dbx——版本
。安装dbx
从Python包指数(PyPI)运行皮普安装dbx
或python- m皮普安装dbx
。(dbx
包括dbx同步。)#检查dbx是否安装,并检查它的版本。dbx——版本#安装dbx。pip安装dbx#还是……python - m pip安装dbx
的砖CLI或低于0.17版本,设置身份验证。遗留数据砖CLI(砖CLI的0.17版)是自动安装时安装
dbx
。这种身份验证可以设置本地开发机器上的一个或两个以下位置:在
DATABRICKS_HOST
和DATABRICKS_TOKEN
环境变量(与遗留数据砖CLI 0.8.0版开始)。在一个砖配置概要文件在你的
.databrickscfg
文件。
dbx
分别在这两个位置查找身份验证凭证。dbx
只使用它找到的第一组匹配的凭证。请注意
如果你使用一个
.databrickscfg
文件,dbx同步
在这个文件中查找一个配置概要文件命名默认的
默认情况下。要指定一个不同的配置文件,可以使用——简介
运行时选项dbx同步
命令,在本文的后面。dbx
不支持使用吗. netrc申请认证。如果你想使用
dbx同步
砖回购协议,本地Git克隆存储库的提供者,而不是必需的,是建议。执行当地的克隆,咨询你的Git提供者的文档。
使用DBFSdbx同步
从终端或PowerShell本地开发机器上,改变目录包含文件你想同步DBFS砖工作区。
运行dbx同步命令来同步您的本地目录在您的工作区DBFS,如下。(不要忘记点(
。
)在最后,这代表当前目录。)dbx dbfs——源同步。
提示
指定一个不同的源目录,替换点(
。
一条不同的道路。请注意
如果错误
错误:没有这样的命令“同步”
看来,你的安装dbx
可能是过时了。为了解决这个问题,运行皮普安装——升级dbx = = <版本>
或python- m皮普安装——升级dbx = =版本
,在那里<版本>
是最新版本的吗dbx
。这个版本号上可以找到PyPI dbx的网页。pip安装,升级dbx= =<版本>#还是……python - m pip安装,升级dbx= =版本
dbx同步
开始同步文件在你当前的本地目录与文件在以下DBFS路径在工作区中。dbx同步
证实了这种通过印刷目标基地路径
其次是DBFS路径,例如:/ tmp /用户/ < your-Databricks-username > / < local-directory-name >
提示
指定一个不同的用户名或DBFS路径,指定
——用户
和——桌子
当你运行选项,分别dbx同步
。如有需要,修改你的本地文件。
重要的
你必须保持你的终端或PowerShell开放
dbx同步
继续同步。如果你闭上你的终端或PowerShell,dbx同步
停止看文件和停止同步变化。恢复文件同步变化,重复这个过程从一开始。根据需要,验证您的文件更改在前面的路径在DBFS工作区。
使用砖回购dbx同步
从终端或PowerShell本地开发机器上,改变根目录,其中包含与Git存储库的克隆提供者。
砖的工作区,确定砖回购的名称,你想同步本地克隆回购。你可以找到这个回购名称点击回购在您的工作空间的侧边栏。
本地开发机器上运行dbx同步命令来同步您的本地克隆存储库工作区中的砖回购协议如下,更换
< your-repo-name >
砖回购协议的回购的名称。(不要忘记点(。
)在最后,这代表当前目录。)dbx回购- d < your-repo-name >——源同步。
提示
指定一个不同的源目录,替换点(
。
一条不同的道路。请注意
如果错误
错误:没有这样的命令“同步”
看来,你的安装dbx
可能是过时了。为了解决这个问题,运行皮普安装——升级dbx = = <版本>
或python- m皮普安装——升级dbx = =版本
,在那里<版本>
是最新版本的吗dbx
。这个版本号上可以找到PyPI dbx的网页。pip安装,升级dbx= =<版本>#还是……python - m pip安装,升级dbx= =版本
dbx同步
开始同步文件在您的本地克隆存储库工作区中的文件数据砖回购。dbx同步
证实了这种通过印刷目标基地路径
其次是砖回购的路径,例如:/回购/ < your-Databricks-username > / < your-repo-name >
提示
指定一个不同的用户名或回购名称,指定
——用户
和——dest-repo
当你运行选项,分别dbx同步
。如有需要,修改你的本地文件。
重要的
你必须保持你的终端或PowerShell开放
dbx同步
继续同步。如果你闭上你的终端或PowerShell,dbx同步
停止看文件和停止同步变化。恢复文件同步变化,重复这个过程从一开始。根据需要,验证文件工作区中的砖回购的变化。
额外的资源
databrickslabs / dbx在GitHub库