砖扩展Visual Studio代码教程
砖扩展Visual Studio代码允许您连接到远程数据砖的工作区Visual Studio代码集成开发环境(IDE)在当地的开发机器上运行。通过这些连接,您可以:
同步本地代码Visual Studio中开发的代码的代码在你的远程工作空间。
从Visual Studio代码运行本地Python代码文件在远程砖集群的工作区。
运行本地Python代码文件(
. py
)和Python, R, Scala, SQL笔记本(. py
,.ipynb
,r
,. scala
,. sql
)从Visual Studio代码自动砖在远程工作的工作区。
请注意
的砖扩展Visual Studio代码支持运行R, Scala和SQL笔记本自动工作,但是不提供任何更深的Visual Studio代码中支持这些语言。
本文演示了如何快速开始使用砖扩展Visual Studio代码通过运行一个基本的Python代码文件在远程砖集群的工作区。
这个实践教程假定:
你已经Visual Studio代码1.69.1或更高版本的Python代码的安装和配置。看到设置Visual Studio代码和开始使用Python在VS代码。
Visual Studio代码已经运行,当地项目打开。
你已经生成的目标数据砖的砖个人访问令牌的工作区。看到砖个人访问令牌认证。
你已经添加了你的砖个人作为一个访问令牌
令牌
连同你的领域工作区实例URL例如,https://1234567890123456.7.gcp.www.neidfyre.com
,作为一个主机
场的默认的
配置概要文件在您的本地.databrickscfg
文件。看到砖配置概要文件。
要完成本教程,请执行以下步骤:
安装扩展:砖扩展Visual Studio代码市场在Visual Studio代码页,点击安装。完成安装,按照屏幕上的指令。
打开扩展:在侧边栏,点击砖标志。
开始配置扩展:在配置窗格中,单击配置数据砖。
设置数据砖工作区:命令面板,因为砖的主机,输入您的工作区实例URL例如,
https://1234567890123456.7.gcp.www.neidfyre.com
。然后按输入。点击进入默认值:验证使用缺省概要文件。
设置数据砖集群:在配置窗格中,单击集群,然后点击齿轮(集群配置)图标。
点击进入您想要使用的集群。
启动集群,如果尚未开始:在配置旁边的窗格中,集群,点击玩(启动集群)图标。
设置同步的目的地:配置窗格中,单击同步的目的地,然后点击齿轮(集群配置)图标。
在命令面板,点击同步目的地名称随机生成的扩展。
创建一个基本的、本地Python代码文件同步和运行:在侧边栏,点击资源管理器标志。
在主菜单中,点击文件>新建文件。名字的文件demo.py并将其保存到项目根目录。
将下面的代码添加到文件,然后保存它。这段代码创建和显示的内容基本PySpark DataFrame:
从pyspark.sql进口SparkSession从pyspark.sql.types进口*火花=SparkSession。构建器。getOrCreate()模式=StructType([StructField(“CustomerID”,IntegerType(),假),StructField(“FirstName”,StringType(),假),StructField(“姓”,StringType(),假)])数据=((1000年,“Mathijs”,“Oosterhout-Rijntjes”),(1001年,Joost的,“范Brunswijk”),(1002年,“斯坦”,“Bokenkamp”]]客户=火花。createDataFrame(数据,模式)客户。显示()#输出:## + - - - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - - - - +# | CustomerID | FirstName LastName | |# + - - - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - - - - +# | 1000 | Mathijs | Oosterhout-Rijntjes |# | 1001 | Joost van Brunswijk | |# | 1002 |斯坦| Bokenkamp |# + - - - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - - - - +
在配置旁边的窗格中,同步的目的地,点击圆圈箭头(开始同步)图标。
在资源管理器视图中,右键单击
demo.py
文件,然后点击上传和砖上运行文件。出现在的输出调试控制台窗格。