砖SDK R
在本文中,您将了解如何在砖自动化业务工作区和相关资源砖SDK R。
开始使用的砖SDK的R
让你的砖工作空间的URL和个人访问令牌用于R项目的脚本。例如,您可以添加以下R项目
.Renviron
文件。取代< your-workspace-url >
与你的工作区实例URL例如,https://dbc-a1b2345c-d6e7.cloud.www.neidfyre.com
。取代< your-personal-access-token >
例如,和你的砖个人访问令牌dapi12345678901234567890123456789012
。DATABRICKS_HOST = < your-workspace-url > DATABRICKS_TOKEN = < your-personal-access-token >
其他方式提供砖工作区URL和个人访问令牌,看到的身份验证在GitHub砖SDK为R库。
重要的
不添加
.Renviron
文件版本控制系统,这种风险暴露敏感信息如砖个人访问令牌。安装砖SDK R包。例如,在RStudio桌面控制台视图(视图>焦点转移到控制台),运行以下命令,一次:
install.packages(“devtools”)图书馆(devtools)install_github(“databrickslabs / databricks-sdk-r”)
请注意
R包不可用的砖SDK的凹口。
添加代码来参考砖SDK R和列出所有的集群砖工作区。例如,在一个项目的
main.r
文件,代码可能如下:需要(砖)客户端< -DatabricksClient()clustersList(客户端)(“cluster_name”]
运行脚本。例如,在RStuidio桌面,与项目的脚本编辑器
main.r
文件活跃,单击源>源或源与呼应。集群列表中出现。例如,在RStudio桌面,这是控制台视图。
代码示例
下面的代码示例演示如何使用R的砖SDK创建和删除集群,并创造就业机会。
创建一个集群
这段代码示例创建一个集群与指定的砖和集群节点类型运行时版本。这个集群有一个工人,和集群自动终止后15分钟的空闲时间。
需要(砖)客户端< -DatabricksClient()响应< -clustersCreate(客户端=客户端,cluster_name=“my-cluster”,spark_version=“12.2.x-scala2.12”,node_type_id=“i3.xlarge”,autotermination_minutes=15,num_workers=1)#让工作区URL中使用以下结果消息。get_client_debug< -strsplit(客户端美元debug_string(),分裂="主机= ")get_host< -strsplit(get_client_debug[[1]][2),分裂=”、“)主机< -get_host[[1]][1]#确保工作区URL以斜杠结束。如果(endsWith(主机,“/”)){}其他的{主机< -粘贴(主机,“/”,9月=”“)}打印(粘贴(“查看集群”,主机,“#设置/集群”,响应美元cluster_id,“/配置”,9月=”“))
永久删除一个集群
这段代码示例永久删除集群与集群ID指定的工作区。
需要(砖)客户端< -DatabricksClient()cluster_id< -readline(集群的“ID删除(例如,1234 - 567890 ab123cd4):“)clustersPermanentDelete(客户端,cluster_id)
创建一个工作
这个代码示例创建了一个砖工作,可用于指定集群上运行指定的笔记本。这段代码运行,现有笔记本的路径,现有集群ID和相关工作设置从用户控制台。
需要(砖)客户端< -DatabricksClient()job_name< -readline(“一些短名称的工作(例如,我的工作):“)描述< -readline(“一些简短描述的工作(例如,我的工作):“)existing_cluster_id< -readline(“ID在工作区中现有的集群上运行的工作(例如,1234 - 567890 ab123cd4):“)notebook_path< -readline(“工作区路径的笔记本运行(例如,/用户/ someone@example.com/my-notebook):“)task_key< -readline(“一些关键的申请工作的任务(例如,我的钥匙):“)打印(“试图创建工作。请稍等……”)notebook_task< -列表(notebook_path=notebook_path,源=“工作区”)job_task< -列表(task_key=task_key,描述=描述,existing_cluster_id=existing_cluster_id,notebook_task=notebook_task)响应< -jobsCreate(客户端,的名字=job_name,任务=列表(job_task))#让工作区URL中使用以下结果消息。get_client_debug< -strsplit(客户端美元debug_string(),分裂="主机= ")get_host< -strsplit(get_client_debug[[1]][2),分裂=”、“)主机< -get_host[[1]][1]#确保工作区URL以斜杠结束。如果(endsWith(主机,“/”)){}其他的{主机< -粘贴(主机,“/”,9月=”“)}打印(粘贴(“查看工作”,主机,“#工作/”,响应美元job_id,9月=”“))