砖SDK R

请注意

本文涵盖了砖的砖SDK R的实验室,在一个实验状态。提供反馈,问问题,和报告问题,使用问题选项卡中数据砖SDK R在GitHub库。

在本文中,您将了解如何在砖自动化业务工作区和相关资源砖SDK R

请注意

砖SDK R在砖不支持的自动化业务账户。打电话给帐户层面操作,使用不同的砖SDK,例如:

在你开始之前

在你开始使用砖SDK为R,您的开发机必须有:

  • 一个砖个人访问令牌为目标数据砖工作区要自动化。

    请注意

    R的砖SDK的支持只砖个人访问令牌的身份验证。

  • R,选择一个R-compatible集成开发环境(IDE)。砖建议RStudio桌面并使用它在本文的指令。

开始使用的砖SDK的R

  1. 让你的砖工作空间的URL和个人访问令牌用于R项目的脚本。例如,您可以添加以下R项目.Renviron文件。取代< your-workspace-url >与你的工作区实例URL例如,https://dbc-a1b2345c-d6e7.cloud.www.neidfyre.com。取代< your-personal-access-token >例如,和你的砖个人访问令牌dapi12345678901234567890123456789012

    DATABRICKS_HOST = < your-workspace-url > DATABRICKS_TOKEN = < your-personal-access-token >

    其他方式提供砖工作区URL和个人访问令牌,看到的身份验证在GitHub砖SDK为R库。

    重要的

    不添加.Renviron文件版本控制系统,这种风险暴露敏感信息如砖个人访问令牌。

  2. 安装砖SDK R包。例如,在RStudio桌面控制台视图(视图>焦点转移到控制台),运行以下命令,一次:

    install.packages(“devtools”)图书馆(devtools)install_github(“databrickslabs / databricks-sdk-r”)

    请注意

    R包不可用的砖SDK的凹口。

  3. 添加代码来参考砖SDK R和列出所有的集群砖工作区。例如,在一个项目的main.r文件,代码可能如下:

    需要()客户端< -DatabricksClient()clustersList(客户端)(“cluster_name”]
  4. 运行脚本。例如,在RStuidio桌面,与项目的脚本编辑器main.r文件活跃,单击源>源源与呼应

  5. 集群列表中出现。例如,在RStudio桌面,这是控制台视图。

代码示例

下面的代码示例演示如何使用R的砖SDK创建和删除集群,并创造就业机会。

创建一个集群

这段代码示例创建一个集群与指定的砖和集群节点类型运行时版本。这个集群有一个工人,和集群自动终止后15分钟的空闲时间。

需要()客户端< -DatabricksClient()响应< -clustersCreate(客户端=客户端,cluster_name=“my-cluster”,spark_version=“12.2.x-scala2.12”,node_type_id=“i3.xlarge”,autotermination_minutes=15,num_workers=1)#让工作区URL中使用以下结果消息。get_client_debug< -strsplit(客户端美元debug_string(),分裂="主机= ")get_host< -strsplit(get_client_debug[[1]][2),分裂=”、“)主机< -get_host[[1]][1]#确保工作区URL以斜杠结束。如果(endsWith(主机,“/”)){}其他的{主机< -粘贴(主机,“/”,9月=”“)}打印(粘贴(“查看集群”,主机,“#设置/集群”,响应美元cluster_id,“/配置”,9月=”“))

永久删除一个集群

这段代码示例永久删除集群与集群ID指定的工作区。

需要()客户端< -DatabricksClient()cluster_id< -readline(集群的“ID删除(例如,1234 - 567890 ab123cd4):“)clustersPermanentDelete(客户端,cluster_id)

创建一个工作

这个代码示例创建了一个砖工作,可用于指定集群上运行指定的笔记本。这段代码运行,现有笔记本的路径,现有集群ID和相关工作设置从用户控制台。

需要()客户端< -DatabricksClient()job_name< -readline(“一些短名称的工作(例如,我的工作):“)描述< -readline(“一些简短描述的工作(例如,我的工作):“)existing_cluster_id< -readline(“ID在工作区中现有的集群上运行的工作(例如,1234 - 567890 ab123cd4):“)notebook_path< -readline(“工作区路径的笔记本运行(例如,/用户/ someone@example.com/my-notebook):“)task_key< -readline(“一些关键的申请工作的任务(例如,我的钥匙):“)打印(“试图创建工作。请稍等……”)notebook_task< -列表(notebook_path=notebook_path,=“工作区”)job_task< -列表(task_key=task_key,描述=描述,existing_cluster_id=existing_cluster_id,notebook_task=notebook_task)响应< -jobsCreate(客户端,的名字=job_name,任务=列表(job_task))#让工作区URL中使用以下结果消息。get_client_debug< -strsplit(客户端美元debug_string(),分裂="主机= ")get_host< -strsplit(get_client_debug[[1]][2),分裂=”、“)主机< -get_host[[1]][1]#确保工作区URL以斜杠结束。如果(endsWith(主机,“/”)){}其他的{主机< -粘贴(主机,“/”,9月=”“)}打印(粘贴(“查看工作”,主机,“#工作/”,响应美元job_id,9月=”“))

额外的资源

有关更多信息,请参见: