跨工程协作、数据科学和机器学习团队支持多种语言,内置的数据可视化,自动版本控制和操作化工作。
好处
一起工作
跨团队与同行分享笔记和工作在多种语言(R, Python, SQL和Scala)和库。实时合著者、评论和自动版本简化协作,同时提供控制。
分享见解
很快发现内置交互式可视化的新见解,或利用图书馆Matplotlib和ggplot等。导出结果和笔记本在HTML或IPYNB格式,或构建和共享仪表板,始终保持最新。
大规模实施
调度笔记本自动运行大规模机器学习和数据管道。使用笔记本工作流创建多级管道。设置警报和快速访问审计日志,便于监控和故障诊断。
特性
数据访问:快速访问数据集或连接到任何数据源,本地或在云中。
多语言支持:使用交互式的笔记本,有探索数据支持多种编程语言在同一个笔记本,包括R, Python, Scala和SQL。
交互式可视化:通过各种各样的单击可视化可视化见解。或者使用强大的脚本选项Matplotlib ggplot, D3。
实时合著者:工作在相同的笔记本在实时跟踪更改与详细的修订历史。
评论:留下你的评论并通知同事从内部共享笔记本。
自动版本:自动变更追踪和版本来帮助你上车离开。
Git-based回购:简化Git-based协作、再现性和CI / CD工作流。
分栏:自动记录实验中,参数和结果直接从笔记本MLflow运行,快速查看和加载之前运行代码版本从侧边栏。
指示板:与你的同事和客户分享见解,或让他们运行交互式查询Spark-powered仪表板。
笔记本电脑运行工作:把笔记本电脑或罐子变成弹性生产工作的情况,或单击一个API调用。
工作调度程序:执行生产管道的工作在一个特定的时间表。
笔记本工作流程:创建多级管道与源的控制结构编程语言。
通知和日志:设置警报和快速访问审计日志,便于监控和故障诊断。
权限管理:快速管理访问每一个笔记本,或者笔记本的集合,和实验中,一个常见的安全模型。
集群:迅速把笔记本auto-managed集群,以高效低成本扩大计算。
集成:连接表,美人,BI, RStudio,雪花,允许数据科学家和工程师使用他们的工具的选择。
它是如何工作的
共享和互动笔记本、实验和扩展文件支持允许数据科学家团队组织、共享和管理复杂的数据更有效地科学项目整个生命周期。api和工程团队快速自动化作业调度器允许数据复杂的管道,而业务分析人员可以直接访问的结果通过交互式仪表板。