介绍砖AutoML:玻璃盒自动化机器学习方法的发展
2021年5月27日 在公告
今天,我们宣布砖AutoML,一个工具,使数据团队快速构建和部署的机器学习模型通过自动化的重任预处理,特征工程和模型训练/调优。这次的发布,团队可以选择一个数据集,数据配置培训,完全通过UI和部署模型。我们还提供一个先进经验数据科学家可以访问生成的笔记本与每个训练模型的源代码为productionization定制培训或与专家合作。砖AutoML集成了砖毫升的生态系统,包括自动跟踪试验指标和参数MLflow和容易使团队注册和版本控制的模型砖模型注册为部署。
一个玻璃盒子AutoML方法
今天,许多现有的AutoML工具是不透明的盒子里,这意味着用户不知道如何训练模型。数据科学家碰壁时,用这些工具需要进行特定于域的修改或当他们从事这一行业需要审核原因监管。数据团队然后必须投入的时间和资源来反向工程这些模型进行定制,这抵消了许多他们应该获得的生产率增长。
这就是为什么我们很兴奋将客户数据砖AutoML,一个玻璃盒子AutoML方法提供Python笔记本为每个模型训练增加开发人员的工作流程。
数据科学家可以利用他们的专业领域和轻松地添加或修改细胞这些生成的笔记本。数据科学家还可以使用砖AutoML生成的笔记本安装ML发展绕过需要编写样板代码。
快速洞察数据集
除了模型训练和选择,砖AutoML创建一个数据探索笔记本给基本总结统计一个数据集。通过自动化数据探索阶段,许多找到乏味,砖AutoML保存数据科学家的时间和允许他们很快肠道检查,适合训练数据集。数据探索笔记本使用熊猫剖析为用户提供警告——基数高、相关性和null值,以及变量的分布信息。
学习毫升的最佳实践
AutoML体验集成了MLflow——我们的API跟踪指标/参数在试验,利用毫升最佳实践来帮助提高生产力数据科学团队:
- 从实验页面,数据科学家可以比较试验和登记服务模型在砖模型注册。
- 我们生成的训练笔记提供的所有代码用来训练一个给定的模型——从加载数据分割测试/列车优化hyperparameters显示世鹏科技电子explainability情节。
AutoML公共预览功能
砖AutoML公共预览版截然不同的培训结束了sklearn和xgboost模型(二进制和多级)分类和回归问题。我们支持数据集与数值分类和时间戳的特性和自动处理一个炎热的编码和空污名。训练模型sklearn管道这样所有的数据预处理是用推理的模型。
此外,砖AutoML有几个高级选项。许多团队正试图从AutoML快速回答,所以客户可以通过配置控制AutoML训练能持续多久停止条件:墙上时钟超时或试验运行的最大数量。他们还可以配置评价指标排名模型性能。
开始使用砖AutoML公共预览
砖AutoML现在公共预览和砖机的学习经历的一部分。开始:
- 使用左边栏切换到“机器学习”的经历来访问数据砖AutoML通过UI。点击“(+)创建“左边导航栏,然后单击“AutoML实验”或导航到实验页面,然后单击“创建AutoML实验”开始。
- 使用AutoML API,单行的调用,可以看到在我们的文档。
准备开始或在试用砖AutoML吗?阅读更多关于砖AutoML以及如何使用它AWS,Azure,GCP。