如何提取基于树状ApachesparkML管道模型特征信息

学习如何提取特征信息树 ML管道模型Databricks

写由亚当巴夫拉卡

2022年5月16日

适配树型模型时,如决策树、随机森林或梯度推树,有助于审查特征重要性水平和特征名称SparkML模型通常适配管道最后阶段从树型管道提取相关特征信息时,必须提取正确管道级可提取特征名向量Assembler对象 :

Pyspark.ml.feste导入StringIndexer的%python,pyspark.ml.clicationimportTreeClistrationPark.ml导入pyspark.m

并使用交叉验证器对树基模型进行调试管道最后阶段可视化决策树并打印特征重要性级别最佳模式交叉校验器对象 :

Pyspark.ml.调试导入pythonPramGridBuildercvs

显示函数可视化决策树模型见机器学习可视化AWS系统|休眠|GCP)

文章有帮助吗