适配树型模型时,如决策树、随机森林或梯度推树,有助于审查特征重要性水平和特征名称SparkML模型通常适配管道最后阶段从树型管道提取相关特征信息时,必须提取正确管道级可提取特征名向量Assembler对象 :
Pyspark.ml.feste导入StringIndexer的%python,pyspark.ml.clicationimportTreeClistrationPark.ml导入pyspark.m
并使用交叉验证器对树基模型进行调试管道最后阶段可视化决策树并打印特征重要性级别最佳模式从交叉校验器对象 :
Pyspark.ml.调试导入pythonPramGridBuildercvs