BisectingKMeansSummary

pyspark.ml.clustering。 BisectingKMeansSummary ( java_obj:可选(JavaObject]=没有一个 )

平分KMeans聚类结果对于一个给定的模型。

属性

集群

DataFrame预测集群中心为每一个训练数据点。

clusterSizes

的大小(数据点的数量)每个集群。

featuresCol

列的功能预测

k

集群的数量模型训练。

numIter

的迭代次数。

predictionCol

预测集群的名称列预测

预测

DataFrame产生的模型变换方法。

trainingCost

距离平方的总和为所有点最近的重心在训练数据集。

属性的文档

集群

DataFrame预测集群中心为每一个训练数据点。

clusterSizes

的大小(数据点的数量)每个集群。

featuresCol

列的功能预测

k

集群的数量模型训练。

numIter

的迭代次数。

predictionCol

预测集群的名称列预测

预测

DataFrame产生的模型变换方法。

trainingCost

距离平方的总和为所有点最近的重心在训练数据集。这相当于sklearn的惯性。