KMeansSummary

pyspark.ml.clustering。 KMeansSummary ( java_obj:可选(JavaObject]=没有一个 )

KMeans的总结。

属性

集群

DataFrame预测集群中心为每一个训练数据点。

clusterSizes

的大小(数据点的数量)每个集群。

featuresCol

列的功能预测

k

集群的数量模型训练。

numIter

的迭代次数。

predictionCol

预测集群的名称列预测

预测

DataFrame产生的模型变换方法。

trainingCost

k - means成本(距离平方的总和为所有点最近的重心在训练数据集)。

属性的文档

集群

DataFrame预测集群中心为每一个训练数据点。

clusterSizes

的大小(数据点的数量)每个集群。

featuresCol

列的功能预测

k

集群的数量模型训练。

numIter

的迭代次数。

predictionCol

预测集群的名称列预测

预测

DataFrame产生的模型变换方法。

trainingCost

k - means成本(距离平方的总和为所有点最近的重心在训练数据集)。这相当于sklearn的惯性。