StreamingKMeans

pyspark.mllib.clustering。 StreamingKMeans ( k:int=2,decayFactor:浮动=1.0,timeUnit:str=“批” )

提供方法来设置k、decayFactor timeUnit配置传入dstreams KMeans算法拟合和预测。提供更多细节重心是如何更新的文档下StreamingKMeansModel。

参数
k int,可选

数量的集群。(默认值:2)

decayFactor 浮动,可选

遗忘以前的重心。(默认值:1.0)

timeUnit str,可选

可以“批次”或“点”。如果点,衰减系数提出的一些新的分如果批次,则将使用衰减系数。(默认:“批次”)

方法

latestModel()

返回最新的模型

predictOn(dstream)

dstream作出预测。

predictOnValues(dstream)

键控dstream作出预测。

setDecayFactor(decayFactor)

衰减系数。

setHalfLife(半衰期timeUnit)

设置后的批次数量的重心,特定批weightage的一半。

setInitialCenters(中心、重量)

设置初始中心。

setK(k)

设置集群的数量。

setRandomCenters(暗、重量、种子)

设置初始中心与常数随机样本人口高斯权重。

trainOn(dstream)

在传入dstream火车模型。

方法的文档

latestModel ( )→可选( pyspark.mllib.clustering.StreamingKMeansModel ]

返回最新的模型

predictOn ( dstream:DStream(VectorLike] )→DStream(int]

dstream作出预测。返回一个转换dstream对象

predictOnValues ( dstream:DStream(元组(T,VectorLike]] )→DStream(元组(T,int] ]

键控dstream作出预测。返回一个转换dstream对象。

setDecayFactor ( decayFactor:浮动 )pyspark.mllib.clustering.StreamingKMeans

衰减系数。

setHalfLife ( 半衰期:浮动,timeUnit:str )pyspark.mllib.clustering.StreamingKMeans

设置后的批次数量的重心,特定批weightage的一半。

setInitialCenters ( 中心:列表(VectorLike],权重:列表(浮动] )→StreamingKMeans

设置初始中心。应设置在调用trainOn之前。

setK ( k:int )pyspark.mllib.clustering.StreamingKMeans

设置集群的数量。

setRandomCenters ( 昏暗的:int,重量:浮动,种子:int )pyspark.mllib.clustering.StreamingKMeans

设置初始中心与常数随机样本人口高斯权重。

trainOn ( dstream:DStream(VectorLike] )→没有

在传入dstream火车模型。