StreamingKMeans¶

类 pyspark.mllib.clustering。 StreamingKMeans ( k:int=2,decayFactor:浮动=1.0,timeUnit:str=“批” ) ¶

提供方法来设置k、decayFactor timeUnit配置传入dstreams KMeans算法拟合和预测。提供更多细节重心是如何更新的文档下StreamingKMeansModel。

参数

方法

`latestModel`()	返回最新的模型
`predictOn`(dstream)	dstream作出预测。
`predictOnValues`(dstream)	键控dstream作出预测。
`setDecayFactor`(decayFactor)	衰减系数。
`setHalfLife`(半衰期timeUnit)	设置后的批次数量的重心,特定批weightage的一半。
`setInitialCenters`(中心、重量)	设置初始中心。
`setK`(k)	设置集群的数量。
`setRandomCenters`(暗、重量、种子)	设置初始中心与常数随机样本人口高斯权重。
`trainOn`(dstream)	在传入dstream火车模型。

方法的文档

latestModel ( )→可选( pyspark.mllib.clustering.StreamingKMeansModel ] ¶: 返回最新的模型

predictOn ( dstream:DStream(VectorLike] )→DStream(int] ¶: dstream作出预测。返回一个转换dstream对象

predictOnValues ( dstream:DStream(元组(T,VectorLike]] )→DStream(元组(T,int] ] ¶: 键控dstream作出预测。返回一个转换dstream对象。

setDecayFactor ( decayFactor:浮动 )→pyspark.mllib.clustering.StreamingKMeans ¶: 衰减系数。

setHalfLife ( 半衰期:浮动,timeUnit:str )→pyspark.mllib.clustering.StreamingKMeans ¶: 设置后的批次数量的重心,特定批weightage的一半。

setInitialCenters ( 中心:列表(VectorLike],权重:列表(浮动] )→StreamingKMeans¶: 设置初始中心。应设置在调用trainOn之前。

setRandomCenters ( 昏暗的:int,重量:浮动,种子:int )→pyspark.mllib.clustering.StreamingKMeans ¶: 设置初始中心与常数随机样本人口高斯权重。

以前的

PowerIterationClustering

下一个

StreamingKMeansModel