StreamingKMeans¶
-
类
pyspark.mllib.clustering。
StreamingKMeans
( k:int=2,decayFactor:浮动=1.0,timeUnit:str=“批” ) ¶ -
提供方法来设置k、decayFactor timeUnit配置传入dstreams KMeans算法拟合和预测。提供更多细节重心是如何更新的文档下StreamingKMeansModel。
- 参数
-
- k int,可选
-
数量的集群。(默认值:2)
- decayFactor 浮动,可选
-
遗忘以前的重心。(默认值:1.0)
- timeUnit str,可选
-
可以“批次”或“点”。如果点,衰减系数提出的一些新的分如果批次,则将使用衰减系数。(默认:“批次”)
方法
返回最新的模型
predictOn
(dstream)dstream作出预测。
predictOnValues
(dstream)键控dstream作出预测。
setDecayFactor
(decayFactor)衰减系数。
setHalfLife
(半衰期timeUnit)设置后的批次数量的重心,特定批weightage的一半。
setInitialCenters
(中心、重量)设置初始中心。
setK
(k)设置集群的数量。
setRandomCenters
(暗、重量、种子)设置初始中心与常数随机样本人口高斯权重。
trainOn
(dstream)在传入dstream火车模型。
方法的文档
-
latestModel
( )→可选( pyspark.mllib.clustering.StreamingKMeansModel ] ¶ -
返回最新的模型
-
predictOn
( dstream:DStream(VectorLike] )→DStream(int] ¶ -
dstream作出预测。返回一个转换dstream对象
-
predictOnValues
( dstream:DStream(元组(T,VectorLike]] )→DStream(元组(T,int] ] ¶ -
键控dstream作出预测。返回一个转换dstream对象。
-
setDecayFactor
( decayFactor:浮动 )→pyspark.mllib.clustering.StreamingKMeans ¶ -
衰减系数。
-
setHalfLife
( 半衰期:浮动,timeUnit:str )→pyspark.mllib.clustering.StreamingKMeans ¶ -
设置后的批次数量的重心,特定批weightage的一半。
-
setInitialCenters
( 中心:列表(VectorLike],权重:列表(浮动] )→StreamingKMeans¶ -
设置初始中心。应设置在调用trainOn之前。
-
setK
( k:int )→pyspark.mllib.clustering.StreamingKMeans ¶ -
设置集群的数量。
-
setRandomCenters
( 昏暗的:int,重量:浮动,种子:int )→pyspark.mllib.clustering.StreamingKMeans ¶ -
设置初始中心与常数随机样本人口高斯权重。
-
trainOn
( dstream:DStream(VectorLike] )→没有¶ -
在传入dstream火车模型。