FPGrowthModel¶
-
类
pyspark.mllib.fpm。
FPGrowthModel
( java_model:py4j.java_gateway.JavaObject ) ¶ -
FP-Growth模型使用并行FP-Growth挖掘频繁项集的算法。
例子
> > >数据=[[“一个”,“b”,“c”),(“一个”,“b”,“d”,“e”),(“一个”,“c”,“e”),(“一个”,“c”,“f”]]> > >抽样=sc。并行化(数据,2)> > >模型=FPGrowth。火车(抽样,0.6,2)> > >排序(模型。freqItemsets()。收集())[FreqItemset(项目= [a],频率= 4),FreqItemset(项目= [' c '],频率= 3),…> > >model_path=temp_path+“/ fpm”> > >模型。保存(sc,model_path)> > >sameModel=FPGrowthModel。负载(sc,model_path)> > >排序(模型。freqItemsets()。收集())= =排序(sameModel。freqItemsets()。收集())真正的
方法
调用
(名字,*一个)调用的方法java_model
返回此模型的频繁项集。
负载
(sc路径)从给定的路径加载模型。
保存
(sc路径)这个模型保存到给定的路径。
方法的文档
-
调用
( 的名字:str,*一个:任何 )→任何¶ -
调用的方法java_model
-
freqItemsets
( )→pyspark.rdd.RDD(pyspark.mllib.fpm.FPGrowth.FreqItemset] ¶ -
返回此模型的频繁项集。
-
classmethod
负载
( sc:pyspark.context.SparkContext,路径:str )→pyspark.mllib.fpm.FPGrowthModel ¶ -
从给定的路径加载模型。
-
保存
( sc:pyspark.context.SparkContext,路径:str )→没有¶ -
这个模型保存到给定的路径。
-