FPGrowthModel¶

类 pyspark.mllib.fpm。 FPGrowthModel ( java_model:py4j.java_gateway.JavaObject ) ¶

FP-Growth模型使用并行FP-Growth挖掘频繁项集的算法。

例子

           > > >数据=[[“一个”,“b”,“c”),(“一个”,“b”,“d”,“e”),(“一个”,“c”,“e”),(“一个”,“c”,“f”]]> > >抽样=sc。并行化(数据,2)> > >模型=FPGrowth。火车(抽样,0.6,2)> > >排序(模型。freqItemsets()。收集())[FreqItemset(项目= [a],频率= 4),FreqItemset(项目= [' c '],频率= 3),…> > >model_path=temp_path+“/ fpm”> > >模型。保存(sc,model_path)> > >sameModel=FPGrowthModel。负载(sc,model_path)> > >排序(模型。freqItemsets()。收集())= =排序(sameModel。freqItemsets()。收集())真正的
          

方法

`调用`(名字,*一个)	调用的方法java_model
`freqItemsets`()	返回此模型的频繁项集。
`负载`(sc路径)	从给定的路径加载模型。
`保存`(sc路径)	这个模型保存到给定的路径。

方法的文档

调用 ( 的名字:str,*一个:任何 )→任何¶: 调用的方法java_model

freqItemsets ( )→pyspark.rdd.RDD(pyspark.mllib.fpm.FPGrowth.FreqItemset] ¶: 返回此模型的频繁项集。

classmethod 负载 ( sc:pyspark.context.SparkContext,路径:str )→pyspark.mllib.fpm.FPGrowthModel ¶: 从给定的路径加载模型。

保存 ( sc:pyspark.context.SparkContext,路径:str )→没有¶: 这个模型保存到给定的路径。

以前的

FPGrowth

下一个

PrefixSpan