FPGrowthModel

pyspark.mllib.fpm。 FPGrowthModel ( java_model:py4j.java_gateway.JavaObject )

FP-Growth模型使用并行FP-Growth挖掘频繁项集的算法。

例子

> > >数据=[[“一个”,“b”,“c”),(“一个”,“b”,“d”,“e”),(“一个”,“c”,“e”),(“一个”,“c”,“f”]]> > >抽样=sc并行化(数据,2)> > >模型=FPGrowth火车(抽样,0.6,2)> > >排序(模型freqItemsets()收集())[FreqItemset(项目= [a],频率= 4),FreqItemset(项目= [' c '],频率= 3),…> > >model_path=temp_path+“/ fpm”> > >模型保存(sc,model_path)> > >sameModel=FPGrowthModel负载(sc,model_path)> > >排序(模型freqItemsets()收集())= =排序(sameModelfreqItemsets()收集())真正的

方法

调用(名字,*一个)

调用的方法java_model

freqItemsets()

返回此模型的频繁项集。

负载(sc路径)

从给定的路径加载模型。

保存(sc路径)

这个模型保存到给定的路径。

方法的文档

调用 ( 的名字:str,*一个:任何 )→任何

调用的方法java_model

freqItemsets ( )→pyspark.rdd.RDD(pyspark.mllib.fpm.FPGrowth.FreqItemset]

返回此模型的频繁项集。

classmethod 负载 ( sc:pyspark.context.SparkContext,路径:str )pyspark.mllib.fpm.FPGrowthModel

从给定的路径加载模型。

保存 ( sc:pyspark.context.SparkContext,路径:str )→没有

这个模型保存到给定的路径。