NaiveBayesModel¶

类 pyspark.mllib.classification。 NaiveBayesModel ( 标签:numpy.ndarray,π:numpy.ndarray,θ:numpy.ndarray ) ¶

朴素贝叶斯分类器的模型。

参数

标签 numpy.ndarray: 标签的列表。
π numpy.ndarray: 日志类的先验的维C,数量的标签。
θ numpy.ndarray: 日志的类条件概率,其维度C-by-D, D是数量的特性。

例子

           > > >从pyspark.mllib.linalg进口SparseVector> > >数据=(…LabeledPoint(0.0,(0.0,0.0]),…LabeledPoint(0.0,(0.0,1.0]),…LabeledPoint(1.0,(1.0,0.0]),…]> > >模型=NaiveBayes。火车(sc。并行化(数据))> > >模型。预测(numpy。数组([0.0,1.0)))0.0> > >模型。预测(numpy。数组([1.0,0.0)))1.0> > >模型。预测(sc。并行化([[1.0,0.0]]))。收集()[1.0]> > >sparse_data=(…LabeledPoint(0.0,SparseVector(2,{1:0.0})),…LabeledPoint(0.0,SparseVector(2,{1:1.0})),…LabeledPoint(1.0,SparseVector(2,{0:1.0}))…]> > >模型=NaiveBayes。火车(sc。并行化(sparse_data))> > >模型。预测(SparseVector(2,{1:1.0}))0.0> > >模型。预测(SparseVector(2,{0:1.0}))1.0> > >进口操作系统,tempfile> > >路径=tempfile。mkdtemp()> > >模型。保存(sc,路径)> > >sameModel=NaiveBayesModel。负载(sc,路径)> > >sameModel。预测(SparseVector(2,{0:1.0}))= =模型。预测(SparseVector(2,{0:1.0}))真正的> > >从shutil进口rmtree> > >试一试:…rmtree(路径)…除了OSError:…通过
          

方法

`负载`(sc路径)	从给定的路径加载模型。
`预测`(x)	返回最可能的类数据向量的向量或一个抽样
`保存`(sc路径)	这个模型保存到给定的路径。

方法的文档

classmethod 负载 ( sc:pyspark.context.SparkContext,路径:str )→pyspark.mllib.classification.NaiveBayesModel ¶: 从给定的路径加载模型。

预测 ( x:联盟(VectorLike,pyspark.rdd.RDD(VectorLike]] )→联盟(numpy.float64,pyspark.rdd.RDD(numpy.float64] ] ¶: 返回最可能的类数据向量的向量或一个抽样

保存 ( sc:pyspark.context.SparkContext,路径:str )→没有¶: 这个模型保存到给定的路径。

以前的

SVMWithSGD

下一个

NaiveBayes