NaiveBayes

pyspark.mllib.classification。 NaiveBayes

火车多项朴素贝叶斯模型。

方法

火车(数据(,lambda_))

火车一个朴素贝叶斯模型给出一个抽样(标签,功能)的向量。

方法的文档

classmethod 火车 ( 数据:pyspark.rdd.RDD(pyspark.mllib.regression.LabeledPoint],lambda_:浮动=1.0 )pyspark.mllib.classification.NaiveBayesModel

火车一个朴素贝叶斯模型给出一个抽样(标签,功能)的向量。

这是多项NB它可以处理各种各样的离散数据。例如,通过将文档转换成TF-IDF向量,它可用于文档分类。通过每一个向量0 - 1的向量,它也可以被用作伯努利NB。输入特征值必须是负的。

参数
数据 pyspark.RDD

训练数据的抽样pyspark.mllib.regression.LabeledPoint

lambda_ 浮动,可选

平滑参数。(默认值:1.0)