NaiveBayes¶
-
类
pyspark.mllib.classification。
NaiveBayes
¶ -
火车多项朴素贝叶斯模型。
方法
火车
(数据(,lambda_))火车一个朴素贝叶斯模型给出一个抽样(标签,功能)的向量。
方法的文档
-
classmethod
火车
( 数据:pyspark.rdd.RDD(pyspark.mllib.regression.LabeledPoint],lambda_:浮动=1.0 )→pyspark.mllib.classification.NaiveBayesModel ¶ -
火车一个朴素贝叶斯模型给出一个抽样(标签,功能)的向量。
这是多项NB它可以处理各种各样的离散数据。例如,通过将文档转换成TF-IDF向量,它可用于文档分类。通过每一个向量0 - 1的向量,它也可以被用作伯努利NB。输入特征值必须是负的。
- 参数
-
-
数据
pyspark.RDD
- lambda_ 浮动,可选
-
平滑参数。(默认值:1.0)
-
数据
-
classmethod