LogisticRegressionWithLBFGS¶
-
类
pyspark.mllib.classification。
LogisticRegressionWithLBFGS
¶ -
多项训练分类模型/二元逻辑回归使用内存有限挠挠。
标准功能扩展和L2正规化默认使用。
方法
火车
(数据、迭代、initialWeights…))训练逻辑回归模型在给定的数据。
方法的文档
-
classmethod
火车
( 数据:pyspark.rdd.RDD(pyspark.mllib.regression.LabeledPoint],迭代:int=One hundred.,initialWeights:可选(VectorLike]=没有一个,regParam:浮动=0.0,regType:str=“外语”,拦截:bool=假,修正:int=10,宽容:浮动=1 e-06,validateData:bool=真正的,numClasses:int=2 )→pyspark.mllib.classification.LogisticRegressionModel ¶ -
训练逻辑回归模型在给定的数据。
- 参数
-
-
数据
pyspark.RDD
- 迭代 int,可选
-
迭代的数量。(默认:100)
-
initialWeights
pyspark.mllib.linalg.Vector
或可兑换,可选 -
最初的重量。(默认值:无)
- regParam 浮动,可选
-
调整参数。(默认值:0.01)
- regType str,可选
-
规范用于训练模型的类型。支持的价值观:
“l1”使用l1正规化
“l2”使用l2正规化(默认)
没有没有正规化
- 拦截 bool,可选
-
布尔参数表示的使用与否为训练数据(即增强表示。是否偏置功能被激活)。(默认值:False)
- 修正 int,可选
-
修正LBFGS中使用更新的数量。如果已知updater用于二进制分类,它调用毫升实现,该参数将没有影响。(默认值:10)
- 宽容 浮动,可选
-
L-BFGS迭代的收敛公差。(默认值:1 e-6)
- validateData bool,可选
-
布尔参数,表明该算法是否应该训练之前验证数据。(默认值是真实的)
- numClasses int,可选
-
类的数量(即。,outcomes) a label can take in Multinomial Logistic Regression. (default: 2)
-
数据
例子
> > >数据=(…LabeledPoint(0.0,(0.0,1.0]),…LabeledPoint(1.0,(1.0,0.0]),…]> > >lrm=LogisticRegressionWithLBFGS。火车(sc。并行化(数据),迭代=10)> > >lrm。预测([1.0,0.0])1> > >lrm。预测([0.0,1.0])0
-
classmethod