RegressionMetrics

pyspark.mllib.evaluation。 RegressionMetrics ( predictionAndObservations:pyspark.rdd.RDD(元组(浮动,浮动]] )

评估者的回归。

参数
predictionAndObservations pyspark.RDD

预测的抽样,观察和可选的重量。

例子

> > >predictionAndObservations=sc并行化([(2.5,3.0),(0.0,- - - - - -0.5),(2.0,2.0),(8.0,7.0)))> > >指标=RegressionMetrics(predictionAndObservations)> > >指标explainedVariance8.859……> > >指标meanAbsoluteError0.5……> > >指标meanSquaredError0.37……> > >指标rootMeanSquaredError0.61……> > >指标r20.94……> > >predictionAndObservationsWithOptWeight=sc并行化([(2.5,3.0,0.5),(0.0,- - - - - -0.5,1.0),(2.0,2.0,0.3),(8.0,7.0,0.9)))> > >指标=RegressionMetrics(predictionAndObservationsWithOptWeight)> > >指标rootMeanSquaredError0.68……

方法

调用(名字,*一个)

调用的方法java_model

属性

explainedVariance

返回解释方差的回归评分。

meanAbsoluteError

返回平均绝对误差,这是一个风险函数对应的绝对误差损失的期望值或l1-norm损失。

meanSquaredError

返回均方误差,这是一个风险函数对应平方误差的期望值损失或二次损失。

r2

返回R ^ 2 ^,确定系数。

rootMeanSquaredError

返回根均方误差,定义为均方误差的平方根。

方法的文档

调用 ( 的名字:str,*一个:任何 )→任何

调用的方法java_model

属性的文档

explainedVariance

返回解释方差的回归评分。explainedVariance =\(1 - \压裂{方差(y - \帽子{y})}{方差(y)} \)

meanAbsoluteError

返回平均绝对误差,这是一个风险函数对应的绝对误差损失的期望值或l1-norm损失。

meanSquaredError

返回均方误差,这是一个风险函数对应平方误差的期望值损失或二次损失。

r2

返回R ^ 2 ^,确定系数。

rootMeanSquaredError

返回根均方误差,定义为均方误差的平方根。