BinaryClassificationMetrics

pyspark.mllib.evaluation。 BinaryClassificationMetrics ( scoreAndLabels:pyspark.rdd.RDD(元组(浮动,浮动]] )

评估者对二进制分类。

参数
scoreAndLabels pyspark.RDD

分数的抽样,标签和可选的重量。

例子

> > >scoreAndLabels=sc并行化([(0.1,0.0),(0.1,1.0),(0.4,0.0),(0.6,0.0),(0.6,1.0),(0.6,1.0),(0.8,1.0)),2)> > >指标=BinaryClassificationMetrics(scoreAndLabels)> > >指标areaUnderROC0.70……> > >指标areaUnderPR0.83……> > >指标unpersist()> > >scoreAndLabelsWithOptWeight=sc并行化([(0.1,0.0,1.0),(0.1,1.0,0.4),(0.4,0.0,0.2),(0.6,0.0,0.6),(0.6,1.0,0.9),(0.6,1.0,0.5),(0.8,1.0,0.7)),2)> > >指标=BinaryClassificationMetrics(scoreAndLabelsWithOptWeight)> > >指标areaUnderROC0.79……> > >指标areaUnderPR0.88……

方法

调用(名字,*一个)

调用的方法java_model

unpersist()

Unpersists中间抽样用于计算。

属性

areaUnderPR

计算precision-recall曲线下的面积。

areaUnderROC

计算接受者操作特征(ROC)曲线下的面积。

方法的文档

调用 ( 的名字:str,*一个:任何 )→任何

调用的方法java_model

unpersist ( )→没有

Unpersists中间抽样用于计算。

属性的文档

areaUnderPR

计算precision-recall曲线下的面积。

areaUnderROC

计算接受者操作特征(ROC)曲线下的面积。