MulticlassMetrics¶

类 pyspark.mllib.evaluation。 MulticlassMetrics ( predictionAndLabels:pyspark.rdd.RDD(元组(浮动,浮动]] ) ¶

评估者对多类分类。

参数

predictionAndLabels pyspark.RDD: 预测的抽样,标签,可选的重量和可选的概率。

例子

           > > >predictionAndLabels=sc。并行化(((0.0,0.0),(0.0,1.0),(0.0,0.0),…(1.0,0.0),(1.0,1.0),(1.0,1.0),(1.0,1.0),(2.0,2.0),(2.0,0.0)))> > >指标=MulticlassMetrics(predictionAndLabels)> > >指标。confusionMatrix()。toArray()数组([[2。1。,1.],(1。3。,0.],[0。,0。,1.]])> > >指标。falsePositiveRate(0.0)0.2……> > >指标。精度(1.0)0.75……> > >指标。回忆(2.0)1.0……> > >指标。fMeasure(0.0,2.0)0.52……> > >指标。精度0.66……> > >指标。weightedFalsePositiveRate0.19……> > >指标。weightedPrecision0.68……> > >指标。weightedRecall0.66……> > >指标。weightedFMeasure()0.66……> > >指标。weightedFMeasure(2.0)0.65……> > >predAndLabelsWithOptWeight=sc。并行化(((0.0,0.0,1.0),(0.0,1.0,1.0),…(0.0,0.0,1.0),(1.0,0.0,1.0),(1.0,1.0,1.0),(1.0,1.0,1.0),(1.0,1.0,1.0),…(2.0,2.0,1.0),(2.0,0.0,1.0)))> > >指标=MulticlassMetrics(predAndLabelsWithOptWeight)> > >指标。confusionMatrix()。toArray()数组([[2。1。,1.],(1。3。,0.],[0。,0。,1.]])> > >指标。falsePositiveRate(0.0)0.2……> > >指标。精度(1.0)0.75……> > >指标。回忆(2.0)1.0……> > >指标。fMeasure(0.0,2.0)0.52……> > >指标。精度0.66……> > >指标。weightedFalsePositiveRate0.19……> > >指标。weightedPrecision0.68……> > >指标。weightedRecall0.66……> > >指标。weightedFMeasure()0.66……> > >指标。weightedFMeasure(2.0)0.65……> > >predictionAndLabelsWithProbabilities=sc。并行化([…(1.0,1.0,1.0,(0.1,0.8,0.1]),(0.0,2.0,1.0,(0.9,0.05,0.05]),…(0.0,0.0,1.0,(0.8,0.2,0.0]),(1.0,1.0,1.0,(0.3,0.65,0.05))))> > >指标=MulticlassMetrics(predictionAndLabelsWithProbabilities)> > >指标。logLoss()0.9682……
          

方法

`调用`(名字,*一个)	调用的方法java_model
`confusionMatrix`()	返回混淆矩阵:预测类列,他们命令类标签提升,如“标签”。
`fMeasure`(标签(β))	返回f-measure。
`falsePositiveRate`(标签)	返回假阳性率为给定的标签(类别)。
`logLoss`((eps))	返回加权logLoss。
`精度`(标签)	返回精度。
`回忆`(标签)	返回召回。
`truePositiveRate`(标签)	返回true积极率对于一个给定的标签(类别)。
`weightedFMeasure`([测试])	加权平均f-measure回报。

属性

`精度`	返回精度(等于正确的总数分类实例的实例)的总数。
`weightedFalsePositiveRate`	返回加权假阳性率。
`weightedPrecision`	返回加权平均精度。
`weightedRecall`	返回加权平均召回。
`weightedTruePositiveRate`	返回加权真阳性率。

方法的文档

调用 ( 的名字:str,*一个:任何 )→任何¶: 调用的方法java_model

confusionMatrix ( )→pyspark.mllib.linalg.Matrix ¶: 返回混淆矩阵:预测类列,他们命令类标签提升,如“标签”。

fMeasure ( 标签:浮动,β:可选(浮动]=没有一个 )→浮动¶: 返回f-measure。

falsePositiveRate ( 标签:浮动 )→浮动¶: 返回假阳性率为给定的标签(类别)。

logLoss ( 每股收益:浮动=1 e15汽油 )→浮动¶: 返回加权logLoss。

精度 ( 标签:浮动 )→浮动¶: 返回精度。

回忆 ( 标签:浮动 )→浮动¶: 返回召回。

truePositiveRate ( 标签:浮动 )→浮动¶: 返回true积极率对于一个给定的标签(类别)。

weightedFMeasure ( β:可选(浮动]=没有一个 )→浮动¶: 加权平均f-measure回报。

属性的文档

精度 ¶: 返回精度(等于正确的总数分类实例的实例)的总数。

weightedFalsePositiveRate ¶: 返回加权假阳性率。

weightedPrecision ¶: 返回加权平均精度。

weightedRecall ¶: 返回加权平均召回。(等于精度、召回和f-measure)

weightedTruePositiveRate ¶: 返回加权真阳性率。(等于精度、召回和f-measure)

以前的

RegressionMetrics

下一个

RankingMetrics