MulticlassMetrics

pyspark.mllib.evaluation。 MulticlassMetrics ( predictionAndLabels:pyspark.rdd.RDD(元组(浮动,浮动]] )

评估者对多类分类。

参数
predictionAndLabels pyspark.RDD

预测的抽样,标签,可选的重量和可选的概率。

例子

> > >predictionAndLabels=sc并行化(((0.0,0.0),(0.0,1.0),(0.0,0.0),(1.0,0.0),(1.0,1.0),(1.0,1.0),(1.0,1.0),(2.0,2.0),(2.0,0.0)))> > >指标=MulticlassMetrics(predictionAndLabels)> > >指标confusionMatrix()toArray()数组([[2。1。,1.],(1。3。,0.],[0。,0。,1.]])> > >指标falsePositiveRate(0.0)0.2……> > >指标精度(1.0)0.75……> > >指标回忆(2.0)1.0……> > >指标fMeasure(0.0,2.0)0.52……> > >指标精度0.66……> > >指标weightedFalsePositiveRate0.19……> > >指标weightedPrecision0.68……> > >指标weightedRecall0.66……> > >指标weightedFMeasure()0.66……> > >指标weightedFMeasure(2.0)0.65……> > >predAndLabelsWithOptWeight=sc并行化(((0.0,0.0,1.0),(0.0,1.0,1.0),(0.0,0.0,1.0),(1.0,0.0,1.0),(1.0,1.0,1.0),(1.0,1.0,1.0),(1.0,1.0,1.0),(2.0,2.0,1.0),(2.0,0.0,1.0)))> > >指标=MulticlassMetrics(predAndLabelsWithOptWeight)> > >指标confusionMatrix()toArray()数组([[2。1。,1.],(1。3。,0.],[0。,0。,1.]])> > >指标falsePositiveRate(0.0)0.2……> > >指标精度(1.0)0.75……> > >指标回忆(2.0)1.0……> > >指标fMeasure(0.0,2.0)0.52……> > >指标精度0.66……> > >指标weightedFalsePositiveRate0.19……> > >指标weightedPrecision0.68……> > >指标weightedRecall0.66……> > >指标weightedFMeasure()0.66……> > >指标weightedFMeasure(2.0)0.65……> > >predictionAndLabelsWithProbabilities=sc并行化([(1.0,1.0,1.0,(0.1,0.8,0.1]),(0.0,2.0,1.0,(0.9,0.05,0.05]),(0.0,0.0,1.0,(0.8,0.2,0.0]),(1.0,1.0,1.0,(0.3,0.65,0.05))))> > >指标=MulticlassMetrics(predictionAndLabelsWithProbabilities)> > >指标logLoss()0.9682……

方法

调用(名字,*一个)

调用的方法java_model

confusionMatrix()

返回混淆矩阵:预测类列,他们命令类标签提升,如“标签”。

fMeasure(标签(β))

返回f-measure。

falsePositiveRate(标签)

返回假阳性率为给定的标签(类别)。

logLoss((eps))

返回加权logLoss。

精度(标签)

返回精度。

回忆(标签)

返回召回。

truePositiveRate(标签)

返回true积极率对于一个给定的标签(类别)。

weightedFMeasure([测试])

加权平均f-measure回报。

属性

精度

返回精度(等于正确的总数分类实例的实例)的总数。

weightedFalsePositiveRate

返回加权假阳性率。

weightedPrecision

返回加权平均精度。

weightedRecall

返回加权平均召回。

weightedTruePositiveRate

返回加权真阳性率。

方法的文档

调用 ( 的名字:str,*一个:任何 )→任何

调用的方法java_model

confusionMatrix ( )pyspark.mllib.linalg.Matrix

返回混淆矩阵:预测类列,他们命令类标签提升,如“标签”。

fMeasure ( 标签:浮动,β:可选(浮动]=没有一个 )→浮动

返回f-measure。

falsePositiveRate ( 标签:浮动 )→浮动

返回假阳性率为给定的标签(类别)。

logLoss ( 每股收益:浮动=1 e15汽油 )→浮动

返回加权logLoss。

精度 ( 标签:浮动 )→浮动

返回精度。

回忆 ( 标签:浮动 )→浮动

返回召回。

truePositiveRate ( 标签:浮动 )→浮动

返回true积极率对于一个给定的标签(类别)。

weightedFMeasure ( β:可选(浮动]=没有一个 )→浮动

加权平均f-measure回报。

属性的文档

精度

返回精度(等于正确的总数分类实例的实例)的总数。

weightedFalsePositiveRate

返回加权假阳性率。

weightedPrecision

返回加权平均精度。

weightedRecall

返回加权平均召回。(等于精度、召回和f-measure)

weightedTruePositiveRate

返回加权真阳性率。(等于精度、召回和f-measure)