发布网友 发布时间:2022-05-10 18:49
共1个回答
热心网友 时间:2023-10-22 18:40
考虑二问题即实例类(positive)或负类(negative)二问题说现四种情况实例类并且预测类即真类(Truepositive),实例负类预测类称假类(Falsepositive)相应实例负类预测负类称真负类(Truenegative),类预测负类则假负类(falsenegative)列联表表所示1代表类0代表负类预测10合计实际1TruePositive(TP)FalseNegative(FN)ActualPositive(TP+FN)0FalsePositive(FP)TrueNegative(TN)ActualNegative(FP+TN)合计PredictedPositive(TP+FP)PredictedNegative(FN+TN)TP+FP+FN+TN列联表引入两新名词其真类率(truepositiverate,TPR),计算公式TPR=TP/(TP+FN)刻画类器所识别实例占所实例比例另外假类率(falsepositiverate,FPR),计算公式FPR=FP/(FP+TN)计算类器错认类负实例占所负实例比例真负类率(TrueNegativeRateTNR)称specificity,计算公式TNR=TN/(FP+TN)=1-FPR二类模型于所连续结假设已确定阈值比说0.6于值实例划归类于值则划负类减阈值减0.5固能识别类提高识别例占所例比例即TPR同负实例作实例即提高FPR形象化变化引入ROCReceiverOperatingCharacteristic,翻译接受者操作特性曲线够拗口曲线由两变量1-specificitySensitivity绘制.1-specificity=FPR即假类率Sensitivity即真类率TPR(Truepositiverate),反映类覆盖程度组合1-specificitysensitivity,即代价(costs)收益(benefits)表逻辑归结实数值按划10数相同部Percentile实例数例数1-特异度(%)敏度(%)10618048792.7334.6420618028049.8054.55306180216518.2269.92406180150628.0180.6250618098738.9087.6260618052950.7491.3870618036562.9393.9780618029475.2696.0690618029787.5998.171006177258100.00100.00其例数部实际类数说逻辑归结按排列倘若前10%数值作阀值即前10%实例都划归类6180其确数4879占所类4879/14084*100%=34.64%即敏度;另外6180-4879=1301负实例错划类占所负类1301/47713*100%=2.73%,即1-特异度两组值别作x值y值excel作散点图ROC曲线