预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

ROC【receiveroperatingcharacteristic】,译为“接收者工作特征”,二战时期用于表示信号检测特性时创造的术语。 ROC曲线研究历史 1950’s雷达信号观测能力评价 1960’s中期实验心理学、心理物理学 1970’s末与1980’s诊断医学ROC曲线是显示分类模型真阳率(灵敏度)和假阳率(虚警率)之关系的一种图形化方法,ROC曲线可以用于全面评价一个分类器。 考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被预测成正类,即为真阳类(Truepositive),如果实例是负类被预测成正类,称之为假阳类(Falsepositive)诊断试验中常用的评价指标例13.2表13.2ECG诊断试验的结果例13.2表13.2ECG诊断试验的结果例13.2表13.2ECG诊断试验的结果 ECG诊断结果医生最关心的问题:1.试验阳性时患病的概率多大?2.试验阴性时不患病的概率多大? 3.如何选择合适的诊断界值,做出合理的诊断,使患者获得最好的处理在进行诊断临界点选择的时候,需要综合考虑灵敏度和特异度,选择最佳诊断界值。ROC曲线提供了很好的临界点选择工具。灵敏度,特异度,假阴性率,假阳性率 主要任务: 计算ROC曲线工作点(Coordinatepoint或Operatingpoint)(FPR,TPR) 连接相邻两点连续型数据的ROC曲线工作点(TPR,FPR)计算有序分类数据的ROC曲线工作点(TPR,FPR)计算(1)ROC曲线上的每一个点对应于一个threshold,大于这个值的实例划归为正类,小于这个值则划到负类中. Threshold最大时,把每个实例都预测为负类,TPR=0,FPR=0,对应于原点; Threshold最小时,,把每个实例都预测为正类,TPR=1,FPR=1,对应于右上角的点(1,1) 可以根据对灵敏度和特异度的特定要求,确定ROC曲线一适当的工作点,确定最好的决策阈值。 (2)理想情况下,TPR应该接近1,FPR应该接近0。 一个好的分类模型应该尽可能靠近图形的左上角, 而一个随机猜测模型应位于连接点(TPR=0,FPR=0)和(TPR=1,FPR=1)的主对角线上。 (3)ROC曲线下方的面积(AUC)提供了评价模型平均性能的另一种方法。如果模型是完美的,那么它的AUG=1,如果模型是个简单的随机猜测模型,那么它的AUG=0.5,如果一个模型好于另一个,则它的曲线下方面积相对较大。 ROC曲线可以全面评分类器的性能。