注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

have a good time !!

mind act upon mind

 
 
 

日志

 
 

spss 之roc曲线  

2013-03-27 05:52:50|  分类: 统计spss等等 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

spss roc曲线

(一)ROC曲线的概念

受试者工作特征曲线(receiver operator characteristic curve, ROC曲线),最初用于评价雷达性能,又称为接收者操作特性曲线。ROC曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。
传统的诊断试验评价方法有一个共同的特点,必须将试验结果分为两类,再进行统计分析。ROC曲线的评价方法与传统的评价方法不同,无须此限制,而是根据实际情况,允许有中间状态,可以把试验结果划分为多个有序分类,如正常、大致正常、可疑、大致异常和异常五个等级再进行统计分析。因此,ROC曲线评价方法适用的范围更为广泛。


(二)ROC曲线的主要作用
1.ROC
曲线能很容易地查出任意界限值时的对疾病的识别能力。
2.
选择最佳的诊断界限值。ROC曲线越靠近左上角,试验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少。
3.
两种或两种以上不同诊断试验对疾病识别能力的比较。在对同一种疾病的两种或两种以上诊断方法进行比较时,可将各试验的ROC曲线绘制到同一坐标中,以直观地鉴别优劣,靠近左上角的ROC曲线所代表的受试者工作最准确。亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较,哪一种试验的AUC最大,则哪一种试验的诊断价值最佳。


(三)ROC曲线分析的主要步骤
1.ROC
曲线绘制。依据专业知识,对疾病组和参照组测定结果进行分析,确定测定值的上下限、组距以及截断点(cut-off point),按选择的组距间隔列出累积频数分布表,分别计算出所有截断点的敏感性、特异性和假阳性率(1-特异性)。以敏感性为纵坐标代表真阳性率,(1-特异性)为横坐标代表假阳性率,作图绘成ROC曲线。
2.ROC
曲线评价统计量计算。ROC曲线下的面积值在1.00.5之间。在AUC0.5的情况下,AUC越接近于1,说明诊断效果越好。AUC0.50.7时有较低准确性,AUC0.70.9时有一定准确性,AUC0.9以上时有较高准确性。AUC0.5时,说明诊断方法完全不起作用,无诊断价值。AUC0.5不符合真实情况,在实际中极少出现。
3.
两种诊断方法的统计学比较。两种诊断方法的比较时,根据不同的试验设计可采用以下两种方法:当两种诊断方法分别在不同受试者身上进行时,采用成组比较法。如果两种诊断方法在同一受试者身上进行时,采用配对比较法。


(四)ROC曲线的优点
 
该方法简单、直观,通过图示可观察分析方法的临床准确性,并可用肉眼作出判断。ROC曲线将灵敏度与特异性以图示方法结合在一起,可准确反映某分析方法特异性和敏感性的关系,是试验准确性的综合代表。ROC曲线不固定分类界值,允许中间状态存在,利于使用者结合专业知识,权衡漏诊与误诊的影响,选择一更佳截断点作为诊断参考值。提供不同试验之间在共同标尺下的直观的比较,ROC曲线越凸越近左上角表明其诊断价值越大,利于不同指标间的比较。曲线下面积可评价诊断准确性。

 

ROC(Receiver Operating Characteristic)曲线,用于二分类判别效果的分析与评价.一般自变量为连续变量,因变量为二分类变量.

基本原理是:通过判断点(cutoff point/cutoff value)的移动,获得多对灵敏度(sensitivity)和误判率(1-Specificity(特异度)),以灵敏度为纵轴,以误判率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大,判断价值越高.

灵敏度:就是把实际为真值的判断为真值的概率.

特异度:就是把实际为假值的判断为假值的概率.

误判率:就是把实际为假值的判断为真值的概率,其值等于1-特异度.

将绘成的曲线与斜45度的直线对比,若差不多重合,说明自变量对因变量的判断价值很差,若越远离斜45度的直线即曲线下的面积越大,说明自变量对因变量的判断价值越好,即根据自变量可以较为正确的判断因变量.

使用SPSS的操作过程如下:

Graphs/ROC Curve:Test variable
选自变量(连续型变量),state varibale选因变量(二分类变量)display的选项一般全选.

运行结果:1.ROC曲线,可直观地看到曲线形状.

2.Area under the curve:
曲线下方的面积,包括面积值,显著性分析,置信区间.

3.Coordinates of the curve:ROC
曲线各点对应的灵敏度和误判率.

一般来说,如不做特殊考虑,一般以约登指数最大,即使(灵敏度+特异度-1)达到最大所对应的值为最佳诊断界值。
可以把SPSS求出的所有界点的灵敏度和特异度导出为EXCEL格式,然后求出所有界点的(灵敏度+特异度)的值,找出最大值,其所对应的诊断指标的值即为最佳诊断界值。这是目前国内文献用得最多的求最佳诊断界值的方法。求出最佳诊断界值后,还可以反过来根据该最佳诊断界值求出诊断指标的特异度和灵敏度,以验证该最佳诊断界值的诊断效果。 

Spss15.0作图结果:(只能进行ROC曲线下面积AUC的非参数估计,以及找出最佳工作点,使用该软件的感觉有点像matlab,有两个窗口,个人感觉该软件功能很强大,只是软件的下载很费事,要下载相应的算号器。在安装的过程中,使用算号器破解。)

1:建立数据表(File—>new—>data)输入数据,数据表的界面如图二,可以在data view(修改数据的数值) variable view(修改数据的类型)之间切换。

2:Analyze—>ROC Curve—>Test Variable(选择你的测试值,可以有多个,本例为test1test2、和test3的比较,故选择3个值)State Variable(选择测试结果值,本例为diagnosis)  Value State(判断正确的取值,本例为 Disply的选项全选。在Output窗口可以得到如图所示的曲线。   

spss 之roc曲线 - movie6521 - have a good time !!
 
spss 之roc曲线 - movie6521 - have a good time !!
 
spss 之roc曲线 - movie6521 - have a good time !!
 


 

 

  评论这张
 
阅读(343)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017