注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

have a good time !!

mind act upon mind

 
 
 

日志

 
 

spss分析中分类变量与连续变量的相关分析--探讨  

2013-04-19 00:26:11|  分类: 统计spss等等 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

转载:http://hi.baidu.com/94168195/item/2bc9fdcf4c1c6521e90f2ea4


吕文海 15378237323     市场研究分析师

     最近,受一位韩国留学生的委托在指导她做论文的数据分析过程中,遇到这样一个问题,也是她的韩国导师要求的,做“连续变量和分类变量的相关分析”。我实在纳闷了很久,通常在做这种分析时,如果自变量属于分类变量,因变量属于连续性的变量时,做t检验或者方差分析的,以此检验出分类变量不同类别在该连续变量上是否有差异;可是这位导师偏偏要求做相关分析,研究了半天,又查了很多资料,发现结论不一致。也不清楚到底谁的正确,同时在找资料过程中,我也灵机一动,找到一种新的方法(对我来说是新创造的,可能很多spss高手已经用的不想用,也可能是错误的,这里提出来,希望得到批评指正)。

      有些人说spss不能做分类与连续性的相关分析,但也有人说能做,就像我碰到的这位导师,于是我按照能做的思路来总结。

    由于分类变量涉及到二分类或者是多分类(三类及以上),分情况说明 

    1. 如果是二分类,而且是自然的二分类,比如性别(男、女)这种的,在录入编码时,用0、1表示时,据说可以直接采用pearson相关,我试了下,能得出结论,但不知道是否正确;但是我用我想到的办法尝试之后,发现得出的结论跟直接相关分析数据一致。

    2.多分类(三类以上)的自变量和连续性因变量的相关。这个大致口径一致,说spss无法操作,但也有人说直接相关就好了,可是直接相关个人感觉是完全错误的,因为分类变量很多分类的编码数字是没有大小意义的,比如春夏秋冬四类,在spss录入时用1234代替,这里的1234根本没有大小好坏之分,那得出的相关系数怎么解释呢?况且这种多分类变量在求相关时,一般是需要得出里面的每个分类与连续性因变量的相关系数的,于是spss似乎没法解决了。

     这里提下我的方法,说实话,我并不知道正确与否,希望有专家能够验证一下,并指导一下。

     方法很简单:就是设置哑变量。

     通常在回归分析时,如果是二分类变量可以直接当做连续性变量进行回归,而多分类时,则需要设置哑变量,即将每个类别转换成0,1的编码来表示,因此这里我们求相关系数时,也可以采用类似的设置哑变量,只不过是有几个类别就设置几个哑变量,这也相当于将多分类变量变成了多个0、1编码的二分类变量,然后再直接使用相关分析,选择所有的哑变量和连续性因变量进行普通的pearson相关,就可以得出每个分类与因变量的相关系数了。

     我通过这种方法来计算过二分类变量的相关系数,发现相关系数是一致的,但是多分类的就不知道如何了。

  评论这张
 
阅读(397)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017