SPSS分析问卷数据的流程——一篇带你学会SPSS

论文 徐 自远 6985℃

SPSS分析问卷数据的流程——一篇带你学会SPSS




毕业大半年了,现在还清晰的记得当时毕业论文不会用SPSS的痛苦,每天挣扎把度娘、知乎、知网、优酷、某宝等各大网站都逛了个遍,依然没有找到用SPSS完整的分析一份问卷的流程,几乎都是零零散散的一些知识,又或是几十个视频的解说却总是听不到自己想听的部分,眼看论文上交时间到却毫无头绪的紧张感使自己完全静不下心从头学到尾。从一个完全是SPSS小白到基本能完整分析一份问卷数据(当然也仅仅是单因素的分析,多元分析并未接触,这篇文章主要希望能帮助之前从未接触过SPSS却因论文不得不用的小伙伴)。

实证分析主要包括描述性分析、信度效度分析、相关分析、假设检验(回归分析)。在分析之前我们首先要懂得SPSS的分析原理。学过高数的基本都知道假设检验的原理,SPSS软件的基本原理就是假设检验,即先假设H0:A对B没有影响条件成立,分析得出的结果P(sig.)<0.001/0.01/0.05,则假设不成立,即A对B具有显著性影响。

用SPSS分析的问卷必须是李克特五级量表或七级量表,生手建议设计五级单因素的量表。问卷数据收集完成后,首先要剔除无效问卷(所有问题答案全选一种选项的或存在矛盾的答案等问卷),保证数据的准确性。分析步骤如下:

  1. 录入问题及数据

打开SPSS软件,在变量视图界面内输入问题及设置值,一般设置值为1非常不同意,2不同意,3不一定,4同意,5非常同意。同理输完一篇问卷即可。如下图:

二、描述性分析

描述性分析主要是对被调查者的基本信息进行描述,如性别、学历、年龄、工作年限、居住地等等,这类问题一般放置在一份问卷的开头(也有放置在结尾,个人设计问卷时比较喜欢放置于开头)。描述性分析主要对问卷的均值、标准差进行分析,均值相同时,比较标准差,标准差越小,表示越稳定。

步骤如下图:1、点击分析—–描述统计—-描述—-选择变量—-点击选项—-选择你需要描述的项(平均值、方差…..)。

2、分析—-描述统计—-频率—选择项,则可以得出频率频数。

最后将自己需要的数据进行汇总了列成表格或图表(饼图/柱形图等)的表示,图表的项有频数、频率、均值、标准值等,并辅以文字说明,使结果一目了然。(注:以下图表及数据仅作为案例解释说明,数据不具有准确性和真实性)

二、信度分析

信度分析主要是通过SPSS分析验证设计的问卷是否可靠,问卷题目之间是否具有良好的相关性进行分析,被调查者的答案是否存在矛盾,是否可靠等等。

问卷分析的步骤如下:点击分析—-标度—-可靠性分析—–选择项—-确定即可

得出的结果如下:

结果分析:一般来说,问卷是否可靠主要看Alpha(a系数),a<0.7则表示设计的问卷信度不可靠,0.7<a<0.8则说明问卷具有一定的可靠性,0.8<a<0.9则说明问卷信度很好。上面的项数则是选择分析的问卷题目的数目。

在进行下面分析时先说一下问卷的设计。实证分析的论文中比较简单的模型大概可能是:研究对象的影响因素(自变量)会影响研究对象的效果(因变量),A H B ; 即论文假设H为自变量A对因变量B会产生一定的影响。一般可以找出四五个影响因素设计为自变量,每一个影响因素可以设计3—7个问题进行调查。所以在进行可靠性分析的时候可以对每一个影响因素(自变量)的题目数(项数)分析一次,看是否每一个自变量的设计的问题都具有较好的信度。(若某一因素项数信度不够好,首先可以通过调整题目中的表达措词、修改或增加关键词来提高信度,若某道题目修改调整后信度仍然过低则可以删除这一道题目达到提高整篇文章的信度)。

三、效度分析和因子分析

通俗来说,效度分析是检验问卷题目与研究目的是否相一致,即不能研究顾客对某产品的满意度,问卷设计的问题则是调查某产品的市场覆盖率。一般分为内容效度和结构效度,内容效度是指题项与所测变量的适合性和逻辑相符性(我们在设计问卷时一般都要参考或引用前人的问卷,因此内容效度不存在问题,当然如果设计的一份全新的问卷则需要重点分析内容效度)。结构效度是指题项衡量所测变量的能力,实证分析一般着重分析结构效度,可以通过进行探索性因素分析(Exploratory factor analysis,EFA)检验来证明量表的结构有效性。

分析步骤如下:分析—-降维—-因子—-将左边所有变量选到右边变量框中—-描述—选择初始解和KMO—点击继续—–提取—–在提取里选择主成份和碎石图—继续—-旋转—-选择最大方差法。如下图:

得出结果如下:

结果分析:效度分析结果主要看KMO值和sig.(显著性),若KMO>0.7,则说明问卷中设计的自变量之间具有一定的联系,问卷是有效的;sig.<0.001说明该问卷符合做因子分析,下一步则可以进行因子分析(EFA)。

因子分析结果如下(仅抽取部分比较重要的图解释):

看碎石图的关键就是找拐点,也就是找图中陡坡和缓坡的临界点(特征值明显较大的因子),趋于平缓前的点有几个则说明这份问卷可以分为几个因子(当然还要结合特征值、总方差解释等图考察)。如上图看出从第7个点开始趋于平缓,即前面有6个点属于陡坡上的点,初步可以说明这份问卷设计的因素可以分为6个因子。

旋转后的成分矩阵的作用是知道那几道题可以归为一个因子,上面截取一部分作为说明(左侧的数字为问卷中的题项,题目内容已删除)。上图可以看到一共6个成分因子,其中问卷题目5、6、7、8、9、10、26可以第一个因子(成分1对下的数字0.769、0.571、0.714…….均大于0.5,即各个测量题项的最大因素负荷均大于0.5,且交叉载荷均小于0.4则可作为一个因子);同理题目27、28则可以作为一个因子,成为4对下的数字为0.797、0.793…….。

总方差解释图主要看累计百分比的项。如上图6个因子在整份问卷中的总解释能力(累计百分比)达到了72.938%(总解释能力>50%可以说明筛选出来的因子有良好的代表性,当然实际操作中一般>80%的问卷因子解释能力比较好)。所以整份问卷基本可以提取出6个因子作为主要变量,其余的为次要变量。

通过上面三个图的分析,可以确定这一份问卷一共可以提取出6个因子(6个自变量)。

五、相关分析

在进行相关分析前首先要取各个因子的平均值(如上面7道题目作为因子1,因子1的平均值就是取7道题目的维度平均。得出6个因子的维度平均值后进行相关分析。

步骤如下:分析—-相关—-双变量—–将左边的变量选到右边—–在皮尔逊和双变量前打勾—-确定。如下图

得出的结果如下:

上图中,假设前面两个为因子1、因子2(自变量),第三个为因变量。相关性是检验自变量与因变量的关系。可以看出因子1与因变量的相关系数为0.779,且sig.<0.001,说明自变量(因子1)与因变量呈正相关。(相关系数的取值范围介于-1~1之间,绝对值越大,表明变量之间的相关越为紧密)。

六、回归分析

回归分析需要看的图有模型摘要图、ANOVA、系数图等等

步骤如下:分析—-回归—-线性—–选择自变量和因变量—-点击统计—-选择德、共线性等(看自己需要知道什么就选什么,不一定要选共线性诊断等)—继续—-图—-选择XY变量—–继续—保存—-继续—确定。如下图:

得出结果为:

模型摘要图主要看R方和德宾值(D-W),调整后的R方为0.684说明自变量对因变量的可解释程度为68.4%(R方代表的是自变量对因变量的解释能力,R方与调整后的R方越接近说明数据越稳定)。D-W值是检验自变量之间是否存在自相关,上图中D-W>2表示问卷中的几个自变量无自相关性,(D-W值的范围记得不是很清楚了,见谅…..)。

即方差分析表,ANOVA表的一个作用就是验证假设(A对B不产生影响)是否成立,一般只看sig.值即可,上图sig.<0.01,说明拒绝原假设,至少有一个对因变量产生显著性影响。

下一步看系数表,系数表则说明有几个自变量对因变量产生显著性影响。如下图:

上图中回归系数b是通过样本及回归模型通过SPSS计算得出的,是反映当自变量x的变动引起因变量y变动的量。主要看显著性,因子1、2、3的sig.<0.05,说明3个因子均对因变量产生显著性影响。

从上面可以看出,相关性分析是检验自变量与因变量之间是否具有相关性(正向或反向相关),回归分析则说明了自变量对因变量是否具有显著性影响。

当然上面提到的步骤和图大部分是我感觉论文需要用的,还有很多像散点图等一些小细节很多也没有写,一个是因为篇幅有限,一个也是因为时间也过去大半年了,有很多也记得不是很清楚了,上面写的内容基本是我去年写论文后学到的,很多都是个人的理解,仅供参考。希望大家毕业季顺利!


——————————————-—— 更新一下——————————————————

最近电脑借给别人了,本来想等拿回电脑再跟新一下,想想还是趁着这两天闲一点回答一下各位的问题。

在写这一篇文章的时候我想我已经说得很清楚了,本人非SPSS专业,大学期间也没有开设过这门课程,仅仅是写论文的时候涉及了单因素分析的一点皮毛,多因素及多元回归分析并未涉及,可以说我会的基本已经在文章中写出来了。我的毕业论文也仅仅是构建简单的模型和简单相关回归分析得出简单的结论。所以说毕业涉及关联分析,卡方检验,中介变量和多元回归分析,数据有问题等比较深入的知识的小伙伴也不要为难我了,不是不想回答,实在是问了我也不懂啊。

以下整理了一些简单的问题回答一下:

一、录入问卷数据的具体步骤:

第一种方法:打开SPSS软件,可以看到SPSS左下角有两个视图界面—-数据视图和变量视图,点击变量视图,可以看到“名称、类型、宽度、值”等一些列,在“名称”那一列输入问卷题目,“类型”那一列设置为数值、在“值”的那一列赋值,具体怎么赋值看个人问卷的设计,一般情况下可以设置为1非常不同意,2不同意,3不一定,4同意,5非常同意。(具体能不能反方向设置,我觉得要看分析结果,怎么设置能得出有效的信度效度分析结果数据就怎么来,论文答辩也不可能要你用电脑一步一步来操作,并且像赋值这么简单的问题也不可能会问,只要能把一篇论文从头到尾圆润起来,其他的细节没必要那么较真)。

第二种方法:现在问卷数据收集一般是在问卷星或其他网站上发布,数据收集完成后可以在问卷星或别的网站上将自己的问卷下载成excel格式的文件,打开SPSS直接导入excel文件(点击文件—打开—数据—选择excel数据类型–导入)。

二、如何求每个维度的平均?

在做相关性分析前首先求维度平均,打开Spss,在窗口栏点击“转换–计算变量”,在里面输入每个因子对应的题目和公式就可以得出维度对应的均值平均。如下图:比如说维度1对应的题目有3道题,在目标变量的框中填上维度1,在数字表达式的框中写上公式:=(题目1+题目2+题目3)/3。

求出各个维度的均值,然后就可以进行相关分析了,直接将均值得分的各个维度选到相关分析的变量框中就可以,接下来的步骤看以上文章。

三、对自变量进行效度分析,这个时候是不是在抽取里应该选特征值大于4的,然后才能出来4个公因子?

不是,特征值选大于1就行了。因子分析的目的是降维,筛选出能解释题目数量比较多的因子。这就是说明为什么一个因子维度能对应几道题目。如果一个因子只能解释一题目甚至连1道题目的方差都不能解释,那么这个因子在这份问卷中也没有什么意义了,可以直接忽视。所以说提取特征值大于几和公因子的数量没有很大的关系,一般来说,提取特征值大于1是比较公认的标准。特征值大于1的意思是提取出的因子能解释1道题以上的方差,如果选大于4的话则说明接下来提取出的因子则可以解释4道题以上的方差。

四、在信度分析时,那个值该怎么写,问卷信度总是0.5多 ,不懂那个值怎么写?

信度分析主要看Alpha(a系数),a<0.7则表示设计的问卷信度不可靠,0.7<a<0.8则说明问卷具有一定的可靠性,0.8<a<0.9则说明问卷信度很好。0.5小于0.7说明问卷信度不可靠,接下来的分析也用不到了,建议调改问卷或数据。

五、如果两个变量的sig值为0.531,说明了什么?

SPSS的原理是假设A对B不产生影响,分析得出的结果P(sig.)<0.001/0.01/0.05,则假设不成立,即A对B具有显著性影响。如果sig.=0.531大于>0.05,说明假设成立,A对B(或B对A)不产生影响,任何一方变动都不会影响另一方。

六、如果要做多个因素对一个结果的影响程度,应该使用什么分析?

多个自变量对一个因变量的影响分析,参考我的文章,一般信度效度分析,相关分析,线性回归分析即可。

七、为什么我的相关性分析出来没有星号?

有没有星号这个什么原因我也不清楚,你可以看一下你使用的版本,我用SPSS24.,相关分析有星号,回归分析没有星号。星号对数据有什么影响我也不清楚,去年我写论文的时候也没有关注个这个问题。

八、这些数据得出来了,怎么运用到论文中呢?

这个问题我真不知道怎么回答……数据得出来了,就说明你的实证分析那一章也写好了。结论建议那一章就可以根据分析结果提出来。前面的绪论、文献综述这些纯理论性的也不用说了,数据分析前模型假设/问卷设计这一章写完了才可以进行实证分析也不用考虑了……

九、一个维度至少3-7个题目是在哪本书上看?

没有在哪本书看到的,大概是在知网的期刊和论文上看到的,参考的论文一般也是3到7个问题,维度对应的4、5个问题的居多。

十、中文版在哪下载:

去年我是在淘宝花的十几块钱买下载的,现在很多人反映已经安装不了了,大家可以在微信搜索安装包,很多公众号可以免费领取噢

更新更新更新更新!!!!!!!!

还是有很多小伙伴问维度平均怎么求,今天特意用SPSS操作了一遍,回答一下之前的问题。

第一:有人问维度是什么,怎么来的,简单的说,维度就是因子,一个因子就代表一个维度,在做因子分析的时候,我们就能把问卷的所有问题归类,哪几道题归为一个因子,就说明这几道题属于一个维度,一份问卷有几个因子就说明有几个维度。所以维度就是做因子分析得出来的结果。

第二:维度平均的操作步骤

上面也多多少少说过怎么算,不过还是有很多小伙伴算不出,今天我就具体说一下。

1.在SPSS的窗口栏上点击转换—-计算变量,如下图:

2.在计算变量界面上命名目标变量和输入公式,公式之间点击界面键盘上的数字及符号输入,如下图:

3.点击确定后SPSS输出界面如下:

4.返回SPSS数据视图和变量视图在问卷数据旁边会增加一列均值数据,如下图:

且在计算变量界面下的类型和标签框中也会增加维度平均的标签,如下图:

这样一个维度平均值就算出来了,每个维度平均算出来之后,就可以进行相关分析和回归分析了。

希望大家都能顺利!

 

转载请注明:徐自远的乱七八糟小站 » SPSS分析问卷数据的流程——一篇带你学会SPSS

喜欢 (44)

苏ICP备18041234号-1 bei_an 苏公网安备 32021402001397号