spss数据分析什么意思(描述性统计分析)
在我们获得一些数据后,首先要做的就是对这些数据进行基本的统计分析,例如均值、中位数、方差等。SPSS中的基本统计分析主要包括频数分析、描述性统计分析、探索分析、列联表分析等。这节先来介绍前两种的SPSS操作过程。
一、 频数分析
1、目的
通过频数分析能够了解变量取值的状况,对把握数据的分布特征是很有帮助的。
2、SPSS操作
2.1 操作步骤
对某公司30名职工的血糖含量(mmol/L)进行频数分析。
在SPSS中输入数值或者导入数据文件后,点击分析-描述性统计-频率。

将血糖含量选入变量框中,勾选显示频率表复选框,点击统计会出现右边的对话框,勾选需要的统计量。

点击图表,选择想绘制的图表类型。

2.2 输出结果

需要的统计量在表格中有所体现,并输出选择的图表类型,可以更清楚地观察数据特征和数据分布。在图的右上角有平均值、标准差和个案数作为参考。

二、描述性统计分析
1、作用
描述性统计分析是基础的统计分析过程,可以获得很多统计量的特征。通过描述性统计分析可以计算变量的均值,标准差、标准误差等,并可将原始数据转化成Z分数。
2、SPSS操作
2.1 操作步骤
对某公司的30名职工进行了频数分析后,接下来再对他们进行描述统计分析。点击分析-描述性统计-描述。

将血糖含量选入变量框中,勾选将标准化值另存为变量复选框;点击选项,出现右侧对话框,选择所需统计量。通过选项,我们可以获得很多统计量,比如均值、标准差、最小值等。

2.2 输出结果

在输出的描述统计表中,可以看出变量的各统计量的值。案例的个案数为30,最小值为3.9,最大值为6.1,均值为5.087,标准差为0.6101,方差为0.372。
我们举个例子看一下描述性分析在文献中怎么体现的:

文中选取了275名患者,其年龄在38-75岁之间,通过分析发现他们年龄的平均值为56.72,标准差为12.75,这样我们就能很好地了解患者的整体年龄特征。
除了上述我们在描述性统计分析中经常用到的统计量之外,我们还可以通过以下操作精确地把握变量的分布状况,了解数据的集中趋势、离散趋势、对称程度和陡峭程度。

在选项中点击表示后验分布特征中的“峰度”和“偏度”,点击继续,最后点击确定,即可得到以下结果。

偏度和峰度是用来判断服从正态分布的,偏度系数是描述分布偏离对称性程度的一个特征数。当分布左右对称时,偏度系数为0。当偏度系数大于0时,即重尾在右侧时,该分布为右偏。当偏度系数小于0时,即重尾在左侧时,该分布左偏。峰度系数用来描述其变量所有取值分布形态的陡峭程度。0为正态分布,大于0为陡峭,小于0为平坦。一般情况下,如果样本的偏度接近于0,而峰度接近于3,就可以判断总体的分布接近于正态分布变量类型。
另外,打开原数据集会发现多了一列Z血糖含量,这是由原数据转换成的Z分数(由普通正态分布转换成标准正态分布),通过Z表可以获得正态分布曲线下的面积。