社会统计分析

统计分析技术在社会研究中的应用。分统计描述和统计推论两部分。

统计描述

通过统计图和统计表对社会研究中的调查资料作全面精确的分类和频次研究,又称分布研究。在全面研究的同时,对资料的特征作简化的研究。简化研究包括集中趋势和离散趋势两种:

(1)集中趋势研究资料的代表性数值。依据测量层次的不同,有众值、中位值和均值 3种。众值是具有频次最多的观察值,主要适用于定类变量的研究。中位值是观察总数中位置居中的值,主要适用于定序变量的研究。均值的计算公式为

公式 符号

式中Xi为个体的观察值;∑Xi为所有观察值总和;N为观察总数。

均值适用于定距以上的变量。3种集中值的选择,虽然主要是根据测量层次来决定的,但还要根据数据分布的形状,当分布严重偏态、非对称时,一般采用中位值作为集中趋势的度量。

(2)离散趋势研究资料的分散程度。根据测量层次的不同,有异众比例、极差和方差(标准差)3种。异众比例是非众值频次在观察总数中占的比例,主要适用于定类变量的研究。极差是观察中最大值和最小值之差,主要适用于定序变量的研究。方差σ2的计算公式为

公式 符号

式中塣为均值;公式 符号为所有观察值对均值的差值平方后的加总;N为观察总数;方差的平方根为标准差公式 符号

方差适用于定距以上的变量。

集中趋势和离散趋势在对资料的简化研究上是相互补充的。例如,均值说明资料的代表值是什么,方差或标准差则说明资料围绕均值的分散性如何。两者的对应有:

众 值凮异众比例

中位值凮极差

均 值凮方差、标准差

除了上述两类资料简化研究的数值外,对于分布的特征可作进一步细致的研究。例如,通过偏态值研究分布是否对称,通过峰态值研究分布的顶端是否尖陡。统计描述的分析,对于双变量的调查资料,还可作相关性的研究,以确定变量间变化趋势一致性的程度。

统计推论

根据局部的样本资料推论总体的性质,以及通过样本的描述性分析来估计总体特征的一种方法。包括两部分:

(1)参数估计问题。根据样本的观察值,合理、科学地估计总体的特征值,如均值、成数是什么或在什么范围,并在给出估计范围的同时,指示它可信的程度或置信度是多少。

(2)假设检验问题。要求根据样本资料对总体的假设,作出概率性的选择。在接受总体假设时,要指出可能犯有纳伪的错误;当拒绝总体假设时,又要指出可能犯有弃真的错误。任何一种判断,无不带有概率的性质,都是在非确定性预测中,求得最佳的抉择。

分类标签: 社会学 研究 均值 方差
热门点击
最近更新