现场调查所得到的原始数据必须经过整理、编码、分析和解释才能得出有价值的结果。数据整理就是检查和保证问卷中每个问题答案的有效性。编码就是用数字代码来代表某种答案,以便对答案进行分类。编码后的数据还需要制表,成为便于分析的形式。
资料的分析就是利用各种统计分析方法来发现数据所反映的规律。解释则是说明分析结果的含义,把纯粹的统计分析结果变成能帮助制定正确决策的有价值信息。选择合理的数据分析方法要考虑三个因素:变量数量、数据度量尺度,以及想要回答的问题类型。
数据分析首先是描述性统计。描述性统计主要分析数据的集中化趋势和分散化趋势。衡量数据集中化趋势的指标主要有:均值、中位数和众数。衡量数据分散化程度的指标主要是方差或标准差。
统计推断就是依据一组调查数据来推断总体参数的值。统计推断可以分为点估计和区间估计。在按比例的分层抽样情形下,如果各层的样本回收率不同,作点估计时特别需要注意防止误差的产生。区间估计是一种更为科学合理的估计方法,但是要求市场调研人员事先确定置信度的大小。
对于一个或两个总体间差异的检验可以采用参数假设检验的方法。然而,分析人员需要区分单侧检验还是双侧检验。对于三个或三个以上总体均值之间差异的检验需要采用方差分析法。
变量影响之间是否独立可以通过χ2独立性检验法来完成。变量之间是否相关可以通过计算皮尔逊相关系数,并根据相关系数的大小来决定究竟是否相关以及相关的程度。变量之间是否存在线性回归关系需要作回归分析。在得到回归方程后,对回归方程进行检验,以确定其有效性是必要的。
多变量分析方法中最常用的是:因子分析法、聚类分析法和判别分析法。因子分析法是一种研究一组变量之间相互关系,并把数量上较多的原始变量简化、压缩或概括为数量上较少的综合变量的方法。聚类分析是一种研究如何对多个对象进行分类的分析方法。判别分析是在已知分组的情况下,判断新的样本应当属于哪一组的问题。