调查中收集的资料必须进行整理、编辑和分析、解释才能变成有用的东西。资料的整理和编辑就是把调查所得到的一系列数据转换成为便于解释的形式。分析和解释则是把整理和编辑后的数据以某种有意义的形式表达出来,从中得出描述性叙述或关于某种关系结论的过程。资料的整理和编辑尽管很烦琐费时,又枯燥,但却是数据分析和解释的基础,是必不可少的。资料的分析和解释是一个得出最终的有用结论,以便提出对决策有指导意义的建议和结果的过程,是整个市场调研的“收获”阶段,是整个调研中十分重要的一个步骤。
8.1.1 资料的整理和编辑
资料的整理和编辑包括整理、编码和制表等步骤。对资料进行整理和编辑的目的是要得到一组尽可能完善的而且误差小的基本数据,以便能对这些数据进行分析。
基本数据是指由每一个抽样调查对象对每一个问题回答的记录所组成的一批数据。假定某张调查问卷中有35个问题,每个问题平均有4个选项,这样,每张问卷总共就包括140个变量的值。如果样本数是150人,则基本数据就包括140×150=21000个数据。对资料的整理和编辑过程就是要保证这些数据从调查问卷中尽可能完善地、没有错误地转换为便于分析的数据表格的形式。
1.数据的整理
从现场调查所得到的原始数据必须经过整理和编码才能进行分析和解释。分析所得到结果的质量及随后对结果所作解释的质量,在很大程度上取决于分析前对数据所做的整理和编辑等准备工作。数据整理(editing)就是对问卷中的每一个问题的答案进行审查,看是否有答案,以及答案是否有效。如果某些问卷缺少了关键性信息,也许就应要求调查人员补充相应的资料。整理工作的目的是要保证获得具有可读性和精确性的,并能正确反映原始数据中信息的资料。
(1)数据整理工作的主要内容
①尽量获得丢失的数据,使数据易于阅读并提高准确性。现场调查所得到的许多调查问卷往往仍然有一些项目留下空白,没有回答。在调查问卷由被调查者自己填写的情形,很可能每张调查问卷都会有一些项目,甚至整页都会因被调查者的疏忽而没有回答。留有空白的调查问卷既可以看做是“我不知道”,也可以把它当做完全没有回答的问卷,而弃置不用,丢在一边。不过在许多情况下,整理人员愿意根据实际情况做出合理的决定。整理人员处理这类不回答者意见时,可能有几种选择:既可以让它仍然保持空白,也可以根据被调查者的其他背景资料得到最可能的估计数;既可以补作一次电话调查,也可以再作一次邮寄问卷调查。如果仍然让它保持空白,则可以留到数据分析阶段,再视要求具体处理。
②剔除那些模棱两可和不合规的数据。有时,回答者会把记号打在两种选择之间,有些调查问卷中答案的书写形式不合要求。此时,整理人员往往需要决定回答者的真实意思,或者干脆剔除这些数据。
③检验数据资料的一致性,废弃那些矛盾的数据,保证资料的准确性。整理人员既要注意数据是否存在内部的不一致性,也要注意过分的一致性。某些极端的回答往往是有误差的。如果同一个现场访谈人员所得到的调查结果全是类似的话,那也可能意味着是现场访谈人员不合理的暗示所引起的误差。
(2)数据整理工作的关键
在采取各种措施提高数据的准确性时,应当评价和权衡所花的成本与提高的准确性两者之间的关系。有时,为了保证准确性,花费了很大的代价,但是,结果对提高数据的准确性作用并不大,这就要考虑是否值得了。为了做好整理工作,必须遵守下列原则:
①调查所获得的资料要及时上交,及时整理。这样做就能迅速发现遗漏、无效和含义不清的回答,并及时反馈给调查人员,以便及时修正,改进和完善以后的调查工作。
②整理人员也应当尽量参加部分现场调查工作。整理人员越了解现场访谈人员的记录和书写的风格,则他们对调查问卷中资料的含义就了解得越清楚。这样,他们也就越容易发现现场访谈人员的错误和疏忽。
③原始资料要保留,修改要用特殊的记号来表示。保留原始数据的目的是为将来需要时作参考。整理人员如果需要在调查问卷上作修改也应当用彩色铅笔,以便与原记录区分开来。
④为了减少整理中的误差,应当制定整理办法的规范。整理常常需要做出判断,因此,要尽量制定出书面的编辑规范,减少需要整理人员做出的判断。当整理人员超过一个人时,这样做就更有必要了。规范要明确规定如何处理遗漏的数据,如何检验数据的内部一致性和如何处理含义不清的回答等,保证处理办法的统一。
2.编码
尽管整理与编码往往是由同一个人完成的,但是,编码是一个独立的步骤。编码(coding)实际上就是用数字代码来代表某种答案,以便对答案进行分类的过程。编码的作用是便于对答案进行分析。
编码首先是要规定类别,然后再归类编码。对于两项选择题和多项选择题答案的类别,在题目拟定时就已经确定了。因此,可以采用预编码的方法,即在设计调查问卷时就直接把编码也放在上面。这样在整理答案时就已经自动编好码了。当然也可以采用事后编码的方式,即在完成调查后,整理答案时再对答案进行编码。
对于开放式问题的答案就只能采取事后编码的方式了。编辑人员必须在得到全部调查资料以后,先阅读完被调查者的所有实际答案,然后尽量合并类似答案,确定答案应分成几类,最后对于每一类答案确定适当的代码。
3.制表
编码后的数据还需要录入到计算机中制成表格。制表(tabulation)既是整理归纳的最后一个步骤,也是数据分析工作的开始。常用的表格可以分为两类。第一类是单栏式表格,主要用于对单个问题进行分析,通常用来说明一个问题不同答案的频率分布或比例分布。第二类是多栏式表格,主要用于对多个问题的多因素综合分析。这对于多种不同频率分布状况的分析,对于发现可能存在于某些因素之间的联系往往是很有效的。有时,通过编制多栏式表格往往可以直接发现问题的答案。
编制多栏式表格时,选择栏目是关键,所选择的栏目必须符合调研目的的需要,使用因素的类型和每一个因素的取值都必须随调研目的和性质的不同而变化。但是,如果因素选择不当就可能会得出错误的结果。即使是因素选择正确,但所选的范围和分类不当,也可能找不到数据之间所存在的真实关系。
8.1.2 资料的分析和解释
资料的分析和解释既要利用各种统计分析方法来发现数据所反映的规律,也要对发现的结果进行解释。各种具体的统计分析方法的介绍是应用统计学的内容,并不是我们这门课程的重点。因此,本章随后的主要内容也是讨论各种统计分析方法在市场调研中的应用,而不是重复介绍某个具体方法。不过,在此以前我们首先必须强调对分析结果进行解释的必要性。
在应用市场调研方法来解决企业经营中的实际问题时,应该认识到理解市场调研信息的含义比起实施调研获取信息本身还要困难得多。理解市场信息的真正含义就是对市场信息含义的解释。很多公司通过市场调研获得了市场信息,但是由于没有对市场信息的含义做出正确的解释,结果就没有能够了解到市场的真正需求。
解释就是说明资料分析结果的含义,把纯粹的数据分析结果变成有价值的信息。由此可见,未经解释的数据分析结果常常难以直接指导决策,只有经过合理的解释,才能帮助制定正确科学的决策。
调研人员对分析结果的解释应当抱客观的态度,尽可能地减少偏见。同时,解释过程中调研人员还应当具有洞察力。洞察力是一种由经验中得到的非常有价值的个人才能,它不能从书本以及常规的教条中得到。
有效的市场调研必须与资料的分析、解释和决策相结合
美国微型货车市场竞争的结果再一次证明,对于市场调研资料的分析、解释和应用远比谁先着手开展一项有关的市场调研项目来得更重要。
从1983年起,克莱斯勒的微型货车一直是美国市场上最盈利的产品。实践证明美国存在一个微型货车的巨大市场。但事实上,早在1973年福特汽车公司就开展了对这种车型的调研并制造出了一辆样车。而通用汽车公司也通过营销调研产生了开发微型货车市场的想法,在1979年还试制成了一辆实际上和克莱斯勒的微型货车非常相似的样车。实际上,克莱斯勒是美国最后一家调研微型货车概念的汽车制造商。
但是,福特汽车公司的总裁亨利·福特二世因担心投资太大,风险太高,而否决了正式投产微型货车的建议。同时,通用汽车公司最终也没有选中微型货车。而从福特汽车公司跳槽到克莱斯勒,并当上了克莱斯勒公司总裁的李·艾可卡始终对微型货车具有独特的眼光、天生的信念和特殊的信赖。通过调研,他在确认市场对于微型货车的巨大需求以后,终于采取了行动,把这种微型货车引入了市场,从而使克莱斯勒起死回生,李·艾可卡本人也因此而大获成功。
调研人员在对调查资料进行分析和解释时要注意以下几点:
(1)分析和解释要围绕目标,而且要注意经济性。任何复杂的分析结论都应当来源于简单的基础性观点。不能认为某些方法复杂,所得到的结论就可靠,要注意从小样本得到的结论的限制。
(2)要公正地对待各种证据,不应当存有任何偏见。调研人员在分析和解释时,态度要诚实,绝对不能夸大、隐瞒或歪曲事实。许多调研人员往往倾向于某一种观点的证据,这是应当避免的。在分析调查资料时,不仅要看不同观点在数量上的比例,而且也要看哪些事实是最关键的。有时,那些少数人的意见可能反而是最关键的,会使结论发生根本性的变化。因此,要重视少数人的有价值的观点。
(3)既要考虑数据的集中趋势,也要注意分散程度。在分析某种趋势时,既要考虑到平均值的大小,也要考虑到偏离平均值的程度。因为在平均的过程中,偏离因素被抹掉了,而偏离达到一定程度,某种具有明确方向的趋势也就不存在了。
(4)要区分观点和事实、原因和结果。有时,数据是由有关人员根据模糊的记忆或者粗略的推算得来的,事实上,数据中包含了调查人员的观点,因此,把观点和事实区分开来是绝对必要的。某些研究人员发现相互联系在一起的两个因素时,常常简单地假定其中一个是原因,另一个是结果。其实,研究人员可能忽视了第三个作为真正原因的因素,从而混淆了原因和结果的关系。
8.1.3 数据分析方法的选择
由于统计分析方法种类繁多,在讨论如何应用各种具体的统计方法进行数据分析以前,我们首先需要探讨的是,对于调查所得到的一组数据如何选择适当的统计分析方法。针对某特定调研问题而言,最合适的数据分析技术是由整个调研环境所决定的。在选择数据分析方法时要考虑三个因素:变量数量、数据度量尺度,以及想要回答的问题类型。
所要研究的变量数量是选择统计分析方法时首先需要考虑的。如果所研究的问题只有一个自变量,就可以使用简单的单变量统计分析方法。如果需要描述两个或两个以上的自变量对另一些变量的影响,就必须选择多变量分析技术。
数据度量尺度决定了允许使用的统计分析技术。对于使用类别尺度所得到的数据,至多只能计数,得出不同组的频数和比例,以及众数。对于由顺序尺度所得到的数据可以进行从小到大或从低到高的排序,并将中位数看做是位置平均数。对于等距尺度和比例尺度所得到的数据,可以计算出算术平均数和标准差,来反映调查数据的集中化趋势和离散化趋势。
数据分析想要回答的问题类型,对于单变量分析方法而言,大致可以概括为三类:对调查结果作统计上的描述,说明数据之间是否存在差异,以及说明数据所反映的变量之间是否存在某种关系。对于多变量分析方法,所要回答的问题比较复杂,必须针对不同的特殊问题选择有针对性的方法。