5.1.1 度量尺度
所谓度量(measurement),就是按照一定的规则为某些对象、人、状态或事件的特征或属性指定适当的数字。由此可见,我们要度量的并不是对象、人、状态或事件本身,而是它们的特征或属性(attribute)。度量中所使用的数字与我们通常所理解的数字也有所不同。这里所指的数字只是用来表示对象某一特征或属性的符号而已,不一定能进行算术运算。有时,这些数字也可以用字母或其他记号来代替。
数字或符号的具体含义取决于我们所要表示的特征或属性的性质。
度量规则的确定是度量最关键的方面。一旦度量规则确定以后,被度量对象的特征或属性就能根据这些规则来描述了。度量规则也称为度量尺度,最常用的度量尺度有四种:类别尺度、顺序尺度、等量尺度和比例尺度。
1.类别尺度
类别尺度(categoricalscale),又称名义尺度(nominalscale),是用指定的数字来识别对象或人们身份的一种尺度方法。这是最简单的一种度量尺度。采用这种度量尺度时,我们首先把度量对象划分为几大类。这些类别对于被度量的总体而言,是既不遗漏也不交叉或重叠的,即每个对象都是属于其中的一类,而且只属于其中一类。然后,对每个类别指定一个数字。属于同一个类别的对象都具有同样的数字。具有同一度量数字的对象都看做是相同的。这种度量尺度中的数字本身并没有数学上的含义,换句话说,其中的数字并没有大小之分。它们的作用仅仅是表明每个度量对象所属的类别。因此,这些数字即使用字母或其他符号来代替,作用也一样。有时,为了便于作深入分析,也可以考虑以观察到的每一个类别中的实际发生值,即频数作为这一类别的尺度值。人们的身份证号码、邮政编码和银行信用卡账号等就是一些最常用的类别尺度的例子。
在市场调研中,类别尺度主要用于将调查问卷中所得到的结果进行分类编码,以便将每个被调查者回答的结果归入一个特定的类别。例如,被调查者的性别、职业、地理位置和婚姻状况等都是用类别尺度来度量的变量。
2.顺序尺度
顺序尺度(ordinalscale)就是根据度量对象的某一特征或属性值对被测量对象进行排序,然后,按顺序给被测对象分配一个相应的数字,以所分配的数字代表它们的次序,即为度量值。根据顺序尺度的结果,我们可以得到“在××(属性)方面,××比××更多(或更少)”。可是,在顺序尺度中,相邻对象之间的差距不一定相等,因此,我们并不能说“在××(属性)方面,××比××究竟多多少(或少多少)”。正因为如此,顺序尺度中的数字是不能作算术运算的。间隔相等的两组数字所代表的对象间的属性差不一定相等。例如,按销售量对一批企业进行排序时,第1名与第5名之间的位置间隔和第5名与第9名之间的位置间隔是相等的,都相隔4个位置。但是,第1名与第5名之间的销售量差和第5名与第9名之间的销售量差多半是不相等的。
尽管对于顺序尺度的度量结果,我们也不能实施算术运算,但通常可以利用中位数来反映排序对象特征或属性值的中心位置。人们总是倾向于或偏好中位数一边的特征或属性值,而不喜欢另一边的特征或属性值的。值得注意的是,顺序尺度的排序结果往往是根据个人的判断结果得出的,因此,即使对于同一个对象,不同的人排序的结果也可能是完全不同的。
3.等量尺度
以某一方面属性的单位值(间距)作为标度的手段,以被测对象所含有的单位属性值(间距)的数目来表示被测对象度量值的标度方法称为等量尺度(intervalscale),有时也称做等间距尺度(简称等距尺度)。此时,相等间距数字所代表的对象间的属性差都是相等的。但是,采用这种尺度来度量时,用以标度的单位属性值,以及零点的确定都是随意的。我们在度量周围环境的温度时,既可以采用摄氏温标,也可以采用华氏温标,甚至还可以采用绝对温标,就是一个等量尺度的例子。摄氏温标与华氏温标度量中不仅所采用的单位值不同,而且,所定义的零点也各不相同。而摄氏温标与绝对温标则是采用了相同的单位值,但定义的零点也各不相同。三种温标都能度量出温度的高低,但是所得到的度量数值是各不相同的,因为它们都是等量尺度。
对于等量尺度的结果,常用的统计分析方法都是可以应用的,如平均数、中位数、方差和标准差等都是有意义的。即使是单变量的回归分析和假设检验等方法常常也是可应用的。
4.比例尺度
比例尺度(ratioscale)除了具有等量尺度法的所有特点,即相等间距的数字所代表的对象间的属性差都相等外,它还有一个具有特定意义的零点。用千克表示的重量与用米表示的长度都是比例尺度的例子。对于比例尺度的度量结果,所有的算术运算都是适用的,表示任何一个对象度量结果的数值都可以看做是代表另一个对象度量结果数值的倍数。
在市场调研中,绝大多数的度量值,如销售量、成本、市场潜在销售量、市场占有率以及顾客数目等都是可以用比例尺度来度量的。对于比例尺度的度量结果,不仅算术运算都是可行的,统计分析也都是有意义的。
从上面的分析中我们可以看到,从类别尺度开始,到顺序尺度,到等量尺度,最后到比例尺度,度量结果所包含的信息逐渐增多,所得到的信息也越来越精确。
由此可见,在市场调研中想要获得更完整的信息,要尽量采用比例尺度;若实在无法采用比例尺度也要尽量采用等量尺度;再次之是采用顺序尺度;最后才考虑类别尺度。但是,另一方面,从类别尺度开始,到顺序尺度,再到等量尺度,最后到比例尺度,其度量能力逐渐减弱,适用的范围变小。比例尺度往往无法度量市场调研中的某些对象的属性和特征,如态度、意向和心理信息,即使想要使用等量尺度也经常有一定的困难。此时,市场调研人员就必须在度量能力与度量精确度两者之间作权衡,才能选择一种合适的度量尺度。
5.1.2 度量的有效性和可靠性
在度量过程中会遇到或产生多种误差,这些误差来自于三个方面的原因:被调查者、度量的过程、进行度量时的外部状况。
被调查者会有意无意地造成我们度量过程中的误差。首先,被调查者总是根据他过去的经验和当前的环境来提供问题答案的。任何事物总是发展变化的,从过去到现在肯定存在一定的变化趋势,这就使得被调查者所提供的资料常常只是我们正在搜索资料的近似值。例如,被调查者的个性、社会阶层、职业和其他短期内不变的特征,从长期看也可能会发展变化。其次,被调查者并不会像计算机那样,对同一个问题始终提供相同的答案。许多偶然的不稳定因素都可能造成被调查者提供了一个错误的答案,或者根本就不知道答案是什么。有时,被调查者也可能对某些事物存在偏见,这些都会造成我们所收集到资料的误差。
从度量的过程看,首先,抽样的方式可能造成度量结果的误差。这点我们将在后面专门进行讨论。其次,不管是用什么方式进行调研,问题的形式、问题的含义是否清楚,问题的长短及问题的顺序等都可能造成度量的误差。调研人员与被调查者之间的相互交流的形式,调研人员的个人特征,如性别、年龄、个性特征、衣着风度等因素,以及调研人员有意无意地,在言行上表示赞同或否定态度的流露等,也会影响被调查者的态度和行为,从而造成误差。最后,调研人员对被调查者回答的误解,甚至在对调查资料进行整理、编码和制表的过程中,都会在无意之中产生资料记录整理过程中的度量误差。
进行度量时的外部状况往往会对调研人员和被调查者产生影响,从而造成误差。一个被调查者在同事、朋友和亲属在场时的回答可能会与单独一个人时的回答不同。调查现场的周围温度、噪音大小和具体地点都自然会影响到调研人员与被调查者双方之间的情绪而产生误差。由于理想的调查度量环境是不容易得到的,因此,我们必须注意创造一个适合于调查度量的小环境,尽可能减少由环境引起的度量误差。
由于度量中存在产生误差的诸多可能性,因此,就必须考虑度量有效性和可靠性问题。
1.度量有效性
度量有效性(validity)是指用一种度量方法或手段来测量某一个对象时,所得到的结果反映被测量对象实际情况的程度,也就是指我们所度量的结果是否就是我们想要度量对象的实际值。度量有效性所关心的是度量方法或手段是否能够避免系统误差的程度,即测量结果的均值与实际真实值保持一致的程度。然而,问题在于,我们无法知道所度量对象的实际真实值究竟是多少,因此,也就无法直接判断度量的结果是否有效。因此,通常我们会从下列几个不同的侧面来衡量度量有效性:内容有效性、结构有效性、一致有效性和收敛有效性等。
内容有效性是指所采用的度量方法是否实际上度量了它所计划度量的特性的程度。内容有效性只能依靠有关专家主观的判断来确定。值得注意的是,除了依靠内部专家以外,还要注意倾听外部专家的意见。
结构有效性是指度量方法是否确实考虑到了影响度量结果的各种因素。这是衡量度量有效性中最复杂的一个方面。
一致有效性是指我们所度量的结果与其他人对同一个问题所度量的结果是否一致的程度。如果我们所度量的结果与其他人对同一个问题的度量结果是接近于一致的,则我们就说度量方法是一致有效的。
收敛有效性是指,当我们试图度量某一概念或属性时,应当可以用各种不同的度量工具和方法来得到所需要的度量结果的程度。不仅如此,由各种不同的方法所得到的结果都应当收敛到同一个数值。事实上,各种不同的方法都有各自的优缺点,如果收敛有效性好,用多种不同的方法都会得到同样的结果,则所得到的结果代表对象的真实值的可能性就很大了。当然,也有可能是两种方法都导致了同样的不正确的结论,此时,就需要考虑其他的非随机因素的影响了。
1.可口可乐公司关于配方的调研
20世纪80年代可口可乐公司决定开发一种新型可乐,以取代沿用了近百年的老配方。对顾客口味作随机测试的结果,发现顾客更喜欢百事可乐的甜味,而不是可口可乐的干爽味。其实,这个结论最早是由百事可乐公司得出的,可口可乐公司的测试也证实了这个结论。此后,可口可乐公司开发了一种新的可乐配方。从1982到1985年历时3年,可口可乐公司耗资400万美元,对近20万名消费者进行测试表明,55%的消费者倾向于新可乐的口味,53%的消费者喜欢新可乐的商品名称。1985年4月新可乐正式上市,公司决定停止生产老配方的可乐。
消息传出,大量的抗议电话和雪片似的抗议信纷纷涌向可口可乐总部。大量的可口可乐爱好者愤怒地上街游行,举行抗议新可乐的集会,他们宣称,如果可口可乐公司不按老配方生产将正式提出控告。
随后,可口可乐公司又重新作了公众调查。结果发现,在6月份还有48%的人喜欢新可乐,到了7月初就只有30%的人喜欢了。于是到7月11日,可乐公司不得不决定重新按老配方生产可乐,并一再向顾客道歉。
2.日本索尼公司关于随身听的调研
日本索尼公司的随身听是20世纪80年代最成功的消费品,但最初的市场调查曾经表明,人们不喜欢这种产品,认为一个神经正常的人怎么会带着录音机到处乱跑呢?如果索尼单纯根据调查结果来制定决策的话,就不会有随后的随身听了。
由于某些市场调研并没有收集到正确可靠的数据,有人就认为消费者往往是言行不一的,因此,市场调研所收集到的资料就毫无意义。事实上,这种情形往往是由于消费者所处的环境之间的差异所造成的。在接受市场调研时,消费者所处的环境使得他们完全是理性的,但是在市场上实际消费时,消费者常常在理性中掺杂着感性的成分,从而造成实际情形与调研结果之间的差异。但是,如果调研人员能够尽力减少,甚至消除这种差异,就能保证所获得信息的真实可靠性。
2.度量可靠性
度量可靠性所关心的是,在某个时候所进行的多次度量中,度量结果的一致性和稳定性。度量可靠性(reliability)是指某种度量方法避免随机误差的程度,我们可以用以一种度量手段度量某一对象时所得到的变差大小来表示。尽管结果的一致性是度量可靠性的一个特点,但这绝不是说,可靠性只有当多次反复度量时才有意义。可靠性所关心的是要消除和减少随机误差的影响,使我们得到的结果接近实际值。因此,即使只度量一次,讨论可靠性问题也仍然是有价值的。通常,我们从以下几个方面来评价度量结果的可靠性。
(1)试验-再试验可靠性。试验-再试验可靠性是指在使用同一种度量方法,在几乎相同的条件下,重复测量同一个被测对象时,所得到的结果的一致性。如果度量方法可靠,被度量对象在两次度量过程中保持不变,则对同一个度量对象的第一次度量与第二次度量的结果应当是相当接近的。这就称为试验-再试验可靠性。
如果我们确信第一次度量对第二次度量有一定的影响,使第二次度量包括了第一次度量的影响,则评价试验-再试验可靠性就不合适了。例如,如果第一次度量中包括了某些关于被测者对于某一项服务或产品的态度,则这次度量就可能使他们对媒体关于所研究对象的表达、宣传或广告都会变得更敏感。这样,第二次的度量结果不仅包括第一次度量中的内容,而且,还应当包括第一次度量所引起的敏感和附加知识所产生的影响。除了上述第一次度量值的影响外,多次度量也可能引起度量对象的烦恼、疲倦、冷淡和不合作等情绪,这些都可能使对试验-再试验可靠性的评价受到限制。
因此,如果采用某种特定的度量方法,两次度量所得到的结果不一致,则我们往往很难肯定究竟是方法不可靠,还是由于某些因素的变化而引起的结果的差异。
不过,如果两次度量所得到的结果是一致的话,我们一般就可以肯定这种度量方法具有试验-再试验可靠性。
(2)抽样分割可靠性。如果把一个抽样样本分割成两个或更多个随机选取的子样本,用某种方法或手段来度量每个子样本所得到的结果都是一致的,我们就说这种方法具有抽样分割可靠性;否则,我们就说不具有抽样分割可靠性。
(3)替代形式可靠性。如果采用两种等效的度量方法对同一个对象进行度量所得到的结果是一致的,我们就称这种度量方法具有替代形式的可靠性;否则,就没有替代形式的可靠性。
度量方法的有效性和可靠性在市场调研中是相当重要的。我们当然希望度量所得到的结果兼有有效性和可靠性,但是,从度量结果的角度看,任何度量方法的结果都可能产生四种不同的情形:既不有效也不可靠,有效但不可靠,可靠但无效,既有效又可靠。
性可能不能兼得。但是比较起来,有效性涉及度量的基础,即我们所得到的是否就是我们真正想要度量的东西,所以,在两者中间起着更为关键的作用。当用某一种方法重复地度量某一个对象时,可靠性也就显得很重要了。