统计数据(1)我们生活在一个统计数据的年代。我们日复一日地接受着大批数据的轰击:艾尔顿·约翰售出7,000万张唱片,美国12%的18岁以下儿童患有不同程度的心理疾病,法国每年生产大约20亿加仑葡萄酒,伊拉克的识字率为71%,美国人每年消费7亿多磅花生酱。这些数字的意义何在?我们大多数人可能都说不出个所以然来。但是,如果我们用数字的方式表达这些统计数据,我们会对自己的了解感到安全可靠一些。根据19世纪的物理学家洛德·凯尔文的说法:“当你能够计量自己所谈论的话,并且用数字表达出来的时候,你对这个话题一定有所了解。但是,如果你不能够计量它,如果不能够用数字表达自己想说的话,那你对这个话题的了解……是不足的,也不能够令人满意。”正是这种广泛为人接受的想法,才使得适合利用的统计数字成为说明和支持思想的有效工具的。跟简短例子一样,统计数据经常也会为演讲人所引用,以说明或强化演讲人的观点。下面的例子说明三位学生如何在演讲中使用了统计数据:为了纪录地球上的动物所处的危险状态:“世界观察学院报告说,世界物种当中,有11%鸟类、25%的哺乳动物和34%的鱼类面临绝种危险。”为了强调对乳腺癌研究的需求:“根据外科总局的资料,每三分钟便有一例乳腺癌被诊断出来,每十二分钟便有一人死于乳腺癌。”为了说明美国教师的短缺情况:“如教育部所称,在接下来的10年里,每年需要新雇请20万名教师才能跟上学生增长的要求。”统计数据可以合并使用,一层一层叠加起来说明一个问题的严重程度。有个学生谈到了嚼烟草的危险,里面就用到这个技巧,效果很好。为了说明自己的观点,说明嚼烟草是一种广泛存在的问题,演讲人引述了下面的数字:根据美国癌症协会的数字,每12名美国人当中便有一个是经常嚼烟草的人。第一次嚼烟草的平均年龄为10岁左右,这意味着许多儿童在读四年级的时候就开始嚼烟草了。美国癌症协会还报告说,高中男生有40%试过嚼烟草,而且,更糟糕的是,有20%上幼儿园的儿童也试过嚼烟草。儿童在没有看明白警告标签之前就开始嚼烟草了。
这是一篇得到有力论证的演讲。但是,如果演讲人只是说了下面一句话,则效果会差得多:包括儿童在内的很多人都嚼过烟草。这第二个陈述既没有第一个包含了很多细节的统计数据清晰,也没有很大的说服力。统计数据使演讲人的陈述可信,也很具体。当然,听众并不记得所有的数字,但是,这并没有关系。拿出一系列数字的目的是要对听众产生总体的影响。听众回忆得起来的是,有一大堆统计数据支持演讲人的立场。理解统计数据达莱尔·哈夫写过一本有名的书,叫《如何利用统计数字撒谎》。在这本书里面,作者抨击了数字不会说谎的观点。严格地说,数字是不能够撒谎的。但是,数字很容易为人所操纵和扭曲。例如,下面的话,哪一句是真实的?1.加料白面包比完全面包更有营养,因为里面包括同样多或更多的蛋白质、钙、维生素B1和核黄素。2.完全面包比白面包更有营养,因为里面包括七倍多的纤维,加上更多的铁、磷和钾。大家可能会看到,两个陈述都是真实的。你还可能听到两种陈述中的一种,这取决于谁在向你卖面包。人们能够在所有领域里玩弄数据。下面两句话里面,哪一句是真实的?mpanel(1);1.印度豹测量出来的速度为每小时70英里,它是世界上奔跑速度最快的动物。
2.麋鹿测量出来的速度为每小时61英里,它是世界上奔跑速度最快的动物。印度豹吗?不一定。不错,印度豹奔跑的速度是快些,但只在短距离奔跑中是如此。麋鹿可在远得多的距离内保持它的高速奔跑速度。谁更快呢?这取决于你在测量什么。用人类的话说,印度豹会赢得百米赛跑,但是,麋鹿却能赢得马拉松赛跑。
当你处理钱的事情时,统计数字能玩出更大的把戏。例如,考虑下面的事实:1.1947年,哈里·杜鲁门总统的工资是7.5万美元。2.1967年,林顿·约翰逊总统的工资是10万美元。3.1997年,比尔·克林顿总统的工资是20万美元。哪位总统得到的钱最多?这要看情况。从纯粹数学的角度看,克林顿挣的工资最多。但是,我们都知道,今天的一美元能够买到的东西,远没有哈里·杜鲁门总统时期能够买到的东西多。反映通胀水平的一个尺度是消费者物价指数,这个指数评估任何一个年份中一美元相对于1967年的购买能力的价值。如果我们把消费者物价指数应用到这三位总统的工资当中,就可以看出三个人按1967年的美元价值各挣多少。
1.1947年,哈里·杜鲁门总统挣到10.4万美元。2.1967年,林顿·约翰逊总统挣到10万美元。3.1997年,比尔·克林顿总统挣到5.9万美元。换句话说,虽然克林顿的工资最高,但是,他那20万美元的价值比杜鲁门总统的7.5万美元少得多。这里的意思是说,从统计学的角度看,人们看到的东西远不是事实。查找演讲的统计资料时,一定要评估这些统计资料的价值,主要从以下几个方面的问题着手。这些统计数据是否有代表性?打个比方说。上课路上,你随机选择十名学生,问他们是支持还是反对政府为读私立学校的学生提供免税优惠。再打个比方,有六名学生支持这样的免税计划,而另外四名学生反对这样的计划。你说私立学校里面支持政府为私立学校提供资金支持的比例为60%,这个说法准确吗?当然不准确。十个学生并不是足够数量的样本。但是,哪怕是足够多数量的样本,其他的问题仍然存在。受访的这十名学生是否能准确反映新生、二年级学生、三年级学生和四年级学生的比例?他们能代表男学生和女学生的比例吗?不同的专业是否得到足够的表达?非专职学生和全日制学生的比例如何?不同文化和宗教背景的学生是否得到表达?简短地说,要确保你的统计数据能够代表你要测量的东西。统计尺度是否得到正确利用?这里有两组数字:第一组:7,5006,3005,0004,4004,400第二组:5,4005,4005,0002,3001,700我们来把三个基本的统计尺度用在这每一组数字当中:平均数、中值和众值。平均数,一般称为均数,是把一组数字里面所有的项目加起来除以项数来确定的。第一组里面的平均数是5,520。第二组里面的平均数是3,960。中值是指一组数字按从最高到最低的顺序排列下来以后,处于中间位置的数字。第一组和第二组数字的中值一模一样,都是5,000。众值是一组数字里面出现频率最高的数字。第一组数字的众值是4,400,第二组数字的众值是5,400。请注意下面的结果:第一组第二组平均数5,5203,960中值5,0005,000众值4,4005,400所有这些计量尺度都有同样的一个目标,指明一组数字的典型状况或特点。但是,我们来看看,根据使用的尺度不同,两组数字的结果有很大差别。不同尺度之间的差别有时候很惊人。例如,纽约、洛杉矶和芝加哥等主要媒体中心之外的地方电视新闻播报员的平均工资为每年60,800美元。但是,大部分地方播报员都挣不到这么多的钱。这个平均值因为付给少数几位地方电视台的明星播报员的超高工资(多达每年600,000美元)而抬高。对照而言,地方新闻播报员的中值工资为43,000美元,这个数字不值得人们嘲笑,但是,比平均的工资水平还是少了17,800美元。演讲人应该如何利用这不同的尺度呢?电视台的拥有者可能会引述平均工资数(60,800美元)说明地方播报员的工资水平已经很高了。新闻播报员组织则可能会强调中值(43,000美元)显示工资水平远没有电视台拥有者所说的那么高。两个演讲人都说了真话,但是,除非他们澄清统计数字的意义,否则都不是诚实的话。