登陆注册
9045200000001

第1章 前言

什么是大数据

最早提出“大数据”时代来临的是全球知名的咨询公司麦肯锡。麦肯锡公司称:“数据已经渗透到每一个行业和业务领域,成为重要的组成部分之一。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

2008年9月,《自然》杂志推出了封面专栏——“大数据”,内容讲述了数据在生物、物理、工程、数学及社会经济等多方面学科所占据的位置和角色的重要性。

如今,“大数据”这个词汇俨然成了工商界和金融界的新宠。在哈佛大学担任社会学教授的加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程。无论学术界、商界还是政府,所有领域都将开始这种进程。”

说到这里,还是有人对“大数据”不明所以:到底什么是大数据?

“大数据”是从英语"Big Data"一词翻译而来的。“大数据”这一概念在近几年逐渐被人们所熟知,并为全球各大企业所重视。简单来说,“大数据”是一种巨量资料库,可以在合理时间内达到撷取、管理、处理并整理为帮助公司、企业经营和决策的资讯信息。

随着云时代的悄然到来,“大数据”渐渐得到了越来越多的企业关注。后来,业界将“大数据”概括成四个V,即大量化(Volume)、多样化(Variety)、快速化(Velocity)和价值化(Value)。

大数据不仅是量大而已

“大数据”的量到底有多大?根据2012年3月的一份调查结果显示:在短短的一天之内,互联网产生的资料内容可以刻满1.68亿张DVD;发出的社区帖子高达200万个,相当于《时代》杂志770年的文字数量;发出的邮件高达2940亿封,相当于美国两年的纸质信件数量;卖出的手机为37.8万台,高于全世界每天出生的婴儿数量37.1万……

截止到2012年,数据量已经从TB级别跃升到PB、EB乃至ZB级别。(1024GB=1TB,1024TB=1PB,1024PB=1EB,1024EB=1ZB)。国际数据公司(IDC)经过详细的调查研究,得出一个结论:2008年,全球产生的数据量为0.49ZB;2009年的数据量为0.8ZB;2010年的数据量为1.2ZB;2011年的数据量更是持续增长,竟高达1.82ZB。这个数据量,相当于全世界的每个人产生200GB以上的数据。可见,大数据的信息量有多大。

IBM公司称,截止到2013年10月,全世界所获得的数据中,有90%都是过去两年内产生的。预计到2020年时,全世界所产生的数据规模将达到今天的44倍。

当然了,“大数据”不仅是量大而已,它还具有多样化、快速化、价值化等优势。

多样化:数据的类型繁多。这种特质也让数据被分为两部分—结构化数据和非结构化数据。相对于以往那些以文本为主的结构化数据,非结构化数据越来越多,包括日志、图片、音频、视频、地理位置信息等。

快速化:处理的速度快。这是大数据区分于传统数据挖掘的最明显的特征。根据IDC的一份名为“数字宇宙”的报告,预计到2020年,全世界的数据使用量将高达35.2ZB。在如此浩瀚的数据面前,处理数据的效率快慢决定了企业生命的长短。

价值化:价值密度低。价值密度的高低与数据总量的大小成反比。

我们来举个例子:一部时长为一小时的视频,在持续不间断的监控中,有用的数据仅仅有那么一两秒而已。因此,如何通过强大的计算方式迅速地完成数据的价值“精纯度”,已成为目前“大数据”背景下需要解决的难题。

大数据—潜藏的金库

随着技术的革新,我们已经踏进大数据时代,而数据背后潜藏着巨大的商业机会,值得我们去挖掘。

根据技术研究机构IDC的研究结果可知,近年来,大量的新数据无孔不入,它们以每年50%的速度在增长。或者说,它们每两年就要翻一番,完全超出人们的预料。

事实上,我们生活的方方面面,都会因大数据的存在而发生变化。如消费习惯、兴趣爱好、人际关系,以及整个互联网的走向与潮流等,都将成为IT行业所关注的重点。当然了,这一切的获取和分析都与大数据息息相关。

我们不能说数据的圈子越来越大,而是全新的圈子越来越多。比如,全世界有数不清的数字传感器依附在汽车、工业设备、电表和板条箱上,它们能准确地掌握方位、温度、湿度、运动、振动,以及大气中的化学变化。

从一方面来说,大众媒体基础上的大数据挖掘和分析,将衍生出令人意想不到的应用;从另一方面来说,基于数据分析的营销和咨询服务也正在崛起。这些专注于数据挖掘和数据服务的公司,将成为IT行业乃至互联网服务业中的新兴力量。

以往,只有像谷歌、微软这样的全球化公司能做关于大数据的深挖和分析。但现在,大数据偏向平民化,让越来越多的IT公司有机会进入这个领域。也因此,大数据领域有了不同的数据分析和服务,促使人们不断地创新商业模式。比如在一分钟内,用户就会在Facebook(脸谱网)上发布近70万条信息;在一分钟内,用户会在Flicker(雅虎旗下图片分享网站)上传3125张照片;在一分钟内,用户就会在YouTube(世界上最大的视频网站)上点击200万次观赏……

铁一般的事实告诉互联网从业人员,这些庞大数字意味着一种全新的致富手段。可以说,它的价值不可估量。

虽然在目前来说,大数据在中国还处于初级阶段,但是它的商业价值已经告诉人们—凡是掌握大数据的公司,就相当于站在“金库的门口”。基于数据交易产生的经济效益和创新商业模式的诞生,能帮助企业进行内部数据挖掘,以便更准确地找到潜在客户,从而降低营销成本,提高企业的销售利润。

百分点信息科技的联合创始人苏萌曾说过:“未来,数据可能成为最大的交易商品。但数据量大并不能算是大数据,大数据的特征是数据量大、数据种类多、非标准化数据的价值最大化。因此,大数据的价值是通过数据共享、交叉复用后获取的最大的数据价值。”在他看来,未来,大数据将会如基础设施一样,有数据提供方、管理者、监管者,数据的交叉复用将大数据变成一大产业。

据一项统计结果显示:截止到2012年10月,大数据所形成的市场规模在51亿美元左右。到了2017年,此数据预计会上涨到530亿美元。

由此,可见“大数据”的价值所在。

改变思维模式,用数据说话

近几年,“大数据”变成了香饽饽,成为各大企业、公司、媒体甚至是学者都津津乐道的东西。他们有着不同的见解和理论,唯一相同的观点就是—大数据时代对人类有着至关重要的影响,甚至即将成为改变未来社会的重要力量。

然而,大数据究竟改变了什么呢?在人们的脑中,这个问题仍然是一个乱糟糟的毛线团,想要找到毛线的一头,却又不知道从哪里入手。

在“第五届中国云计算大会”的第二天,中国电子学会云计算专家委员会候任主任委员、中国科学院院士怀进鹏发表了一篇演讲,题为《大数据及大数据的科学与技术问题》。在演讲中,他表示:“大数据的发展可能会改变经济和社会生活,可能会改变科学研究的途径,甚而改变人类的思维方式。”

我们可以来举一个简单的例子:

苹果公司创始人史蒂夫·乔布斯在罹患癌症后,不惜花费巨额抽取了全身的DNA信息。这样一来,医生就可以根据他全身的DNA信息来判断癌细胞的变化,从而对症下药。然而,对于普通的患者来说,是拿不出巨额钱款来做这种抽取检测的。换句话说,医生只能从普通患者身上提取很小的一部分DNA信息。两者的治疗效果有多大差异,可想而知。

对此,或许你还有疑问,大数据真的能获得最全面的信息,能够找到信息的源头和结果吗?

我们再来举个简单的例子:

如果你上淘宝,登录支付宝账户,点开电子对账单,你是不是能够看到自己一年的消费曲线图?是不是能够看到每个月的支出和收入?是不是能够看到自己的钱花到哪里去了?是不是比拿笔记账清晰和准确得多?根据网络购物的数据中,你还会发现:哪个城市的男人比女人购买的东西还要多;哪个城市的人用支付宝缴纳水电费的频率最高;什么星座的男性或女性在某年的消费额最高;在一年里,在父母或亲友身上花费了多少;节假日时,什么东西最畅销……

这样庞大的数据分析,在过去单一的小数据时代根本无法做到,甚至想都想不到。大数据专家维克托·迈尔-舍恩伯格在《大数据时代》中是这样解释的:云计算在获取海量数据的同时,也带来了数据的混杂性,这会给传统的数据分析带来一些困扰。在以往,我们习惯于由数据得出具体结果。而在大数据时代,我们应当关注的是数据之间的相关关系,而不是数据之间的因果关系。

数据之间的相关关系可以帮助我们捕捉现在的线索和预测未来。如A和B的情况经常一起发生,那么只要注意到B情况发生,就能预测A的情况是怎么样的。这种“A和B”的关系在零售行业和IT行业中已被广泛运用。7-11便利店通过分析零售终端的数据,得出了这样的一个相关关系—温度低于15摄氏度,暖宝宝的销售量便增加5%。于是,只要温度低于这一度数,7-11便利店内的暖宝宝就会上架;豆瓣电台会推荐一些你可能会喜欢的音乐;当你在当当网买某本书后,系统就会提醒你—购买这本书的人中,有30%也购买了另外一本书……

这些结论或预测,都是基于大数据分析而来的。当然了,大数据也为我们带来了另一种生活方式,那就是还有更多的事物都可以数据化。通过对关键词的分析和搜索,我们可以看到购物的习惯被数据化、人际关系被数据化、社会热点和考试重点的走向也被数据化。这些数据可以导出商业潜能,更能导出社会走向。

阿里巴巴创始人马云敏锐地捕捉到大数据的巨大潜能。在2012年,他提出大数据战略,通过资源共享与数据互通创造商业价值。在每年一度的“双十一”销售热潮中,阿里巴巴以云计算为基础的数据服务,对数以亿万计的消费者需求信息进行详细地捕捉,并帮助电商随时调整销售决策。

的确,大数据的出现,不仅改变了人们的思维方式,还让更多的企业和社会决策有足够的力量和依据—以数据说话。

同类推荐
  • 事件营销

    事件营销

    本书将告诉企业如何建立事件营销管理体系、事件营销的操作步骤是什么、如何造势和借势、如何操作一些大事件营销,如奥运营销、世博营销等,以及事件营销如何传播、后续策略、如何避免和应对其负面影响和危机事件。
  • 下一个淘宝卖家精英就是你

    下一个淘宝卖家精英就是你

    为什么同是淘宝卖家,有人能迅速升级为皇冠店铺,有人却止步不前?为什么同是淘宝卖家,有人能赚得满盆金,有人却在不断赔本?本书是淘宝内部专业培训师独家撰写的开店秘笈,专门针对在淘宝网开店的卖家们,用贴切的事例、实用的建议,以及精英范本,向你展现了一个道理:即使从来没有在淘宝上开过店,或者在淘宝上开店经营不善的人,只要通过书中的方法论实践,终能实现成为卖家精英的目标,达到小怡家、柠檬绿茶、韩都衣舍等淘宝名店的销量成就,也不再是梦想。
  • 高新技术企业研发费用绩效问题研究

    高新技术企业研发费用绩效问题研究

    本文拟在比较分析的基础上,采取规范研究和实证研究相结合的方法,借鉴国内外相关研究成果,以西方经济学中的经济增长理论,尤其是著名的R&D模型作为我国高新技术企业研发费用绩效问题研究的理论基础和框架,运用我国沪深两市高新技术上市公司、中小企业板块上市公司、国家统计局以及北京市统计局的有关数据,在我国高新技术企业的框架内探索研发费用的绩效、评价以及信息披露等问题。
  • 《孙子兵法》的战略智慧与管理启示

    《孙子兵法》的战略智慧与管理启示

    本书将《孙子兵法》所提供的谋略应用到现代管理的实践中,系统体会其战略智慧、概括提炼其竞争谋略,铭心透视其管理启示。
  • 经理人情商

    经理人情商

    本书对企业管理者如何进行人文管理进行研究,涉及如何与人沟通,及如何将情商因素融入决策、用人、冲突管理之中等。
热门推荐
  • 恶魔与总裁的霸道姐妹

    恶魔与总裁的霸道姐妹

    一场意外让她和总裁上了"床″从些就被缠上了,妹妹和闺蜜见死不救,被逼去上学,两个人比恶魔还贪玩,一个装老师,恋上了自己班里的学生,倒追十条街,一个装贫困生,惹怒了圣樱校草
  • 至尊之战

    至尊之战

    虚空天外天,又被称为至尊战场。这是处神秘的空间,每百年开启一次,唯有达到至尊方可撕裂空间到达。没人知晓它的来历,只知道天地初开之时便存在。
  • 你的泪,我的殇

    你的泪,我的殇

    一场扑朔迷离的爱情,到底谁爱上了谁。艾小小:原来那个人一直是你,全都是你季珏:我爱过一个女孩,她有着这世界最美好的笑颜蓝乐:你走进了我的世界,而我却走出了你的世界这是一个关于爱与被爱,恨与被狠的故事只是在生命的尽头,到底有谁能说得清楚你…爱过我吗?PS:喜欢多多收藏哦!
  • 列仙通鉴

    列仙通鉴

    上古流传下来的神话,仙人从何而来。一人一兽,将为您娓娓道来!
  • 唯我心源

    唯我心源

    少年热血,携带最强大的机甲,最逆天的资质,穿梭于无数异界之中,与另异面主角之间的激烈碰撞与火花,究竟谁才是真正的王者!
  • 绝色狂妃:废材九小姐

    绝色狂妃:废材九小姐

    她,腹黑强大,回眸一笑,天地失色,风云皆乱。一朝穿越,成为爹不疼,又没娘的将军府嫡九小姐。天生废材,聋哑痴傻举国皆知。当绝代风华的灵魂重回身体,翻手为云,覆手为雨。从此她的命运将由自己改写。他,是绝色的炼狱之王,冷血无情,惊才艳艳,在这乱世中,能与你相遇,相知,相守,从此,天上地下,你若不离,我便不弃。。。。。。。。。。
  • 天璇九变

    天璇九变

    南疆的诡异咒术让他在一次又一次的危难面前,死里逃生。一次本善的流露,让他获得了一个强大灵魂的拥护。为报恩人,却让所爱的人产生误会,陷入危险边缘。试图将他吞噬的魔王,却成了他的囊中之物,从中获得了隐藏的狂暴力量。*******************************************************新书《七州猎魔者》求推荐!求收藏!
  • 天授之路

    天授之路

    一个学会先天功、蛤蟆功、灵犀一指、天外飞仙的少年成长之路。
  • 校园三十六计:甜心PK校草

    校园三十六计:甜心PK校草

    当她第一天来到这个学校,就遇见了一个嚣张讨厌的校草!好吧,来日方长,她有的是时间陪他慢慢耗!第一回合:篮球。哈哈哈,给你个下马威!第二回合:攀岩。开玩笑,这是她强项好不好?第三回合:琴棋书画……好笑,就没有她不擅长的!……可是,每一回合,她都完败给校草!小心灵受到一万点伤害啊!什么?要和校草同居!OMG,她内心在滴血啊!不过为什么这么看来校草还是蛮帅的?啊~怎么办?她好像喜欢上校草了!
  • 魔法协会

    魔法协会

    本书为神魔类小说。有着三只眼的修奇为了解开身世之谜,和朋友斗珍兽,遇狼人,等一系列的奇幻冒险故事。