首页 > IT业界 > 正文
大数据是一门技能不是技术 大数据误区就是数据大
2013-05-24         来源:IT863       [我要评论]
大数据在我的眼里,不是一门技术,而是一种技能,从数据中去发现价值挖掘价值的技能。但是,到底什么才是大数据?是Hadoop 那头玩具小象?是千万级别的用户信息还是动辄XXXTB 的数据量?

编前按:感谢诸位的抬爱,让那篇《情色网站的另一面》获得了高曝光量,也让我成功的背上了“色情专家”的沉重标签。受几位频道内容编辑同学的邀请,介绍什么叫“大数据”。后特意将PPT整理为文。只希望能用最浅显直白的语言和案例做一下诠释。本文毫无专业性可言,谢绝一些披着专业外衣的人身攻击,也请真正资深人士点拨一二。(我能说我写此文的最大目的是洗刷色情专家的印记吗??)

这个时代,你在外面混,无论是技术还是产品还是运营还是商务,如果嘴里说不出“大数据”“云存储”“云计算”,真不好意思在同行面前抬头。但是,到底什么才是大数据?是 Hadoop 那头玩具小象?是千万级别的用户信息还是动辄 XXXTB 的数据量?

其实,大数据在我的眼里,不是一门技术,而是一种技能,从数据中去发现价值挖掘价值的技能。

一、大数据的四大误区

1.误区一 大数据就是数据大

“光大是不够的!”当我掷地有声用这句话开场时,正好一个妹子推门而入,听到这句话,微微一怔,低头坐下。

如今在很多场合,一提起大数据,基本都会说“日处理数据量 XXGB ,上传图片 XXGB ,并发数 XXX ”“ Hadoop 集群拥有 XXXX 节点,总存储 XXPB ”……诸如此类的技术语言。但是不是数据大了,就可以达到大数据的境界,可以一起达到人生的大和谐了?

数据再大,不去使用,呆在机房里偏安一隅,那绝不是大数据,而是败家子。在这个问题上,传统的门户网站基本上就属于坐拥金山却无钱上青楼。无论搜狐新浪网易,每天的用户数以亿计,但是除了简单的广告呈现,并没有通过对数据的分析产生更多的价值。之所以没有提企鹅,是因为他们手里有最庞大的 QQ 用户,没推广但不代表没有做,例如当年推出 QQ 圈子的那种惊艳感,现在想起来还触目惊心。

而对于中小网站来说,不用盲目追求先进技术牛逼架构。首先需考虑的是商业运作和推广,只有用户量飙升见红的情况下,再去考虑技术升级。给君一个双选题,A.日登陆用户 1000 人,架构完全参照美国亚马逊从不宕机,B.日登陆用户 10 万人,每天因为高并发不得不宕机三次。你会选什么?

你不觉得“我那个网站因为用户太多太热情又宕机了”这句话又骄傲又装逼么?

2.误区二 懂大数据就必须要懂技术

“我不懂技术,我能学会大数据吗?”

大数据更多的是一种能力,而非技能,这种能力能从无尽的数据里看出商机看出价值。诸葛亮懂兵法,他知道该在哪里伏兵该在哪里生火,他不必知道关羽是如何耍大刀,也不必知道张飞杀人时,蛇矛是扎还是砍。

3.误区三 所有公司都必须懂大数据

我承认如果卖煎饼果子的大妈能开发一个 APP ,拿到客户对煎饼里薄脆是否爽口,辣椒酱是否够味的直接意见,那么很有利于产品的改进。但是你会为一个 3 元钱的煎饼去下载一个 8M 的 APP 吗?

而在移动互联网大会上,Evernote 的 CEO Phil Libin 明确说自己产品的商业模式就是向用户收费,让他们甘心为产品体验付费,而不玩当下流行的大数据那一套。

知道自己能玩什么很常见,而知道自己不能玩不必玩什么更可贵。

4.误区四 数据越多越好

从陈冠希到杨宗瑞,无不透露出浓浓的收藏癖。那些被大家藏在硬盘深处的姑娘们,真的有重见天日的一天吗?无论东京热还是加勒比,由来只有新人亚买碟,有谁听得旧人 COME ON ?

而搜一搜“存款 贬值”的关键词,从“五十年前的百万变 13 块”,到“一万元存一年赔 19 元”都可以看出,钱必须要用才有价值,数据也是一样。

只有不停的使用数据,挖掘数据背后的关系和价值,才能如滚雪球一般,使数据之间的相互关系更丰富更完善。

二、大数据的核心思想

1.有什么不重要,怎么用才重要

在会上,无奈的发现每当举男女之间的例子,众人理解能力就飙升,而讲偏产品技术方面时,下面就一脸木然昏昏欲睡。(诸位!!!你们是来听色情讲座呢?)

Netflix 公司利用大数据来拍《纸牌屋》(House of Cards)的励志故事大家都听过无数遍。Netflix 是美国最大的 DVD 与网络视频租赁网站,他们在国内有 2700 万用户,全球有 3300 万。他们从 29 万的流媒体视频用户处收集到的数据是异常惊人的,每一次搜索,每一次暂停,每一次积极或者消极的评价,还有自己的位置数据设备数据社交媒体数据,在分析完这些数据之后,发现自己的这些观众都喜欢演员凯文·史派西 (Kevin Spacey),还喜欢导演大卫·芬奇 (David Fincher) ,并且喜欢 1990 年的英国同名电视剧。三项综合在一起,Netflix 就下定决心拍摄《纸牌屋》,并将数据分析运用得淋漓尽致。在 Netflix 的观影页面上,提供暂停后截图的功能,他们就依靠这种数据来判断观众更喜欢哪种布景和画面。

当然,这三个因素其实都有不稳定性,例如凯文·史派西也曾拍过只被评了 4.2 分的《弗雷德圣诞老人》(Fred Claus),大卫·芬奇首次执导的《异形 3 》 (Alien³) 也成系列中口碑最差的一部。但是从概率上来说,这三个成功因素都包括的剧集更靠谱。



相关热词搜索:大数据 误区

上一篇:联想手机目标激进 刘军收购黑莓诺基亚NEC化为泡影
下一篇:调查称2016年中国自带设备上班人数将达全球第一

声明:文章内容仅供参考,并不意味着赞同其观点或证实其描述。
新闻排行
关于我们 | 联系方式 | 版权声明 | 招聘信息 |
IT863.COM.CN 版权所有
CopyRight @2011 IT863.COM.CN All Right Reserved