《大数据时代》译者周涛:传统领域是大数据创业蓝海

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:
穿着拖鞋、挽着裤腿的牛仔裤,手拿老款诺基亚直板手机,9月14日,在城南一家白领穿梭的高档商务写字楼,国内 大数据 行业领军人物——电子科技大学“80后”教授周涛,热情地走进了记者的视线。

“大数据时代已经来到我们身边,并没有那么多的云遮雾绕,而是相当接地气。”短短一个小时,周涛用身边的例子和最直白的表述,拨开大数据的神秘面纱,描述了一个常人可以触摸的数字化时代?

什么是大数据?

“一切都被记录,一切都被数字化。”

从硅谷到成都,大数据,这个新鲜的话题正全球同步热传。一场关乎每个人生活、工作和思维的大变革正在悄然发生,大数据时代迎面袭来。

到底什么是大数据?

周涛认为,“大数据”是“数据化”趋势下的必然产物。数据化的核心理念是:一切都被记录,一切都被数字化。“最近两年,数据量爆炸性剧增,所产生的数据量等同于2010年以前整个人类文明产生的数据量总和。”

浏览过的网页、去过的地方、吃过的东西、购买过的产品……不经意间,我们生活中的很多数据已经被记录,身处数字化生活时代,我们既是主动参与者,也是数据的被动贡献者。数字忠实地记录下我们的真实行为,还原出另一个真实的“你”。

这么多被记录的数据,有什么用?

周涛解释,“大数据要求数据能充分发挥其外部性并通过与某些相关数据交叉融合产生远大于简单加和的巨大价值。”比如,国家电网智能电表的数据可以用于估计房屋空置率,淘宝销售数据可以用来判断经济走势,移动通讯基站定位数据可以用于优化城市交通设计,微博上的关注关系和内容信息可以利用于购物推荐和广告推送……

最近,周涛和他的团队正在做一件有意思的事情——寻找校园中最孤独的人。他们从电子科大3万名在校生中,采集到了2亿多条学生行为数据。这些数据来自选课记录、进出图书馆、寝室,以及食堂用餐、超市购物等数据。通过对不同ID卡"一前一后刷卡"的记录进行分析,可以发现一个学生在学校有多少亲密的朋友,比如恋人、闺蜜、死党。

“我们寻找到了800多个最孤独的人。他们平均在校两年半时间,一个死党都没有,这是一件很可怕的事情。”周涛分析,数据背后表现出这些学生存在一定的社交障碍,这些人中17%的人可能产生心理疾病。由此,学校可以对这些学生更加关注,有针对性地帮助他们解决心理问题。

这项针对在校大学生行为的大数据研究,是教育部网络文化建设示范性项目中的亮点。在周涛看来,这样的行为数据研究还有广阔的应用市场,比如可以移植到高强度的劳动密集型行业中,关注广大产业工人的心理疾病问题。

如何利用好大数据?

数据流动才能带来更大价值

近期,成都市设立全国第三个大数据管理局的消息,又一次提振了成都大数据产业发展的信心。

“推动新兴产业发展,成都再一次走在了全国前列。”在周涛看来,大数据管理首先带来的改变,就是将实现全市政务数据的共融共通。目前,各部门都储备了大量既权威又高价值的数据,但却很难实现部门间的数据共享。现在通过大数据管理局的牵头,就能实现政府部门权威数据的高效管理和资源共享。

大数据给整个社会带来从生活到思维上革命性的变化。周涛谈,借助大数据,企业和政府管理人员的决策,将会从“经验即决策”过渡到“数据辅助决策”,最后实现“数据即决策”;教育培训、零售业和医疗服务等行业,也将实现对服务对象的数字化和个性化定量服务。

“分割的数据价值有限,只有实现数据的流动才能最大化数据价值。”周涛认为,这个观点也同样适用于当前电子商务的发展。“数据的关联形态正在发生变化,一名用户即在微信上,也在微博上,同时还有线下医保、社保等数据,以及交通出行数据。要了解一名用户,这些数据都需要关联起来进行处理。”

周涛提出,大数据的本质不在于数据量有多少,也不在于是否是异构的数据,而是在于数据是关联的,整体的数据可以流动起来。他认为,跨领域关联,通过一加一产生远大于二的价值才是大数据的精髓。

大数据时代,如何看待隐私问题?

你平凡所以你安全

每一次敲击键盘,每一次点击鼠标,每一次网上交易……互联网生活中每一个习以为常的输入,在周涛的视野中,这一连串与个人生活密切关联的隐私数据,都可能成为大数据企业的“原材料”,企业就可以利用其中的信息,分析消费者的行为,从而为消费者提供个性化、量身定做的服务。但不可避免的,这也会带来个人权利与自由遭到侵犯的隐忧。

实际上,自从有了互联网,保护隐私就成为一个问题,但是以前泄露的方式和途径比较零散,而大数据的技术和理念,使得企业和政府有可能以前所未有的力度掌握我们个人的信息,拼出一个人的全景信息。

“大数据背景下,普通人基本没有能力去保护自己的个人隐私。”在周涛看来,科学和商业进步,都会是一把“双剑”,数字化生活中的隐私保护,个人的应对能力会显得渺小,“那么你为什么还能感到安全?原因很简单,那是因为你生活得平凡。”

“普通用户不必过多地纠结于如何更好地保护,要真正融入大数据时代,享受个性化专属信息服务,就不得不牺牲一部分个人隐私。”周涛直言不讳,“付出巨大努力,放弃很多有意义的服务,尝试保护自己,往往是得不偿失。”

当然,政府和业界需要扛起担子,肩负起保护隐私的责任。周涛表示,政府需要设计出非常苛刻严格的法律条例和行业规则,针对那些非法利用个人隐私来收获不正当利益的企业,“职能部门必须下重手,要一棒打死。”通过提高侵害用户隐私的惩罚力度,使得这种行为本身变得得不偿失。

周涛强调,对能够处理隐私数据的企业,必须尽快制定出准入机制。“我们现在正讨论一个方案,对隐私分等级。”企业如果需要处理某一个层级个人隐私数据,就必须要具备苛刻的准入资质,如企业的软件防火墙、硬件防火墙需要通过安全评测中心的评测,确保不被攻破而造成隐私数据的泄露。

大数据企业如何创业?

从市场痛点入手,做一把杀牛的好刀
“80后”最年轻教授、电子科大博导、最具国际影响力科学家……周涛身上这一连串的学术光环已令无数人仰望。

最关键的,周涛还是个接地气的教授。走出实验室,走出课本,周涛还是创业场上的实战派。

2009年联合创立的大数据科技公司,目前市值超过30亿元;在2013年个人出资1.2万元参与创立的一家注册资本仅30000元的公司中,个人所持股份的市值已经超过3亿元。目前,周涛创立、联合创立和投资的20余家大数据企业市值总和超过百亿。

“创业的风险比较高,但创业也是一件能令人兴奋的事情。”周涛认为,大数据创业,需要集中精力做好五方面功课:找准市场的痛点、具备有优势门槛的核心技术、组建一支专业管理团队、找到优质的数据合作方、选择一家懂自己的基金。

周涛认为,大数据创业首先需要从市场的痛处着手,找准市场的核心需求。如果只有技术,并没有寻找到匹配的市场,手中拿着刀去再找牛,这样的创业一般会失败。“如果现在大家都等着杀牛,我就可以考虑如何去做一把好刀,这样的尝试一般能成。”

8月底,周涛在成都参与创始的一家大数据科技公司,完成了1亿元人民币B轮融资。借助基金之手,短短两年时间,公司规模从3万元裂变成10亿元。“一定找到一个懂自己的基金。”在周涛看来,大数据是不能实现快速盈利的行业,很多创业公司会出现长时间的亏损局面,所以一定要找到一个懂自己的基金。“你的投行不应在财报上有过多的要求,而是要一直支撑公司把技术做得更好更棒。”

成都的大数据创业环境如何?周涛认为,从全国范围比较来看,成都目前具备很好的大数据创业氛围,已有多家有业界影响的公司聚集。但比起北京、上海、杭州、深圳等地区,成都还有一定差距,主要表现在专业的顶级投资机构少,顶尖的技术、运营、市场和金融人才缺乏两个方面。

目前,国内大数据的发展多集中在泡沫较多的垂直应用领域,周涛认为,大数据未来创业的蓝海,应该集中在目前较少关注的传统领域,如医疗卫生、食品安全、工业制造、农业养殖等领域,“因为从无到有、从0到1的创新,带来的价值增量更加可观。”创业者可以更多地关注具有颠覆性的硬技术创新,以及大数据在“似乎不可能用到大数据”的传统行业的巨大价值。


本文作者:佚名

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
存储 分布式计算 数据挖掘
什么是大数据?2022大数据时代
什么是大数据?2022大数据时代
213 0
什么是大数据?2022大数据时代
|
大数据
大数据是什么?大数据时代四个特点
大数据是什么?其实很简单,大数据其实就是海量资料巨量资料,这些巨量资料来源于世界各地随时产生的数据,在大数据时代,任何微小的数据都可能产生不可思议的价值。大数据有4个特点,为别为:Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值),一般我们称之为4V。
2113 0
|
机器学习/深度学习 人工智能 算法
四说大数据时代“神话”:从大数据到深数据
在机器学习方面始终有个基础性的误会,即更大的数据会形成更快的学习效果。殊不知,更大的数据并非意味着能发现更深刻的信息。事实上,与数据的规模相较,数据的质量、价值和多样性更最该关注,即数据的“深度”胜于“广度”。
1193 0