开发者社区> 小旋风柴进> 正文

LinkedIn:我们下一步要做的是数据产品矩阵化

简介: 本文根据美国LinkedIn公司的数据分析部资深总监Simon Zhang在3月7日的阿里巴巴西湖品学大数据峰会的演讲整理而成,他着重分享了LinkedIn对体内数据的搭建、产品化和矩阵化的构想。
+关注继续查看
0.jpg

本文根据美国LinkedIn公司的数据分析部资深总监Simon Zhang在3月7日的阿里巴巴西湖品学大数据峰会的演讲整理而成,他着重分享了LinkedIn对体内数据的搭建、产品化和矩阵化的构想。文章未经演讲者审阅。 


现在的大数据的后面是个大冰川,海平面上的普通人一般能看见,海平面以下是专业人士能看见的。Linkedin内部大约有起码20种不同的数据库,就是完全不同的技术的数据库,还不包括同样一种数据库有不同的应用。但实际上我们真正的内部企业用户,包括Linkedin本身,需要的不是一个大冰川,需要的最后是冰激淋,就想把结果出来就行,他不需要大冰川。 


怎么能做到这个冰淇淋呢?咱们讲讲数据分析的变革。基本大数据分析的三个原则,这个基本的原则是我大约加入Linkedin9个月以后我们决定下来的。我们如果要做一件最重要的事的话,那个事需要有三个属性: 


第一个简单,他出来的结果必须要非常非常简单,没有任何花哨的东西,任何人都能够看明白看懂。

 

第二个迅速,就是刚才说的速度的问题,越慢结束度越低,越快接受度越高。当然在Linkedin使用的是蓝图法则,3秒钟的法则。

 

第三就是要规模化,规模化各这的角度来说,我们当时思考的方法是这样的,希望Linkedin内部所有的员工每一个人都能够用数据来分析帮他们做决策,很快的做决策。


怎么做到这一点? 


第一步,我们需要建立一个真正的金字塔。分析师不应该从数据开始,他必须要从客户、产品、市场、销售开始,也就是说明白公司怎么能做到这件事。他必须要明白如何在这种层面标记未来的事物,标记比数据本身重要得多。分析师本身要分析自己以后要分析什么,这样才能把正确标记加到数据库里面去。他还必须要明白,数据库之间的公用,流程,每种数据是怎么分工的。 


下面就干活了。在Linkedin有一个不成文的共识,你做的东西不仅仅是有趣是不够的,必须要注重执行性。我分析到这个结果以后到底能做什么,这是很重要的。说完了做以后咱们就走到决策,决策本身一定要实现增加商业的价值,或为团队增加价值。

 


第二步是规模化需要用科技来把金字塔变成一个非常小的底,而大的中心,最小的一个尖的一个过程。举个例子,Linkedin我待的九个月之内和另外一个同事合作,完成了500个不同的需求项目和模型,但是当年我们其实直接支持两百个人,500÷200,每年我才回答2.5个问题,这绝对是非数据驱动。后来我们决定是把整个做一个系统,来模拟以前我们两做的大部分工作,这个系统响应3秒钟,简单的规模化了,大概花了三个月,五个人,在内部支持销售的,在今天为止每天这个系统可以服务1000个销售员工,大约用这个系统十次,用一次大约时间是3秒到一分钟,这个系统一天就能做到以前我们两个人做不到的事情,这就是一个规模化的结果。当年出来结果是我们销售增长了175个百分点。 


第三步,产品化。内部的东西大致做到OK了,就要把内部积累的这些实践、经验和产品和规模化的东西,要做到网站上去,要进来大量自然的用户、企业的用户,比如说我们前面讲的那个支持内部销售的分析系统,在去年Linkedin就对外开始了一个新的业务,用数据帮助全世界所有的销售人员变得更有效率。 


第四阶段,不断的开发新的数据产品。我们发现了第一个数据产品后,做第二个就非常容易了,然后第二个产品会利用第一个产品的结果,第三个又用第二个结果,结果造成了数据产品内部的网络化、矩阵化,推动人与人之间的交流、互动、合作。这就是下一步我们准备要做的,就是把所有的产品关联起来,让它们互相提供价值。实际上这都是建立在一个平台上面的,数据是一致的,产品是多样性的,服务的对象既是同一个人又是一个同样一个人不同的面,比方说,作为一个父亲来说需要为我的孩子花钱上学,我作为上班族来说我需要买汽车上班,所以人的需求是不同的,做同样的产品挖掘不同的数据。


原文发布时间为:2014-03-09


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
大数据+AI Meetup 2021 首站!9位大佬解读向量搜索技术在多维场景下的应用
3月20日,阿里云开发者社区联合阿里云计算平台事业部、达摩院共同举办的 BIGDATA + AI Meetup · 北京站向量检索专场即将重磅开启!
1028 0
蚂蚁金服核心技术:百亿特征实时推荐算法揭秘
文章提出一整套创新算法与架构,通过对TensorFlow底层的弹性改造,解决了在线学习的弹性特征伸缩和稳定性问题,并以GroupLasso和特征在线频次过滤等自研算法优化了模型稀疏性。在支付宝核心推荐业务获得了uvctr的显著提升,并较大地提升了链路效率。
1801 0
数据分析八大模型:同期群模型
今天继续来谈数据分析八大模型系列。今天分享的,是一个原理很简单,但是应用很广泛的模型:同期群模型。在商品分析、用户分析、渠道分析上,都用得着哦。
155 0
一张榜单如何透视企业微博品牌价值?
每月定时出炉的企业微博品牌榜,是大量后台多体系数据对比、判断、排名后,自动生成的榜单。尤其在4月引入外分评价维度、重设考核体系后,企业微博品牌榜的出炉带有更多优化变革的意味。调整后的榜单,显得更加真实合理和具有指导性、参考性,让纷繁复杂的社交价值变得更加清晰明朗。
1245 0
文章
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
阿里云机器学习PAI及其在广告营销中的应用
立即下载
阿里云机器学习PAI——及其在广告营销中的应用
立即下载
知识分享与社交平台中的数据挖掘技术
立即下载