大数据分为广义和狭义两个概念。广义的来讲,所有的互联网公司都有自己的数据,因为它们有很多用户,以及用户沉淀下来的数据。它们也有自己的数据部门,大的互联网公司会拿这些数据做一些变现。狭义的来讲,其实大数据更多的定义是第三方的公司,它帮助在市场上有需求的客户收集以及利用数据。
今天想着重讲的是狭义层面上的数据概念,就是说我想为大家介绍一下国内外大数据创业领域的标杆性公司,以及它们发展的情况。
大数据在企业应用中的构成
大数据在企业应用中分成五个大的部分。先有底层数据基础,才有分析层面的东西。
2014年全球大数据创业公司
1.Infrastructure
第一个大的模块叫Infrastructure(基础设施),也就是说我们平时用到的云计算、存储设备以及数据库等,这些都是基础的东西。数据源的存储和处理需要载体,通常是硬件或是虚拟化设备。
2.Datasources
第二个是数据源,这是大数据的基本原材料,我们必须要有数据才能够提取数据中的价值。
3.Opensources
Opensources(开源方案)包含算法、数据转化、结构化处理等功能,相当于一个中间件,它是连接了数据源和基础架构,再把数据做结构化的处理。
4.Analytics
最广泛的应用场景就是Analytics,就是分析类,比如大家经常提起的的BI,我们企业内部有各种各样的数据,怎么样通过工具或者是软件把这些数据呈现出来,在这个领域有各种各样的细分。比如说有专门做非结构数据处理的,有些专门做数据可视化的,还有一些可能是针对某些垂直领域的。
5.Applications
最后一类是应用类,它们融汇了大数据与各垂直细分领域业务逻辑,提升价值,比如金融业、房产业、医疗业、汽车业、等等。
根据这五大类,相继有一些创业公司。我自己调研发现从2008年到2014年是大数据在美国创业的风口。从2012年到2014年出现大数据行业突破性的变化。可以看到,每一个细分领域的公司有非常大的量级上的增加。
国外大数据退出案例
截止到2014年底,国外在大数据创业公司一共有358家,但是只有16家退出。分析层面退出的案例最多,数据源、基础设施方面也有几家。
1.Analytics
KARMASPHERE:是做数据处理的公司,它给企业提供了非常基层的数据分析工具,提供给数据科学家用的。也就是说,它的用户是具备对数据有一定的理解和处理能力的人,它提供一个工具和接口,把一些企业里面非结构化数据搜集过来,去做一些最基本的结构化处理,数据科学家再通过自己擅长的各种模型,去利用这些数据。
Tableau:它做更加傻瓜的数据可视化。也就是说,它直接绕开数据科学家可以直接提供给相对小白一些的用户,有些中型企业它们没有数据科学家的职位,他们可以直接用Tableau,免去数据采集、处理、建模的繁琐步骤,很简单快速的部署到企业内部,一目了然与自身业务、经营息息相关的实时情况,比如说:用户的购买率、转化率等等。
Palantir:它虽然还没有上市,它如今却是与Airbnb并驾齐驱的百亿独角兽之一,它是发展最迅速并且融资规模最大的大数据公司,已经融了9亿美金。它的竞争优势在于提供了全产业、并且超定制化的数据服务,它不仅仅有自己第三方的数据源,同时也具备数据分析、SaaS可视化的服务。所以它是非常有核心竞争力的公司,产品的厚度相应是非常坚实的。
BlueFin:它现在已经被Tiwtter收购了,它在美国是做社交数据起家的。如果大家想收集某些有关品牌、事件、人物的情报,其实最直接的数据源头就是社交平台,因为人们与社交媒体的交互是最为频繁的 。所以BlueFin这家公司创业之初就采集了主流社交平台的数据,比如利用我们常说的爬虫技术,采集对于某一些特定关键词的评论,再做分析。其实有点像舆情检测跟舆情分析。这个在国外是非常普遍,在早些年前已经被很多企业重视。因为国外自主品牌相对比较多,他们很早就开始注重营销这方面的东西。所以这个公司起步也比较早,最后退出的也比较快。
Splunk:还有一类就是IT运维方面的分析,这个公司在国外最成功的案例就是Splunk,这个工具是提供给内部IT部门运维人员的,因为运维人员每天要关注系统运转的稳定性和安全性,他们要处理很多机读语言的非结构化数据,这个可能跟公司管理或者是跟业务没有太大关系,但是IT数据非常重要。主要的原因是,如果IT系统一旦崩盘可能会影响到网站的运营,对于大型企业来讲,可能就是损失掉了一笔巨额的收入。
2.Applications
Rocketfuel:在应用层面,国外在2015年新增了几家新的退出案例,我还没有完整的总结。2014年,只有一家叫Rocketfuel,这家有点像国内的秒针,它是针对做广告优化精准营销的。因为大数据在应用场景层面,其实最频繁被用到的还是智能营销,因为营销是最简单粗暴的诉求:离钱最近的,打广告,直接找到精准的客户,直接给客户带来收入。这块国内跟国外是一样的情况。
3.Datasources
BlueKai:剩下的几个基础方面的数据源,以及开源数据,基础设施,它不算是非常热门的创业领域。所以相继在国外退出的案例也没有那么多,尤其是数据源这块,国外有一家叫BlueKai,它也是偏向于营销,主要是给企业的营销部门提供第三方数据源,有点像数据集市。
4.Infrastructure
ParAccel:在基础设施方面还有一家ParAccel是标杆性的公司,它是做数据处理的,把非结构化的数据转化成结构化的。很多企业不做精细化运营,但起码数据存储还是要有的。
新锐大数据创业公司
刚才提到的都是一些退出的公司,这一页上是我自己筛选出来的,我觉得这两年在美国创业市场比较新锐的公司。
Taboola:也是做精准营销和营销优化,但是它不太一样的是它集成了更多人工智能方面的东西。
Localytics:它跟传统的数据分析不太一样,比如Tableau做的主要是大型或者是中大型的客户,中大型客户有比较现成的数据库,比较现成的结构化的东西。但是Localytics更轻,主要针对很多SME,就是中小型的公司,包括创业公司,它自己有灵活的数据库功能,一个新的创业公司即使没有搭建数据库,也可以很快的部署,在应用上可以看到用户的情况和行为表现。
MixPanel:跟Localytics比较类似,都是比较新锐的创业公司。
APP Annie:大家比较熟悉了,用于分析应用中的用户行为数据。
Data Hero:今年已经成功退出了,这也是一家成长非常快的公司。
EvreString:是华人自己做的公司,是真格投的,它利用了数据,帮助企业找到核心潜在客户,算是一个销售线索公司。但是他们非常厉害的是,他们能够把很多数据孤岛串联起来,帮企业找到最精准的用户群体。
大数据创业增速缓慢
国外截止到2014年底有358家大数据方面的创业公司,退出的只有16家,包括并购和上市,而且并购占到了80%,上市只有20%。从比例上来看,4.5%的退出率对于一个创业方向来讲其实是很低的,而且从速度上来看,也是相应的比较缓慢的。
究其原因,我觉得不管是在国外或者是在国内,大数据应用场景的不成熟,以及有能力使用大数据的人才(数据科学家)匮乏,始终是阻碍大数据发展的原因。
从现有统计看,分析工具其实是占比最高的,不管是在融资情况或者是退出方面。第二名是基础设施,我刚才说了,因为所有公司都有存储数据的需求。然后是垂直细分领域,排名最后的数据源,像开源数据其实是最难变现的。所以到现在都没有很好的退出。
大数据创业热门领域
最热门的三大领域:数据分析、应用和基础设施。从2008年到2012年,数据分析工具越来越多,不管是融资金额,还是案例数上。基础设施机会越来越少,因为这块肯定是先有一个培育的土壤,才能有后面分析的东西,所以这块的创业机会越来越少。
在应用场景这块,可以看到中间多出来很多,后面也变少了。我们来看不管是投资人或者是创业公司,可能在2009年到2010年都是想象的阶段,不知道这方面到底能不能好,很多人都一窝蜂的挤进来。后面理智一点的发现,应用场景快速做起来的并不是太多,所以也就相对理性了。
大数据在垂直领域的应用案例
在垂直领域,大数据在美国已经有的成功案例,包括市场营销、能源、石油、金融,企业服务里面最常用到的人力资源HR。因为现在有很多简历需要通过智能分析去做大数据的关联。还有就是零售,因为零售行业是产能非常高的行业,所以大数据对它们来说价值非常大。还有就是供应链管理、医疗、健康以及房产。
国内大数据创业公司
1.基础设施
基础设施领域,国内有一家新锐创业公司叫博睿数据,他们是做数据库的。我个人认为,在基础设施领域,尤其是数据库方向,在国内的创业机会很少。因为这个东西不太需要再引入中文版或者是中国独特的东西。因为用国外现成的工具就可以解决问题了。而且现在有很多开源,也是免费的,这块在中国的创业机会不是太多。但是也有一些新兴的方向,比如说做数据压缩、数据检索等,这种相对比较细分,也比较新兴的领域,这些方向可能还有机会。
2.数据源
我自己认为数据源方面创业公司确实没有什么机会了,首先数据方面创业公司都做的比较大了,比如说数据堂是做数据集市的,这些公司都已经到B轮了。最大的像数据魔方,阿里妈妈等,是阿里旗下的产品,巨头在这个领域会有优势很多。
3.分析类
分析类目前还处在起步的阶段,目前我看到可视化的机会,阿里前几天刚刚推出了叫数说,它们是做可视化的,以后会提供给各种各样的客户,包括政府或者是中小型公司,以及大型的民营企业。可以看到,只要你对你的分析方面有需求,只要数据源导进来,他便可以自动的做归类和分析,并且智能化的形象展现。这个领域的创业公司有星图和海云,我把数据库导进来可以看很多公司的动态。
刚才我们讲的大而全的分析平台,既具备数据处理能力,又具备可视化,现在行业里面非常标杆的叫永洪数据。我觉得永洪非常强大,因为它们跟国外的Tableau直接对标,是我目前看到的做数据处理、可视化分析,并且跟客户的业务逻辑紧密结合非常成功的公司。
后面除了分析平台之外,精准到用户分析又有两家公司已经做的比较大,就是TalkingData和友盟,我们觉得做用户层面数据分析创业公司机会不多了,友盟被阿里收购了,所以空间并不是特别多。
下面这一类,这是我特别关注的,我觉得在国内数据类创业公司里面最有机会,就是有点对标国外大数据创业公司,像神策网络、GrowingIO、达观数据,你有数据库可以非常灵活,你没有数据库我可以帮你引入一些外部的。在收费模式上也是SaaS的模式,比较轻。但是也存在一个短板,可能它们的目标群体,也就是中小型客户的付费意愿没那么强,客单价低。
还有像百分点,它是做智能算法、广告优化的。像应用类下的智能营销,我自己觉得在国内机会不多,做广告优化,除非你是从PC领域转到移动领域,不然的话机会真的不多。因为现在这几家公司都是C轮以后或者是快上市,或者是并购的结构了。
后面还有一类我也特别关注,IT这块像日志IT运维分析,因为我自己对IT方面非常感兴趣,国内比较成功的几家Hansight、日志易、OneAPM,还有陆续针对特定类型客户的公司,比如我正在做的一个项目,针对大银行、运营商机构的Protoco Soft。
4.应用类
最后一类应用类垂直到不同细分领域,我觉得都有机会。尤其有机会的是市场营销和销售线索领域,因为这个离钱近,可以直接给企业带来好处和利益的,我觉得这块是最有机会。再精准到细分里面,数据应用场景最成熟的可能是电商营销或者是社交数据,或者是社交CRM,这些方面都有很多机会。还有就是安全、医药、金融都会有机会。虽然垂直应用层面可能有机会,但是如果已经有人做建议慎入,本来这个市场相对比较小,进入之前也必须看看竞争对手已经做到了什么程度了。
总结:
追溯国外的大数据市场行情,发展还是相对缓慢的,并且这个情况也可能会发生在中国。 无论是在国外或者是在国内,大数据应用场景的不成熟,以及有能力使用大数据的人才(数据科学家)匮乏,始终是阻碍大数据发展的原因。但是,大数据为人类提供的价值不可估量,一旦爆发会是指数性的增长。技术驱动型的创业也将是下一个风口,我们还是要对这个领域持续保持关注,并且鼓励专业人才投入到建设大数据创投生态中来。
本文转自d1net(转载)