2014十家最酷的大数据创业公司

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:
商业和消费者正在产生TB乃至PB级数据,大量公司也加大了研发,致力于收集、存储、管理、分析数据。美国IT网站CRN评出了2014年大数据领域格外瞩目的十家新兴大数据创业公司,不妨一看。


近年来,很少有IT细分市场可以像大数据市场一样吸引企业家的关注。如今,商业和消费者正在产生TB乃至PB级数据,大量公司也加大了研发,致力于收集、存储、管理、分析数据。


以下是2014年大数据领域格外瞩目的十家新兴大数据创业公司


1. Aerospike


创始人和CTO:Brian Bulkowski


包括MongoDB、CouchBD和Redis等公司都在争夺下一代数据库的市场份额。Aerospkie创建于2009年,总部位于加州山景城。该公司研发了一组用于高性能应用的、实时的、闪存优化的NoSQL数据库。内存数据库满足可靠事务处理的ACID(原子性、一致性、隔离性、持久性)需求。Forensiq是一家提供在线广告诈骗检测服务的公司,11月Forensiq宣称其每个月需要用Aerospike提供的数据库处理1万亿次请求。年初Aerospike获得2000万美金的C轮融资。11月,Aerospike对数据库性能进行了优化,提升了存储能力,并进行了新功能和Hadoop的整合。


2. Altiscale


CEO: Raymie Stata


Hadoop在2014年很火,但是其大数据平台仍然十分复杂,并且很难用。这也是Altiscale和它的Hadoop服务引人注目的原因。Altiscale的服务主要目的是解决Hadoop的抽象性与复杂性,为工程师搭建一个完整的Hadoop环境,并且对其进行维护与管理,让用户可以更专注于他们的数据与应用。当客户的需求发生变化的时,Altiscale也会做出相应的调整与变化。他还可以将Apache Hadoop加上业务支持作为云服务进行交付。Altiscale,总部位于加州Palo Alto,成立于2012年。今年10月这家公司开始提供Hadoop上的SQL服务,这使得可以通过使用SQL用户接口或API访问Hadoop数据。Altiscale的高层包括CEO Raymie Stata和CTO David Chaiken都来自雅虎,雅虎也是Hadoop的发源地。这些人知道他们自己在做什么。这个月初Altiscale获得了3000万美元的二轮融资。


3. Databricks


CEO:Ion Stoica


2014年,Apache Spark是大数据领域最火的技术之一,它是一款可以像Hadoop一样提高大数据系统性能的内存数据处理引擎。这个开源软件来自加州伯克利大学的一个项目。Databricks提供了一个基于Spark的平台(该平台发布于六月),用于处理数据转换、探测、分析等大数据任务。2013年成立的Databricks公司不是一家以开源技术为噱头的创业公司。DatabrickCEOIon Stoica(加州伯克利大学的计算机科学的教授)和CTO Matei Zaharia创建了Spark,他们借助大数据一站式服务软件将他们的专业技术发挥的淋漓尽致。


4. DataStax


CEO:Billy Bosworth


DataStax是下一代数据库市场的另一个引领者,该公司支持Apache Cassandra。Apache Cassandra是高扩展性、容错的NoSQL数据库,思科、eBay和Twitter都在使用这种数据库。DataStax销售DataStax企业版,这是商化版本的Cassandra,还销售支持该平台的工具和服务。这个月初,公司推出了DSE4.6,其具备新的Spark流分析性能,这表明该公司开始涉足物联网。DataStax成立于2010年,总部位于加州圣克拉拉,在9月的E轮融资中获得惊人的1亿600万美元的融资,当下总计获得1.9亿美元融资。


5. DataTorrent


联合创始人兼CEO:Phu Hoang


DataTorrent是帮助用户即时处理、监控、分析数据的企业级实时流分析平台。该公司声称基于Hadoop的DataTorrent RTS系统每秒可以执行数亿次、甚至十亿次处理。当今,很多行业在大数据领域面临的一大挑战是延迟——如处理类似事务的流数据。DataTorrent的联合创始人兼CEO Phu Hoang曾在雅虎领导Hadoop的研发,也看到了类似Data Torrent RTS类产品的发展机会。这家在圣克拉拉的创业公司成立于2012,在该年6月发布了DataTorrent RTS,10月发布了RTS 2.0。


6. Qubole


联合创始人和CEO:Ashish Thusoo


基于Haddop的Qubole数据服务是一个云平台,企业可以用该平台存储和管理大量的结构化和非结构化数据,且可执行数据分析和一些其它任务。你可能说Qubole很自恋:公司注重于使自己的平台尽可能随着规模及其他内置管理性能进行自管理;此外,友好的用户交互自服务和数据整合功能都不需要数据科学家或程序员。该公司CEO Ashish Thusoo与印度总裁Joydeep Sen Sarma在2012年一起创立了Qubole。先前他们共同管理Facebook的数据基础建设团队,负责大数据处理,之后他们共同参与了Hadoop的Apache Hive数据仓储基础建设项目。月初,这家公司在B轮融资获得1300万美元融资。


7. Snowflake Computing


CEO: Bob Muglia


Snowflake Computing于10月悄然出现,推出了基于云的数据仓储服务,其服务定位是成为复杂、昂贵本地数据仓库系统的替代者,旨在实现灵活和易于管理等特性。Snowflake的Elatic数据仓储目前还是测试版,在未来将很有可能替代亚马逊网络服务Redshift和Google的Big Query。CEO Bob Muglia说:“Snowflake的Elastic数据仓储服务相较于本地数据仓储可以节省90%的成本,而且比竞争者AWS和Google的产品更易于使用。Snowflake Computing目前研发的数据库系统既可以处理结构化和半结构化的数据”


8. SumAll


CEO: Dane Atkinson


SumAll认为不仅大企业需要大数据分析,中小型也需要。这家在纽约的初创公司为企业提供了一个可以收集企业电子商务、邮件市场、社交媒体、广告系统(如谷歌的AdWords)上的数据并在一个互动可视化界面进行展示的在线分析平台。SumAll成立于2011年,侧重于产品的易用性,其产品不仅销往大企业,也销往中小型企业。该公司网站的统计数据显示,公司拥有23.3万的SumAll用户,获得1400万美元融资,雇员平均年龄32.6岁,每年消费22桶啤酒。


9. Tamr


联合创始人和CEO:Andy Palmer


大数据的一个问题是数据太大了,大数据通常有很多不同的数据源,而且这些数据源一直在变换。Tamr公司的软件通过机器学习技术为这些数据源提供单一视角,同时为企业提供一个完整的数据资产库存并寻找分布数据集之间的联系。该公司的技术最早来自MIT的计算机与人工智能实验室。2013年,数据库专家Michael Stonebraker、行业资深专家Andy Palmer和Ihab Ilyas共同创建了Tamr,今年5月,公司正式运行。同时,这家基于剑桥和麻省的公司筹集了1600万美元的风险投资。


10. WibiDat

联合创始人和CEO:Christophe Bisciglia


大家都很了解亚马逊可以为商户提供定制化的体验。位于旧金山的WibiData创建于2010年,研制了一款可提供类似服务的实时应用。该公司的Wibi企业平台使用先进的分析技术给消费者提供推荐、定制化的内容和相关搜索结果。该平台基于一组开源Apache技术,其中包括Hadoop、HBase和Cassandra,也包括用于实时收集、分析、服务数据的Kiji开源框架。年初该公司发布了WibiRetail,该应用是公司为零售商提供的首个“开箱即用”的应用。投资人包括谷歌董事长Eric Schmidt和Cloudera创始人Mike Olson。



原文发布时间为:2014-12-27

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
机器学习/深度学习 供应链 搜索推荐
用大数据卖汉堡,麦当劳3亿美元收购大数据创业公司
提起麦当劳你首先会想到什么?肯定是巨无霸汉堡而不是大数据。不过麦当劳最近的一宗收购或许将扭转这一印象。
553 0
|
2月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
24天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
187 7
|
24天前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
37 2