帮数据科学家干脏累活,大数据初创企业Paxata获3350万美元D轮融资

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:
帮数据科学家干脏累活,大数据初创企业Paxata获3350万美元D轮融资

 

经过前几年的炒作之后,大数据已经逐渐远离了媒体的焦点。这并不是说大数据已经失去势头,相反正是由于大数据应用之广泛已经到了几乎任何应用都离不开的地步,司空见惯了的东西所以就无人提及。但是大数据的应用普及仍然存在一些问题,主要的问题之一就是许多环节仍然离不开人工处理。比如最开始的数据抽取、处理与整合就需要大量人力——21世纪最性感的职业很大一部分精力都用在这些脏累活上面可一点都不吸引人。所以不少创业公司都把焦点放在解放数据科学家的事情上面,Paxata就是其中之一,在Intel Capital Global Summit上,这家大数据初创企业宣布获得了3350万美元的D轮融资。

Paxata是一家提供大数据转换平台的初创企业,成立于2012年,总部位于加州Redwood City。其平台为大型企业提供了一个自服务、可视化的信息管理渠道。在数据服务领域,存储和提供数据来源的数据管理系统(如Hadoop)和利用数据的分析应用之间普遍存在的一道鸿沟,即分析应用在对数据分析之前需要抽取、处理和整合多个来源的数据才能进行分析。这个数据准备的过程以往大都需要人工处理,耗时费力,Paxata的目的就是要填补这道鸿沟。他们的数据准备服务可以实现数据的连接、发掘、转换、合并、发布、协作控制等功能,可以将多来源多格式的数据接入并自动进行解释,客户使用人员只需知道使用EXCEL表,无需进行编程、写脚本或者采样即可完成数据准备的任务,这使得使用门槛大为降低。尽管Paxata在最新的大数据版图(见下图)中被定为为数据转换板块,但Paxata自己也提供有数据分析服务,可以利用机器学习与语义分析技术对清洗、整合后的数据进行即时的预测性分析。

 

帮数据科学家干脏累活,大数据初创企业Paxata获3350万美元D轮融资

 

2016大数据版图

对于拥有庞大数据但是缺乏数据科学家的企业来说,Paxata为他们提供了一个易用的信息管理平台。Dannon、Box、UBS、Pabst Brewing Company等均为Paxata的客户。

Paxata提供的服务与ClearStory有点类似,均能从不同的数据源抽取数据,但是Paxata还可以将多个数据源进一步整合为单一的数据集,从而更方便业务分析师和可视化工具的理解。此外,像Alteryx、Tamr以及Trifacta也提供了类似的自服务数据准备平台。鉴于人力是企业很大的一块成本支出,而数据科学家80%的工作都用在了数据清理上面,这个市场的前景还是非常可观的。当然,前提是在人工智能发展到足够程度之前,数据本身的质量还是要有一定保障。

此轮融资由Intel Capital领投(Paxata是这家基金这次投资峰会投资的12家初创企业之一),Microsoft Ventures、Cisco Investments、Deutsche Telekom Capital Partners、AirTree Ventures等新投资者以及EDBI、In-Q- Tel、Accel等原有投资者跟投,此轮融资过后,其总融资为6150万美元。Paxata 原来在纽约、华盛顿特区、俄亥俄州以及新加坡设有分支机构,此轮融资所得将用于公司在欧洲与亚洲的扩张。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
SQL 存储 监控
大数据Flume企业开发实战
大数据Flume企业开发实战
55 0
|
2月前
|
存储 机器学习/深度学习 大数据
参与开源大数据Workshop·杭州站,共探企业湖仓演进实践
Apache Flink 诚邀您参加 7 月 27 日在杭州举办的阿里云开源大数据 Workshop,了解流式湖仓、湖仓一体架构的最近演进方向,共探企业云上湖仓实践案例。
158 12
参与开源大数据Workshop·杭州站,共探企业湖仓演进实践
|
2月前
|
存储 监控 数据挖掘
云上大数据分析平台:赋能企业决策,挖掘数据金矿
5.3 场景化 针对不同行业和领域的需求特点,云上大数据分析平台将推出更多场景化的解决方案。这些解决方案将结合行业特点和业务场景进行
69 7
|
2月前
|
存储 分布式计算 数据可视化
ERP系统中的大数据分析与处理:驱动企业智能决策
【7月更文挑战第29天】 ERP系统中的大数据分析与处理:驱动企业智能决策
134 0
|
3月前
|
机器学习/深度学习 数据采集 大数据
大数据技术下的企业智能决策支持系统
大数据技术下的企业智能决策支持系统
120 0
|
4月前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。
|
4月前
|
存储 人工智能 安全
AI大数据分析对企业安全隐私的保护非常重要
AI大数据分析在提供企业发展和决策支持的同时,也涉及到大量的企业数据和用户隐私信息。因此,保护企业安全隐私是非常重要的。
|
4月前
|
分布式计算 大数据 数据处理
大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
54 0
|
11月前
|
存储 Cloud Native 大数据
浅谈传统企业的大数据平台如何上云
浅谈传统企业的大数据平台如何上云
|
SQL 存储 运维
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(中)
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(中)
137 0

热门文章

最新文章