刚拿到 1400 万元的“一面网络”专“啃”非结构化数据

简介:

image
今日,“一面网络”正式对外宣布已获得1400万元的Pre-A轮融资,投资方为真格基金和联想之星。此前,一面网络于2014年成立时获得了天使轮融资,投资方为个人。

由于互联网的高速发展,用户产生的行为数据越来越多。这些数据可以划分为两大类:一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。结构化数据属于非结构化数据,是非结构化数据的特例。但企业往往没有能力处理这些数据,所以导致企业无法全面了解用户的行为,浪费了行为数据的潜在价值。

“一面网络”在做的事情,就是给企业输出数据分析的能力。首先将企业内外部数据打通,然后通过机器深度学习,将任何有价值的非结构化数据进行清洗、处理、挖掘,最后再将分析结果用户图像,可视化给的呈现给用户。该赛道还有36氪此前报道的星图数据等。

例如,现在的消费者都会在论坛、微博等各种渠道留下对企业的产品、品牌的反馈,但这些言论不会按照常规化的语序进行表达,里面大多夹杂新生词汇、代名词等,导致企业往往不能很好的理解这些反馈信息中的建议。“一面网络”会通过网络爬虫抓取这些外部信息,然后再接入企业内部的数据,如ERP、物流等,线上各大电商平台的订单数据、评论等。最后给到商家的结果,类似于淘宝商品页面中的评论(如下图),并且这些评价的维度都是可以自动生成的。

image

说到这里,我们容易联想到36氪此前报道的硅谷大数据公司Taste Analytics,他们也是做非结构化数据处理,通过舆情监控帮企业决策,并且同是真格投资的公司,在今年初完成了340万美元的Pre-A轮融资。当问到两者区别时,一面网络CEO任栋霓表示,Taste Analytics更加侧重非结构化数据的技术处理,而一面更侧重于业务场景的应用,还包括订单分析、每个环节的转化数据等。

不过做语义分析,这里有一个不可避免的问题,同一个词语在不用行业的中表达的意思往往不一样,所以需要建立行业知识图谱来对机器进行训练,可是完善这个图谱不是易事,Google、IBM都铺了大量人力、时间在做,那么创业公司怎样去做?对此,任栋霓告知,一面主要先谈下行业的几个标杆客户,然后再通过大客户建立知识图谱,目前主要集中在消费品、宠物、食品、日化、酒、汽车等几个行业。

其实,除了Taste Analytics,一面在做的用户转化分析,又让人容易联想到36氪此前报道的神策数据、GrowingIO等公司,任栋霓强调,神策数据等公司更多的是通过埋点来帮助企业实现用户增长,主要是服务运营部门,面向那种有自己独立网站的公司,而一面主打是后面的分析步骤,反馈于企业的销售决策。

下面几篇文章的内容与这篇文章的内容相似,也许你也会有兴趣:

创业公司做好数据化运营,需要先搞清这6个问题

商业智能分析软件 Grow 获得 1100 万美元 A 轮融资,解决中小企业数据分析痛点

数据分析与数据仓库平台Panoply.io获700万美元A轮融资

新加坡医疗数据分析公司 Biofourmis 获得 100 万美元天使轮融资,帮助医护人员解读个人健康数据

自动记录所有的用户行为,数据分析初创企业 Heap 获 1100 万美元 A 轮融资

数据分析师必学四大精髓

此外,一面现在的场景是来自售后,而很多做数据分析的公司都会做售前的销售线索搜集,当问及是否会向前延伸时,任栋霓告知不会,因为销售线索更适合2B的公司,而一面的客户都是2C的,这是两部分客群。

据悉,一面网络的创始团队脱身于快播的人工智能部门,公司目前有20多人,产品按照SaaS模式按月收取服务费,已于2015年实现盈亏平衡,本次融资主要是加大产品标准化的进度,以及组建市场和销售团队。

本文转自d1net(转载)

相关文章
|
2月前
|
机器学习/深度学习 算法 调度
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
309 0
|
3月前
|
机器学习/深度学习 数据采集 传感器
【故障诊断】基于matlab BP神经网络电机数据特征提取与故障诊断研究(Matlab代码实现)
【故障诊断】基于matlab BP神经网络电机数据特征提取与故障诊断研究(Matlab代码实现)
134 0
|
4月前
|
数据采集 存储 算法
MyEMS 开源能源管理系统:基于 4G 无线传感网络的能源数据闭环管理方案
MyEMS 是开源能源管理领域的标杆解决方案,采用 Python、Django 与 React 技术栈,具备模块化架构与跨平台兼容性。系统涵盖能源数据治理、设备管理、工单流转与智能控制四大核心功能,结合高精度 4G 无线计量仪表,实现高效数据采集与边缘计算。方案部署灵活、安全性高,助力企业实现能源数字化与碳减排目标。
139 0
|
5月前
|
Python
LBA-ECO CD-32 通量塔网络数据汇编,巴西亚马逊:1999-2006,V2
该数据集汇集了1999年至2006年间巴西亚马逊地区九座观测塔的碳和能量通量、气象、辐射等多类数据,涵盖小时至月度时间步长。作为第二版汇编,数据经过协调与质量控制,扩展了第一版内容,并新增生态系统呼吸等相关计算数据,支持综合研究与模型合成。数据以36个制表符分隔文本文件形式提供,配套PDF说明文件,适用于生态与气候研究。引用来源为Restrepo-Coupe等人(2021)。
94 1
|
30天前
|
机器学习/深度学习 人工智能 算法
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
110 0
|
2月前
|
机器学习/深度学习 数据采集 运维
改进的遗传算法优化的BP神经网络用于电厂数据的异常检测和故障诊断
改进的遗传算法优化的BP神经网络用于电厂数据的异常检测和故障诊断
|
4月前
|
存储 监控 算法
基于 Python 跳表算法的局域网网络监控软件动态数据索引优化策略研究
局域网网络监控软件需高效处理终端行为数据,跳表作为一种基于概率平衡的动态数据结构,具备高效的插入、删除与查询性能(平均时间复杂度为O(log n)),适用于高频数据写入和随机查询场景。本文深入解析跳表原理,探讨其在局域网监控中的适配性,并提供基于Python的完整实现方案,优化终端会话管理,提升系统响应性能。
129 4
|
5月前
|
开发者
鸿蒙仓颉语言开发教程:网络请求和数据解析
本文介绍了在仓颉开发语言中实现网络请求的方法,以购物应用的分类列表为例,详细讲解了从权限配置、发起请求到数据解析的全过程。通过示例代码,帮助开发者快速掌握如何在网络请求中处理数据并展示到页面上,减少开发中的摸索成本。
鸿蒙仓颉语言开发教程:网络请求和数据解析
|
7月前
|
安全 网络安全 定位技术
网络通讯技术:HTTP POST协议用于发送本地压缩数据到服务器的方案。
总的来说,无论你是一名网络开发者,还是普通的IT工作人员,理解并掌握POST方法的运用是非常有价值的。它就像一艘快速,稳定,安全的大船,始终为我们在网络海洋中的冒险提供了可靠的支持。
248 22
|
7月前
|
存储 数据库 Python
利用Python获取网络数据的技巧
抓起你的Python魔杖,我们一起进入了网络之海,捕捉那些悠游在网络中的数据鱼,想一想不同的网络资源,是不是都像数不尽的海洋生物,我们要做的,就是像一个优秀的渔民一样,找到他们,把它们捕获,然后用他们制作出种种美味。 **1. 打开魔法之门:请求包** 要抓鱼,首先需要一个鱼网。在Python的世界里,我们就是通过所谓的“请求包”来发送“抓鱼”的请求。requests是Python中常用的发送HTTP请求的库,用它可以方便地与网络上的资源进行交互。所谓的GET,POST,DELETE,还有PUT,这些听起来像偶像歌曲一样的单词,其实就是我们鱼网的不同方式。 简单用法如下: ``` im
153 14

热门文章

最新文章