深耕大数据市场,所问数据打造深度学习数据分析与预测引擎

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

卖什么?卖多少钱?

这些是每一个线上零售卖家都会遇到的问题。在大数据时代开始之前,答案都是基于个人经验做的判断;随着近年数据分析平台纷纷上线,卖家们也渐渐开始接受多维度、不同时间粒度的数据分析服务,包括流量、销量、广告、仓储、配送、售后分析等等,一定程度上提升了运营管理能力。

但作为商家,最核心的两问,依然没有得到简单有效的解答。

所问数据(Asking Data)想以企业级服务数据平台的形式,为线上零售产业提供一款数据分析与预测的引擎,辅助商家进行决策。具体来说,平台的核心功能包括对具体行业、商品、店铺和标签四大维度的分析,以及对潜力爆品的预测——后者,是市场上首次出现的服务。第一个上线的平台,是对美国跨境电商Wish全品类商品进行数据分析的易选品。

深耕大数据市场,所问数据打造深度学习数据分析与预测引擎

第一个上线的平台,是对美国跨境电商Wish全品类商品进行数据分析的易选品。

做大数据服务的核心有二,数据源和技术。所问的数据来自全网抓取,但不同于许多大数据分析公司,所问的数据处理分析流程,从去除噪音、识别有效数据的清洗,到多来源多格式数据的转换合并,全部由机器进行,不需要任何人工介入。值得一提的是,包括京东在内的一些电商平台,并没有对外开放的产品销量数据,所问是通过对商品销售的不同维度信息进行抓取和分析推测获得的销量数据。

数据处理后的分析之外,所问最核心的技术是基于长期的产业经验和深度学习算法开发经验、自主研发的回归类预测模型。所问的创始人兼CEO颜鹏说,这个技术不止是国内、就是在全球范围内,现在都是很少见的。据悉,易选品平台对产品销量的预测,准确率在80%-90%。目前,所问已经获得公牛集团这样的付费大客户(以监控的平台和类目维度来收费,具体数额暂不方便透露),以及近300家中小型企业的使用。目前,易选品在免费试用阶段,在市场和产品都更加成熟后,会开始与已经存在的大数据分析平台一样、开始按年收取平台使用费。

深耕大数据市场,所问数据打造深度学习数据分析与预测引擎

平台每天会监控所有销售商品的信息,根据商品在上架之后一段时间内的表现,综合考虑商品本身及行业竞争等多维度数据,通过回归预测算法模型,得出从类目到单品的“潜力指数”(百分制)。指数越高,说明该类商品在未来一段时间成为爆款的可能性就越高。

艾瑞咨询的报告显示,2016年中国电子商务市场交易规模20.2万亿元,其中网络购物市场交易规模达4.7万亿元,较前年增长23.9%,预计在2017年增速为19.1%,总规模达5.6万亿元。根据阿里研究院的报告,在这个大市场中,跨境电商零售的细分市场总规模达7512亿元,其中出口额5032亿元,预计未来五年年均增速约37%,在2020年实现2.16万亿元的出口额。换言之,所问立足于一个4.7万亿的市场,并选择了其中5千亿的细分市场切入。

电商市场上的大数据分析公司并不少,有巨头级别的阿里云市场、京东数据罗盘,也有入场较早、商业化程度非常高的新兴公司如百分点科技。但深耕跨境电商这一细分市场的目前并不多,且竞品的数据服务大多仅限于数据的收集和可视化呈现。颜鹏告诉36氪,所问最大的优势也是壁垒就是技术,因为精准的选品和定价预测,对于深度学习算法开发的技术门槛非常高,且需要对电商市场独到的理解和判断,这些是目前市面上没有公司可以做到的。哪怕在较为成熟的海外市场,能够实现高精度回归预测的,也只有为数不多的公司——其中包括颜鹏曾经供职的3M公司。

深耕大数据市场,所问数据打造深度学习数据分析与预测引擎

中国跨境电商零售市场规模及年均增速

所问数据创始人兼CEO颜鹏,博士毕业于美国North Dakota State University,曾供职于美国3M、IBM等消费公司,在大数据挖掘和分布式计算有多年经验,并对消费行业非常了解。创始人兼CTO丁圣超,是中科院计算所计算机博士、美国加州大学圣地亚哥分校博士后,曾从事基因表达水平预测的研究。团队现在共有26人,其中19人为技术人员。

公司近期计划开始A轮融资。融资将主要用于团队在技术和市场方面人才的扩充。此前,公司曾获九合创投数百万的天使轮融资,和洪泰领投的千万级Pre-A轮融资。

卖什么?卖多少钱?

这些是每一个线上零售卖家都会遇到的问题。在大数据时代开始之前,答案都是基于个人经验做的判断;随着近年数据分析平台纷纷上线,卖家们也渐渐开始接受多维度、不同时间粒度的数据分析服务,包括流量、销量、广告、仓储、配送、售后分析等等,一定程度上提升了运营管理能力。

但作为商家,最核心的两问,依然没有得到简单有效的解答。

所问数据(Asking Data)想以企业级服务数据平台的形式,为线上零售产业提供一款数据分析与预测的引擎,辅助商家进行决策。具体来说,平台的核心功能包括对具体行业、商品、店铺和标签四大维度的分析,以及对潜力爆品的预测——后者,是市场上首次出现的服务。第一个上线的平台,是对美国跨境电商Wish全品类商品进行数据分析的易选品。

第一个上线的平台,是对美国跨境电商Wish全品类商品进行数据分析的易选品。

做大数据服务的核心有二,数据源和技术。所问的数据来自全网抓取,但不同于许多大数据分析公司,所问的数据处理分析流程,从去除噪音、识别有效数据的清洗,到多来源多格式数据的转换合并,全部由机器进行,不需要任何人工介入。值得一提的是,包括京东在内的一些电商平台,并没有对外开放的产品销量数据,所问是通过对商品销售的不同维度信息进行抓取和分析推测获得的销量数据。

数据处理后的分析之外,所问最核心的技术是基于长期的产业经验和深度学习算法开发经验、自主研发的回归类预测模型。所问的创始人兼CEO颜鹏说,这个技术不止是国内、就是在全球范围内,现在都是很少见的。据悉,易选品平台对产品销量的预测,准确率在80%-90%。目前,所问已经获得公牛集团这样的付费大客户(以监控的平台和类目维度来收费,具体数额暂不方便透露),以及近300家中小型企业的使用。目前,易选品在免费试用阶段,在市场和产品都更加成熟后,会开始与已经存在的大数据分析平台一样、开始按年收取平台使用费。

平台每天会监控所有销售商品的信息,根据商品在上架之后一段时间内的表现,综合考虑商品本身及行业竞争等多维度数据,通过回归预测算法模型,得出从类目到单品的“潜力指数”(百分制)。指数越高,说明该类商品在未来一段时间成为爆款的可能性就越高。

艾瑞咨询的报告显示,2016年中国电子商务市场交易规模20.2万亿元,其中网络购物市场交易规模达4.7万亿元,较前年增长23.9%,预计在2017年增速为19.1%,总规模达5.6万亿元。根据阿里研究院的报告,在这个大市场中,跨境电商零售的细分市场总规模达7512亿元,其中出口额5032亿元,预计未来五年年均增速约37%,在2020年实现2.16万亿元的出口额。换言之,所问立足于一个4.7万亿的市场,并选择了其中5千亿的细分市场切入。

电商市场上的大数据分析公司并不少,有巨头级别的阿里云市场、京东数据罗盘,也有入场较早、商业化程度非常高的新兴公司如百分点科技。但深耕跨境电商这一细分市场的目前并不多,且竞品的数据服务大多仅限于数据的收集和可视化呈现。颜鹏告诉36氪,所问最大的优势也是壁垒就是技术,因为精准的选品和定价预测,对于深度学习算法开发的技术门槛非常高,且需要对电商市场独到的理解和判断,这些是目前市面上没有公司可以做到的。哪怕在较为成熟的海外市场,能够实现高精度回归预测的,也只有为数不多的公司——其中包括颜鹏曾经供职的3M公司。

中国跨境电商零售市场规模及年均增速

所问数据创始人兼CEO颜鹏,博士毕业于美国North Dakota State University,曾供职于美国3M、IBM等消费公司,在大数据挖掘和分布式计算有多年经验,并对消费行业非常了解。创始人兼CTO丁圣超,是中科院计算所计算机博士、美国加州大学圣地亚哥分校博士后,曾从事基因表达水平预测的研究。团队现在共有26人,其中19人为技术人员。

公司近期计划开始A轮融资。融资将主要用于团队在技术和市场方面人才的扩充。此前,公司曾获九合创投数百万的天使轮融资,和洪泰领投的千万级Pre-A轮融资。 


  

本文转自d1net(转载)


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
25天前
|
数据挖掘 PyTorch TensorFlow
|
2月前
|
数据采集 DataWorks 数据挖掘
提升数据分析效率:DataWorks在企业级数据治理中的应用
【8月更文第25天】本文将探讨阿里巴巴云的DataWorks平台如何通过建立统一的数据标准、规范以及实现数据质量监控和元数据管理来提高企业的数据分析效率。我们将通过具体的案例研究和技术实践来展示DataWorks如何简化数据处理流程,减少成本,并加速业务决策。
192 54
|
17天前
|
机器学习/深度学习 数据挖掘 大数据
大数据时代的“淘金术”:Python数据分析+深度学习框架实战指南
在大数据时代,数据被视为新财富源泉,而从海量信息中提取价值成为企业竞争的核心。本文通过对比方式探讨如何运用Python数据分析与深度学习框架实现这一目标。Python凭借其强大的数据处理能力及丰富库支持,已成为数据科学家首选工具;而TensorFlow和PyTorch等深度学习框架则为复杂模型构建提供强有力的技术支撑。通过融合Python数据分析与深度学习技术,我们能在各领域中发掘数据的无限潜力。无论是商业分析还是医疗健康,掌握这些技能都将为企业和社会带来巨大价值。
38 6
|
15天前
|
机器学习/深度学习 数据挖掘 PyTorch
🎓PyTorch深度学习入门课:编程小白也能玩转的高级数据分析术
踏入深度学习领域,即使是编程新手也能借助PyTorch这一强大工具,轻松解锁高级数据分析。PyTorch以简洁的API、动态计算图及灵活性著称,成为众多学者与工程师的首选。本文将带你从零开始,通过环境搭建、构建基础神经网络到进阶数据分析应用,逐步掌握PyTorch的核心技能。从安装配置到编写简单张量运算,再到实现神经网络模型,最后应用于图像分类等复杂任务,每个环节都配有示例代码,助你快速上手。实践出真知,不断尝试和调试将使你更深入地理解这些概念,开启深度学习之旅。
20 1
|
25天前
|
机器学习/深度学习 并行计算 搜索推荐
深度学习之基因组数据分析
基于深度学习的基因组数据分析利用深度学习技术来处理和分析基因组数据,帮助解决基因组学领域中一些复杂且具有挑战性的问题。
48 11
|
25天前
|
机器学习/深度学习 数据挖掘 TensorFlow
🔍揭秘Python数据分析奥秘,TensorFlow助力解锁数据背后的亿万商机
【9月更文挑战第11天】在信息爆炸的时代,数据如沉睡的宝藏,等待发掘。Python以简洁的语法和丰富的库生态成为数据分析的首选,而TensorFlow则为深度学习赋能,助你洞察数据核心,解锁商机。通过Pandas库,我们可以轻松处理结构化数据,进行统计分析和可视化;TensorFlow则能构建复杂的神经网络模型,捕捉非线性关系,提升预测准确性。两者的结合,让你在商业竞争中脱颖而出,把握市场脉搏,释放数据的无限价值。以下是使用Pandas进行简单数据分析的示例:
32 5
|
2月前
|
存储 数据挖掘 数据处理
DataFrame探索之旅:如何一眼洞察数据本质,提升你的数据分析能力?
【8月更文挑战第22天】本文通过电商用户订单数据的案例,展示了如何使用Python的pandas库查看DataFrame信息。首先导入数据并使用`head()`, `columns`, `shape`, `describe()`, 和 `dtypes` 方法来快速概览数据的基本特征。接着,通过对数据进行分组操作计算每位顾客的平均订单金额,以此展示初步数据分析的过程。掌握这些技能对于高效的数据分析至关重要。
33 2
|
25天前
|
机器学习/深度学习 数据挖掘 TensorFlow
从数据小白到AI专家:Python数据分析与TensorFlow/PyTorch深度学习的蜕变之路
【9月更文挑战第10天】从数据新手成长为AI专家,需先掌握Python基础语法,并学会使用NumPy和Pandas进行数据分析。接着,通过Matplotlib和Seaborn实现数据可视化,最后利用TensorFlow或PyTorch探索深度学习。这一过程涉及从数据清洗、可视化到构建神经网络的多个步骤,每一步都需不断实践与学习。借助Python的强大功能及各类库的支持,你能逐步解锁数据的深层价值。
46 0
|
2月前
|
SQL 数据挖掘 Serverless
SQL 窗口函数简直太厉害啦!复杂数据分析的超强利器,带你轻松攻克数据难题,快来一探究竟!
【8月更文挑战第31天】在数据驱动时代,高效处理和分析大量数据至关重要。SQL窗口函数可对一组行操作并返回结果集,无需分组即可保留原始行信息。本文将介绍窗口函数的分类、应用场景及最佳实践,助您掌握这一强大工具。例如,在销售数据分析中,可使用窗口函数计算累计销售额和移动平均销售额,更好地理解业务趋势。
43 0
|
2月前
|
SQL 数据可视化 数据挖掘
SQL 在数据分析中简直太牛啦!从数据提取到可视化,带你领略强大数据库语言的神奇魅力!
【8月更文挑战第31天】在数据驱动时代,SQL(Structured Query Language)作为强大的数据库查询语言,在数据分析中扮演着关键角色。它不仅能够高效准确地提取所需数据,还能通过丰富的函数和操作符对数据进行清洗与转换,确保其适用于进一步分析。借助 SQL 的聚合、分组及排序功能,用户可以从多角度深入分析数据,为企业决策提供有力支持。尽管 SQL 本身不支持数据可视化,但其查询结果可轻松导出至 Excel、Python、R 等工具中进行可视化处理,帮助用户更直观地理解数据。掌握 SQL 可显著提升数据分析效率,助力挖掘数据价值。
39 0

热门文章

最新文章

下一篇
无影云桌面