用数据给消费者“画像”: 广东企业开挖大数据“富矿”

简介:

珠三角城市群,国内商贸往来最繁华的地区之一。数以千万计的人流,带旺了餐饮、服装、电子消费品等行业,支撑起了珠三角地区庞大的消费市场。

21世纪经济报道记者发现,这个庞大的消费市场产生了庞大的消费数据,这些数据,被越来越多的企业视为可开发、可定价的资源。

其中,餐馆、服装店的消费数据尤为引人瞩目。

通过连日走访,21世纪经济报道记者了解到,一方面,餐饮、服装等传统行业的不少企业加速融入互联网,借助数据挖掘、数据分析推动企业经营提质增效;另一方面,传统的IT企业、新兴的大数据企业强势介入传统行业,试图推动大数据在本行业的深入应用和与不同行业的融合。

这些企业试图通过对数据的广泛收集和深入挖掘,使大数据已经成为一门新的生意。

不过,多名业内人士指出,当前珠三角地区也存在国内较为普遍的“信息孤岛”问题,不同店铺、线上平台的数据难以互通共享。要破解这一问题,需要政府尽快推动行业标准的建立,以系统的脱敏共享促进行业数据和政务数据的开放互通。

为消费者画像

大数据,一个引无数企业遐想的名词,在广东正逐步从虚拟走向现实。

早在2012年,广东就提出了“大数据战略”,时间上早于全国大部分省份。

据2015年年底发布的《广东省大数据产业发展报告》,2014年广东大数据产业总产值约为220亿元,呈现“广深引领、珠三角集聚、粤东西北紧随”发展态势。

而早前出台的《广东省促进大数据发展行动计划(2016-2020年)》明确,到2018年,广东培育5家左右大数据核心龙头企业、100家左右大数据应用、服务和产品制造领域的骨干企业,建设10个左右大数据产业园,大数据及相关产业规模达4000亿元。同时,用5年左右时间,打造全国数据应用先导区和大数据创业创新集聚区。

目前,大数据产业在广东已是如火如荼,大量的企业已经开始利用广东数据资源丰富的资本,为自身的经营服务。

在广州汇美服装有限公司,何建伟正担任数据总监。这份看起来很新颖的职务,其实就是针对公司的产品企划、原料采购、品牌推广提供相应的数据。

汇美服装早年主营女装电商,近年来逐渐从线上转向线下。据何建伟介绍,由于做电商起家,他们很注重收集数据。如今,大数据团队通过整合各大电商平台、线下实体店、加盟店的数据,已经初步建立起企业的大数据库。数据库中的服装款式、服装售价、消费者尺码、人流量等数据,经过挖掘分析,将形成消费者偏好的“画像”报告,企业据此完成产品企划、采购和市场推广等企划。

这个“画像”要解答的问题是,企业应该卖什么,卖多少,怎么卖。

“用户画像完成后,我们可以判断他们倾向的款式、价格和购买的时间点,从而精准推送,同时预判销量以减少库存积压。而以往的这种决策仅是凭借行业的经验。”何建伟告诉21世纪经济报道记者,“从效果看,大数据应用有助于企业提高效率和节省成本。”

不仅仅服装,餐饮业大数据也十分红火。

跨界进入餐饮行业的云藏科技 CEO陈昱是另一名给消费者“画像”的创业者。目前,云藏科技团队正在做餐饮行业的大数据项目,这个项目试图以大数据应用分析,给传统餐馆的管理经营提供决策依据。他对21世纪经济报道表示,从广度上看,珠三角地区人口基数大,流动人口多,消费能力强,每天产生的数据足够“大”;从深度看,珠三角地区的消费人群来自五湖四海,行业业态多种多样,数据丰富度极高。

“数据越丰富越有全国代表性,越能分析出深度。国内很多城市都没有兼具广度和深度的优势。” 陈昱说。

在他看来,数据分析得越深,消费者的倾向、企业的经营情况就越清晰。这不仅能促使企业、同行业内部提质增效,同时能够促使不同行业跨界融合。

丰富的消费数据是珠三角地区的天然优势,而在风险投资人、久久投常务副总经理盛东华看来,珠三角地区更重要的是有鼓励创新的环境。

以深圳、广州为代表的珠三角城市,创投资源云集,TMT行业等创新人才较为集中。大数据应用企业落户在珠三角地区,既方便利用该地区的资本和创新资源,又能直接面向庞大的市场。据盛东华介绍,他已经投资了若干大数据项目。

解题“信息孤岛”问题

无疑,珠三角地区的大数据商业化应用已经具备先发优势。但是,要到达“大数据之巅”,还需要解决关键掣肘:数据的“共享难”问题。

珠三角地区消费发达,各大商圈、广场店面林立,每家门店的电脑里都记录了成千上万条消费记录。可惜的是,大部分门店的数据相互间并不能实现互通,“信息孤岛”现象普遍存在。

比如即使门店接受云藏科技的信息系统,亦不能很好地连接这些历史的沉淀数据。也就是说,这些数据依然处于沉睡的状态。

“沉睡的数据是没有用处,只有数据流动起来,相互连接才有挖掘分析的价值。”陈昱对21世纪经济报道记者表示。为了破解餐饮业“信息孤岛”问题,云藏科技团队一边对门店做优化管理的设计方案,一边收集数据。

涉及“信息孤岛”命题的另一个问题是,A行业的数据库用在B行业,到底有没有效果。

“一般行业会根据自己的需要收集数据,放在另一行业很可能并不适用。”图灵科技CEO杨林晟告诉21世纪经济报道记者,他的论据是早年长期在运营商企业工作的经历。

杨林晟表示,一般情况下,运营商导入的流量中,5%是成单用户,5%-15%的用户是可能成单的潜在用户,其余用户均是无效的用户。

运营商对用户消费行为数据的挖掘、分析,类似推荐通话套餐的营销手段,可以促使部分潜在用户转化为成单用户,使成单用户概率控制在10%左右。但是一旦涉及跨行业,前述可控的成单用户概率很可能急剧跌至3‰的水平,与自然概率相差不大,已经没有多少可挖掘的价值。

究其原因,还是有效的数据积累过于狭小,数据的丰富度有限,无法更深入分析。杨林晟认为,要提高A行业跨界应用到 B行业的效果,关键的解决方法是推动更多行业数据的“脱敏”后共享。他所说的“脱敏”是指企业或政府的数据经过处理后形成更抽象的数据趋势,而不是涉及企业安全和个人隐私的具体信息。

在他看来,由于涉及企业的安全管理和全社会的开放环境建设,当前的“脱敏”工作非常难做。

“实际上存在一种对共享的误解,就是要求拿到一个个具体的数据,这可能涉及隐私或知识产权。但根据算法反馈抽象的结果也是共享。你不用告诉我谁在这家店消费了什么,但你可以告诉我这个区域比较受欢迎的产品是什么。”他说。

盛东华提到,企业怕信息泄露或知识产权被窃取,很难主动开放数据。另一方面,部分从业者缺乏开放数据的意识也是原因之一。

杨林晟对21世纪经济报道记者表示,要解决“信息孤岛”问题,企业与企业之间难以协调,更重要的是需要政府牵头建立本行业、本地区乃至全国的数据共享标准。
本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
16天前
|
SQL 分布式计算 关系型数据库
Dataphin实现MaxCompute外表数据快速批量同步至ADB MySQL
当前大数据时代背景下,企业对数据的处理、分析和实时应用的需求日益增强。阿里云MaxCompute广泛应用于海量数据的ETL、数据分析等场景,但在将处理后的数据进一步同步至在线数据库系统,如ADB MySQL 3.0(阿里云自研的新一代云原生关系型数据库MySQL版)以支持实时查询、业务决策等需求时,可能会遇到数据迁移速度缓慢的问题。 DataphinV3.14版本支持外表导入SQL的带参调度,实现通过MaxCompute外表的方式将数据批量同步至ADB MySQL 3.0中,显著提升数据迁移的速度和效率。
|
29天前
|
存储 数据采集 机器学习/深度学习
大数据分析:挖掘数据价值的技术和方法
在数字化时代,大数据已经成为企业和科研机构的重要资源之一。然而,对于海量的数据如何进行分析和挖掘却是一个巨大的挑战。本文将介绍大数据分析的基本概念、技术和方法,帮助读者了解如何利用现代技术和工具,挖掘数据中蕴藏的价值。
36 0
|
1月前
|
机器学习/深度学习 存储 分布式计算
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
|
2月前
|
存储 SQL 大数据
dataCompare大数据对比之异源数据对比
dataCompare大数据对比之异源数据对比
47 0
|
2月前
|
存储 分布式计算 数据可视化
《PySpark大数据分析实战》-01.关于数据
大家好!今天为大家分享的是《PySpark大数据分析实战》第1章第1节的内容:关于数据。
25 0
《PySpark大数据分析实战》-01.关于数据
|
2月前
|
数据采集 SQL Oracle
助力工业物联网,工业大数据之DWD层构建:数据抽取分析【十一】
助力工业物联网,工业大数据之DWD层构建:数据抽取分析【十一】
43 0
|
2月前
|
分布式计算 资源调度 大数据
大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day30】——Spark数据调优(文末附完整文档)
大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day30】——Spark数据调优(文末附完整文档)
43 0
|
2月前
|
机器学习/深度学习 SQL 监控
❤️淘宝大数据负责人建议数据开发从业者具有的3个核心能力❤️
❤️淘宝大数据负责人建议数据开发从业者具有的3个核心能力❤️
41 0
|
2月前
|
分布式计算 资源调度 大数据
一图胜千言:大数据入门必备的16张数据流转图(建议收藏)
一图胜千言:大数据入门必备的16张数据流转图(建议收藏)
90 0
|
2月前
|
分布式计算 Hadoop 大数据
大数据成长之路-- hadoop集群的部署(4)退役旧数据节点
大数据成长之路-- hadoop集群的部署(4)退役旧数据节点
40 0