赋能平台、提效工具、场景化应用,地产大数据玩转有诀窍

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 在2017在线峰会——票选最美云上大数据暨大数据技术峰会上,来自明源云的刘峥分享了整个的地产行业的趋势以及探索应用实践。他主要从行业趋势和应用实践两个方面进行了分享。他详细的分享了数据管理平台DMP平台的基础层、画像层、算法层、展示层的架构设计,并通过应用场景诠释了大数据在地产行业的作用。

在2017在线峰会——票选最美云上大数据暨大数据技术峰会上,来自明源云的刘峥分享了整个的地产行业的趋势以及探索应用实践。他主要从行业趋势和应用实践两个方面进行了分享。他详细的分享了数据管理平台DMP平台的基础层、画像层、算法层、展示层的架构设计,并通过应用场景诠释了大数据在地产行业的作用。

 

以下内容根据直播视频整理而成。

 

背景

e78cd50d2eb09bf8d46d8054141a64d156f3bea2

上图是明源2017年产品整体的战略布局。最底层ERP,是20年来我们专注做的事情。从项目投资收益、计划、采购、成本、费用、售楼覆盖地产全生命周期的业务管理软件。4年前,明源开始通过阿里云做SAAS产品转型,随着SAAS业务的不断扩张、覆盖产生了很多平台的增值服务。随着SAAS业务及平台增值业务进一步扩张,从业务中积累的数据也越来越多,大数据业务就自然涌现出来。通过一年多的探索实践,大数据已经融入地产业务的方方面面,包括客户大数据、土地大数据、供应商大数据、质量大数据等,大数据战略已全面展开。

行业趋势

房企市场在进行激烈的变化,首先,从增量市场变为存量市场,关注点由卖新房转变为租赁、物业、客服等;其次,消费升级,目标群体从中产阶级转变为个性张扬的80后90后;最后,政策压力及供需失衡导致房子不好卖,形势更加严峻。在这种背景之下,企业就会更多考虑到“以客户为中心”的转型。主要体现为口碑信息放大客户影响力、需要重新打通多业态的客户、客户对体验的要求越来越高。

e0d83186169ca48379230933738864356b46caa6

在2016年的1月份,地产大数据由一张地图诞生了。这张地图公布了来上海市的某一个项目销售案场的人白天工作地和晚上居住地。这张图对地产的销售人员来说是非常有价值的,因为销售人员在进行广告和拓客时,以前只是进行无脑的发传单或者广告。但是这张图可以科学的指导销售人员的行为,这样就引发了人们对于大数据的理解和认知。

但是,大数据方法在地产企业内应用效果不明显。企业数据存在几个问题:不在线,房地产企业比较重视业务,很多数据都在纸上;价值高,数据获取成本高,单客户数据价值大;不共享,集团、公司、项目数据不共享。

经过一年多的实践,企业更关注内部数据治理及第三方数据的补充。首先,内部数据治理(营销、客服等)方面,进行了多触点数据采集、多业态数据整合、数据巡检以及可视化;此外,对第三方数据进行了整合(投资、拿地方面)。

应用实践

采用的是to B方式,在阿里云基础上做了赋能平台,针对目前个性化方面的弊端进行了封装。在平台之上,快速搭建提效工具降低人工成本。最后,落地场景化应用。

数据管理平台

d73515b4794dceec110a66f95465b1b7a42b58d4

赋能平台内部称作DMP平台,包括基础层、画像层、算法层、展示层。基础层主要是处理基础数据,包括数据源对接、数据采集、数据清洗。画像层主要面向业务部门,主要的作用是业务人员快速去选择所需要的数据。算法层是使用数加机器学习的模块来包装算法。展示层由自己的展示产品和DataV构成。

bcb88aa024da7211141b609731d14b3b5fccbbcb

DMP的技术架构如上图所示。由于是to B方式,所以需要把大数据平台做成SAAS化,在右下角的项目管理可以帮助产品开一个ODPS库或者SAAS库。数据采集、数据清洗、数据同步三个工作流是通过Rundeck进行调度,最终归结到ODPS中。

基础层

d07895c0cbd7ad89069d14870a77abc78e467875

基础层首先是做多数据源的接入,可以配置一些数据库的信息,把酒店系统、物业系统、ERP数据全部接入;第二部分是数据采集,按需采集;第三部分是海量数据离线计算,目前数加的开发满足不了需求,所以需要类SQL的流程来清洗数据;第四部分是用于CIO和IT部门,做数据融合。

画像层

9372922d89b3de2ce513f9c8df884442d9f880be

画像层是把所有目前的数据的业务指标全部平铺出来,在面板上可以轻松的获取所有的数据,分析目标特征。对每个人可以进行360全生命周期的画像,然后展示。对短名单进行下载,再营销。

算法层

47a9cb7e97f4991f0497442c36fe27a2dafe05c7

算法层主要使用了数加的机器学习产品。主要用了分类/预测/推荐、聚类、文本分析、网络分析。

展示层

4a12f1d8f9b80a3730065909878ac17012329666

展示层只要通过简单的拖拽就可以洞察业务,并且,通过地图展示可以直观的看出每一个区域客户的情况。通过DataV的大屏可以实时展示整个公司的业务情况。

大数据已经不是单独存在的事物了,大数据支撑业务的方方面面,大数据平台需要很灵活的自定义体系去支撑目前多变化的业务。上述四层结构都是以自定义的形式出现的。基础层包括了数据源自定义、数据采集自定义、数据清洗自定义。画像层包括了业务指标自定义、标签自定义。算法层包括了机器学习自定义、算法流程自定义。展示层包括了报表自定义、可视化自定义。四层的自定义构建出了目前的大数据平台。

提效工具

efbdcf8474c734a40660ec89923fa0218bc61149

大数据如何做提效?上图所示为北京东南五环的楼盘签约客户的通讯地址分布图。可以看出东南三四环和东南六环买房的人比较多。通过大数据可以自动进行热力图的绘制,不需要经过人工的复杂过程。

场景化应用

0dedadb5ffbf0b974558e734837885b43b5b3c7f

使用提效工具我们已经分析出了签约客户地图,但是不够场景化。在此基础上,需要在DMP中找到分析出的比较容易出购买客户的地区画一个半径,每日向置业顾问推送将来自该区域的看房者,提醒重点跟进。

73b694b443635e3037e89c65a2e15c68efacaf72

通过楼盘中分析目前已经成交的客户,再从未成交客户中找到满足现在客户画像的人定义为高意向客户。最开始也只是做到CP1的层次,通过列表得知重点跟进的客户。由于每个客户是有归属的,所以,打通现有云客的系统,把列表导入到云客的资源池,从资源池的工具上进行客户的分配。最后,通过360画像信息获得客户的行为辅助置业顾问快速转化。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
存储 分布式计算 数据可视化
大数据常用技术与工具
【10月更文挑战第16天】
201 4
|
5天前
|
SQL 人工智能 自然语言处理
DataWorks年度发布:智能化湖仓一体数据开发与治理平台的演进
阿里云在过去15年中持续为268集团提供数据服务,积累了丰富的实践经验,并连续三年在IDC中国数据治理市场份额中排名第一。新一代智能数据开发平台DateWorks推出了全新的DateStudio IDE,支持湖仓一体化开发,新增Flink计算引擎和全面适配locs,优化工作流程系统和数据目录管理。同时,阿里云正式推出个人开发环境模式和个人Notebook,提升开发者体验和效率。此外,DateWorks Copilot通过自然语言生成SQL、代码补全等功能,显著提升了数据开发与分析的效率,已累计帮助开发者生成超过3200万行代码。
|
17天前
|
存储 分布式计算 安全
MaxCompute Bloomfilter index 在蚂蚁安全溯源场景大规模点查询的最佳实践
MaxCompute 在11月最新版本中全新上线了 Bloomfilter index 能力,针对大规模数据点查场景,支持更细粒度的数据裁剪,减少查询过程中不必要的数据扫描,从而提高整体的查询效率和性能。
|
2月前
|
SQL 数据采集 分布式计算
【赵渝强老师】基于大数据组件的平台架构
本文介绍了大数据平台的总体架构及各层的功能。大数据平台架构分为五层:数据源层、数据采集层、大数据平台层、数据仓库层和应用层。其中,大数据平台层为核心,负责数据的存储和计算,支持离线和实时数据处理。数据仓库层则基于大数据平台构建数据模型,应用层则利用这些模型实现具体的应用场景。文中还提供了Lambda和Kappa架构的视频讲解。
245 3
【赵渝强老师】基于大数据组件的平台架构
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
2月前
|
关系型数据库 分布式数据库 数据库
PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具
在数字化时代,企业面对海量数据的挑战,PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具。它不仅支持高速数据读写,还通过数据分区、索引优化等策略提升分析效率,适用于电商、金融等多个行业,助力企业精准决策。
37 4
|
2月前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
23天前
|
存储 人工智能 算法
为什么局域网协作工具是大数据时代的必需品?
本文深入解析了局域网文档协同编辑的技术原理与优势,涵盖分布式系统架构、实时同步技术、操作变换及冲突自由的副本数据类型等核心概念。同时,探讨了其在信息安全要求高的组织、远程与现场混合团队、教育与科研团队等场景的应用,以及国内外技术方案对比和市场未来趋势。
|
2月前
|
机器学习/深度学习 搜索推荐 大数据
大数据与教育:学生表现分析的工具
【10月更文挑战第31天】在数字化时代,大数据成为改善教育质量的重要工具。本文探讨了大数据在学生表现分析中的应用,介绍学习管理系统、智能评估系统、情感分析技术和学习路径优化等工具,帮助教育者更好地理解学生需求,制定个性化教学策略,提升教学效果。尽管面临数据隐私等挑战,大数据仍为教育创新带来巨大机遇。
|
3月前
|
机器学习/深度学习 监控 搜索推荐
电商平台如何精准抓住你的心?揭秘大数据背后的神秘推荐系统!
【10月更文挑战第12天】在信息爆炸时代,数据驱动决策成为企业优化决策的关键方法。本文以某大型电商平台的商品推荐系统为例,介绍其通过收集用户行为数据,经过预处理、特征工程、模型选择与训练、评估优化及部署监控等步骤,实现个性化商品推荐,提升用户体验和销售额的过程。
116 1

相关产品

  • 云原生大数据计算服务 MaxCompute