【云栖号案例 | 制造】明源云通过数加平台降低大数据的应用门槛

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 明源云存在数据的缺散乱现象同时需要将纸质数据搬到云端数据库上。上云后从存储、计算、上层应用,提供一整套的解决方案,与阿里云生态共同成长。

云栖号案例库:【点击查看更多上云案例】
不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策!

公司介绍

我们公司,即明源云,是国内领先的地产生态链“互联网+”服务商,致力于让地产生态链更智慧。秉承产品领先战略和让用户成功的经营理念,我们成功为全国超过5000家房地产企业提供“互联网+”解决方案和管理系统,帮助开发商管理成交额5万亿,实现对新房市场60%份额的覆盖。90+地产百强与我们携手,成功推进了“互联网+”。我们公司在20年的房地产行业深耕中积累了足够多的数据,伴随着如今地产行业大数据应用的兴起,们也在以大数据为主攻方向进行不断的拓展和创新。

业务痛点

地产行业,业务驱动非常明显,以前大家考虑的是卖好房子就可以了,然而在市场竞争愈加激烈后,如何经营与维护老业主,并从存量市场提取信息指导业务,成为许多企业的探索目标。因此企业在积累了大量用户后,如何去服务现有客户,成为需要解决的问题。然而,需求之外,真正地实施并不容易,纵观地产行业,目前碰到挑战可能不是技术上的,而在于数据上。

  • 数据挑战来源于行业数据隐私观念方面。地产还属于一个很传统的行业,有时候一个客户甚至能带来数百万的价值,因此对数据看的非常重要。因此,地产界对客户隐私的保护比任何行业都要强,开始推广的时候很难,很多人还是相信自建机房,不接受任何云服务。
  • 数据的缺散乱现象非常明显,数据采集、融合难度较大。计算方面的挑战都通过数加解决了,面临的最大挑战反而在于数据的不规整。

1.地产是个很传统的行业,以前数据以线下数据的居多,例如看房时的来访登记。因此首先需要解决的问题是如何将纸质数据搬到云端数据库上,其次才能挖掘和分析。
2.在已有IT系统中,就是数据缺散乱的现象,例如物业有物业的系统、停车有停车的系统,现在地产也不只是地产,甚至有酒店和商场,所有数据都放在各种不同的地方。

解决方案

图 1. 明源云技术架构

image

目前,明源在营销和云采购方面采用了阿里云数加解决方案,接下来还会在金融方面深入应用。

  • 在营销应用方面,通过云业务和ERP数据源,直接做数据采集进入数加MaxCompute,然后再对数据做清洗和转化,将处理结果保存到RDS中,最后用DataV连RDS做数据大屏。
  • 在云采购方面,解决方案包括三个步骤:

1.数据同步:通过数据同步的操作,把日志数据从RDS中同步到MaxCompute的表存储中。
2.机器学习:然后,利用机器学习PAI对于数据进行特征工程处理并且进入逻辑回归算法进行模型训练。
3.调度预测:在生成离线预测模型之后,使用大数据开发套件DataIDE进行离线预测调度,每天凌晨对于数据进行预测,按照用户的付费意向排序,选择付费意向高的对象作为潜在客户推送给销售人员。

上云价值

  • 阿里云数加为明源赋能,最大的降低了大数据的应用门槛。
  • 我们公司开始和阿里云一起联合举办地产行业CIO峰会,展开越来越多的布道,引导客户数据上云。
  • 与阿里云整个生态体系共同成长,更快更好的为客户提供高价值的服务。
  • 阿里云产品本身迭代的很快,而明源在应用上迭代的也很快;之后,明源不止是用阿里云的服务,还在向自己客户提供服务的过程中,同时使用了阿里云其他生态伙伴的产品,比如通讯解决方案提供商云之讯等。对于明源来说,用最快的速度,最成熟的服务为客户提供服务才是关键;因此,我们选择阿里云,不是选择了单单一个阿里云,更选择了阿里云整个生态,与这个生态共同成长。
  • 我们公司一方面通过阿里云数加来搭建数据管理平台,帮助企业来治理数据的缺、散、乱;另一方面,我们更结合地产行业实际情况,在大数据行业上展开众多摸索。现在许多开发商中,60%都是老业主,这是一个很庞大的数字,如何经营这些关系成为重中之重。

1.首先,在拿地上,可以结合第三方数据,把土地周边的配套设施发展,例如人口、公园等数据展示出来,给房地产公司提供参考。
2.其次,在营销上,可以在客户到访以后做客户地图,也可以通过数据分析用户购房的真正需求,是改善亦或是刚需。
3.最后,在运营上,可以通过数据做产品的改进,例如客户住了房子后,发现楼间距较窄、绿化面积太少或者是不科学、灯光不够亮等等。

客户证言

“阿里云数加的覆盖面很广,从存储、计算到上层应用,提供了一整套的解决方案,确实起到了马总说的普惠大数据。此外,数加也在不断的迭代,不停的有新产品出现,我们也再不断尝试。因此,紧跟阿里云的发布,贴合自己的业务,肯定会有不断的新价值产生。”——大数据负责人刘峥

相关产品

  • 大数据计算服务 · MaxCompute

MaxCompute(原ODPS)是一项大数据计算服务,它能提供快速、完全托管的PB级数据仓库解决方案,使您可以经济并高效的分析处理海量数据。
更多关于阿里云MaxCompute的介绍,参见MaxCompute产品详情页

  • DataWorks

DataWorks是一个提供了大数据OS能力、并以all in one box的方式提供专业高效、安全可靠的一站式大数据智能云研发平台。 同时能满足用户对数据治理、质量管理需求,赋予用户对外提供数据服务的能力。
更多关于阿里云DataWorks的介绍,参见DataWorks 产品详情页

  • DataV数据可视化

DataV旨在让更多的人看到数据可视化的魅力,帮助非专业的工程师通过图形化的界面轻松搭建专业水准的可视化应用,满足您会议展览、业务监控、风险预警、地理信息分析等多种业务的展示需求。
更多关于阿里云DataV数据可视化的介绍,参见DataV数据可视化产品详情页

  • 机器学习PAI

阿里云机器学习平台PAI(Platform of Artificial Intelligence),为传统机器学习和深度学习提供了从数据处理、模型训练、服务部署到预测的一站式服务。
更多关于机器学习PAI的介绍,参见机器学习PAI 产品详情页

【云栖号在线课堂】每天都有产品技术专家分享!
在线课堂地址:https://yqh.aliyun.com/zhibo

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
SQL 存储 分布式计算
ODPS技术架构深度剖析与实战指南——从零开始掌握阿里巴巴大数据处理平台的核心要义与应用技巧
【10月更文挑战第9天】ODPS是阿里巴巴推出的大数据处理平台,支持海量数据的存储与计算,适用于数据仓库、数据挖掘等场景。其核心组件涵盖数据存储、计算引擎、任务调度、资源管理和用户界面,确保数据处理的稳定、安全与高效。通过创建项目、上传数据、编写SQL或MapReduce程序,用户可轻松完成复杂的数据处理任务。示例展示了如何使用ODPS SQL查询每个用户的最早登录时间。
167 1
|
22天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
1月前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
2月前
|
分布式计算 大数据 Linux
大数据体系知识学习(二):WordCount案例实现及错误总结
这篇文章介绍了如何使用PySpark进行WordCount操作,包括环境配置、代码实现、运行结果和遇到的错误。作者在运行过程中遇到了Py4JJavaError和JAVA_HOME未设置的问题,并通过导入findspark初始化和设置环境变量解决了这些问题。文章还讨论了groupByKey和reduceByKey的区别。
43 1
ly~
|
2月前
|
供应链 搜索推荐 安全
大数据模型的应用
大数据模型在多个领域均有广泛应用。在金融领域,它可用于风险评估与预测、智能营销及反欺诈检测,助力金融机构做出更加精准的决策;在医疗领域,大数据模型能够协助疾病诊断与预测、优化医疗资源管理和加速药物研发;在交通领域,该技术有助于交通流量预测、智能交通管理和物流管理,从而提升整体交通效率;电商领域则借助大数据模型实现商品推荐、库存管理和价格优化,增强用户体验与企业效益;此外,在能源和制造业中,大数据模型的应用范围涵盖从需求预测到设备故障预测等多个方面,全面推动了行业的智能化转型与升级。
ly~
207 2
|
2月前
|
存储 大数据 分布式数据库
大数据-165 Apache Kylin Cube优化 案例 2 定义衍生维度及对比 & 聚合组 & RowKeys
大数据-165 Apache Kylin Cube优化 案例 2 定义衍生维度及对比 & 聚合组 & RowKeys
49 1
|
2月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
1月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
351 7
|
1月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
53 2
|
1月前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
90 1