大数据踩坑之旅: 从数据可视化到商业智能

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 数据可视化有很高的弹性,很多产品公司了解到客户的需求以后,首先评估,然后设计开发流程。然而有时客户对自己的需求并不明确,因此如何用非常短的时间去表达客户的业务理念和把客户提供的信息用格式化方式展现出来,以及去探明客户的需求,是非常重要的。讲师以自身经历讲解了一系列运用大数据所遇到的问题以及解决方案。

摘要:数据可视化有很高的弹性,很多产品公司了解到客户的需求以后,首先评估,然后设计开发流程。然而有时客户对自己的需求并不明确,因此如何用非常短的时间去表达客户的业务理念和把客户提供的信息用格式化方式展现出来,以及去探明客户的需求,是非常重要的。讲师以自身经历讲解了一系列运用大数据所遇到的问题以及解决方案。

本次直播视频精彩回顾,戳这里!
以下内容根据演讲嘉宾视频分享以及PPT整理而成。

新的一次认知革命


 43cbd43c273dd1abc0ef68206436dd69997d6fe4

 

大数据加上今年非常火热的AI带来了新的一次认知革命,在历史地位上可能和人类发明文字一样重要,改变了人们的认知方式。传统的认知方式,一个组织会有很多的部门,包括业务、销售,运营等部门,并且所有的部门可能会有多套不同的系统。在传统的认知领域当中,所有的数据聚在一起,由于使用不同的系统、数据和业务,里面会有大量的领域知识,这些领域知识要耗费人类的大量智慧去处理。随着技术的发展,如今发生了以下三大变化:

1.分布式架构、网络、云计算的发展,意味着技术能力无限;

2.深度学习的发展,意味着模型的解知能力无限;

3.移动互联网和完善的基础设施的发展,意味着可用来分析的数据也是无限的。

这一切都推动着大数据和人工智能的发展,因此,理想状态下,所有的数据会经由一套系统,然后会以统一的口径和统一的模型交给决策者。这个过程是没有人参与的,因此大大缩短了学习和决策周期。


a0017f48cc80be0561166215187837b9576c95bc 

当我们做一个决策的时候,做决策的循环在现阶段是非常普遍存在的,做出决策的快慢与好坏从一定程度上是影响到你的竞争对手,理想状态下,循环通常会有以下几个步骤:

1.观察:多数据来源、快递的处理链路、更为可信;

2.理解:模式识别、相关性分析、交叉分析;

3.决策:决策支持、模拟(what if);

4.行动:直观的计划和明确的指令。


大数据应用和解决方案


12e8bc27d1e862c805871a5e60c0cc1d78ab8cc1 

现实是骨感的,真正在做数据应用的时候你会发现有很多坑,例如:

1.数到用时方恨少:数据有很多,业务系统的东西也很多,然而要用的时候,能用的好像并不多。

2.要什么?不知道;什么时候要?现在要!客户或者领导的需求其实并不明确,他就是希望你能现在就给他一些建议,像魔术师一样变出一些他想要的东西。       

3.现实世界VS报表世界:虽然很多业务都在信息系统上了,但并不是所有的现实世界发生的事情都被采集到信息系统内。

4.关键数据缺失;数据虽多但不存在完整的资料和文档。

5.链路跑通只是噩梦的开始;当链路终于跑通时,又会遇到以下三个问题:数据准确吗?模型可信吗?能做的比业务专家更好吗?

6.像十九世纪的伦敦烟卤工;为什么说是十九世纪的伦敦烟卤?很多传统的业务会有很多独立的系统,每一个业务部门和业务需求都是独立招标的。

以上是我们在实际运用中会碰到的坑,甚至是无法避免的,我有以下几点建议:

1.尊重现实,尊重业务,至少在项目初期,保持学习者的心态。

2.快速跑通,尽可能把你跑通的数据用可视化的形式展现出来,告诉组织内部的决策者,这样做是为BOSS建立可信的信息来源。


4a5002650060f9e35ab15897750b4f5ced880c90 


3.避免使用传统架构:云服务已经提供了太多很好的选择,例如数据集成、DATA IDE、流式计算、日志服务、弹性搜索和数据开发管理等。因为数据化下的工程大部分都是CEO工程,信息系统的整合往往意味着流程的再造,所以你要争取非常好的内部的合作心态。更多的为业务部门提供一个展示成绩的渠道,帮助业务部门解决实际问题或给他们以推动问题解决的帮助。


5921482d26c5e9a41eb588f3d176673163d01ad1 


4.搭建一个合理的数据链路和逻辑:将大部分数据源在数据接口层原样复制,经过一定清洗之后得到基础数据层和描述事实的数据层,再根据客户的多维需求形成想要的维度,从而形成应用层。只有链路+逻辑都是正确,数据才会正确,因此链路方面我们可以通过自动的校验机制基于规则和统计来保证链路是正确的,逻辑数据则要花很多时间去理解业务,形成一个知识,这个知识就在处理逻辑的可溯源的《血缘文档》或《血缘管理》里面,这在多个数据源和复杂数据是必须要做的。

5.数据可视化:首先要尽可能快的给出第一版内容,然后给客户指引,了解到他要什么,中间再经过不停的修改,最后将可视化项目整合到数据集成。最好的可视化,是不用解释而客户就能很自然地可以看懂态势。有两种常见的可视化解决方案,最简单的方案是直接在系统和数据已经结构化了之后形成数据可视化,较为复杂的方案则需要数据链路+权限控制,再形成数据可视化。


商业智能分析


1b44f20f653901ab74b36f5114a97ae2f6e7367e 

 

最后谈一下关于大数据在商业智能上面的话题,当给客户做应用或者是提供服务和解决方案的时候,很重要的一点是要知道客户的效率和生产率,对于销售人员而言,如果在网上通过销售渠道去做,那么需要提高的效率是点击率了。而对于线下的销售而言,用同样的方案就没用了。关于商业智能算法的应用主要有两方面,在竞争性业务场景主要是营销互联网方面,会加速OODA的循环——甩开对手或者不被对手甩开,更快的投放广告采取精准的营销方式。而另一方面,对于效率性的业务场景,主要是生产类的。因为在做工业优化或者说产线优化的时候,停产线去实验新的技术,成本是非常高的,所以更多的是从历史数据中寻找优化方式,看能不能从过去的生产供应参数和环境的波动去寻找出一些特定的模式出来,把这些作为接下来的实验指导,去降低探索新的工艺的门槛。

 

 

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
SQL 监控 数据可视化
数据可视化:Power BI在商业智能中的强大作用
【10月更文挑战第28天】在信息爆炸的时代,数据成为企业决策的重要依据。Power BI作为微软开发的强大数据可视化工具,集数据整合、报表制作和数据可视化于一体,通过简单拖放操作即可生成交互式图表和报表,提高决策效率,实现数据整合与实时监控,助力企业挖掘数据价值,提升竞争力。
82 3
|
1月前
|
分布式计算 大数据 BI
ClickHouse与大数据生态整合:从ETL到BI报表
【10月更文挑战第27天】在这个数据驱动的时代,企业越来越依赖于数据来做出关键决策。而高效的数据处理和分析能力则是支撑这一需求的基础。作为一位数据工程师,我有幸参与到一个项目中,该项目旨在利用ClickHouse与Hadoop、Spark、Flink等大数据处理框架的整合,构建一个从数据提取(Extract)、转换(Transform)、加载(Load)到最终生成商业智能(BI)报表的全流程解决方案。以下是我在这个项目中的经验和思考。
87 1
|
1月前
|
人工智能 供应链 搜索推荐
大数据分析:解锁商业智能的秘密武器
【10月更文挑战第31天】在信息爆炸时代,大数据分析成为企业解锁商业智能的关键工具。本文探讨了大数据分析在客户洞察、风险管理、供应链优化、产品开发和决策支持等方面的应用,强调了明确分析目标、选择合适工具、培养专业人才和持续优化的重要性,并展望了未来的发展趋势。
|
5月前
|
机器学习/深度学习 人工智能 数据可视化
大数据时代的数据可视化技术:趋势、挑战与未来展望
【7月更文挑战第22天】随着技术的不断进步和应用场景的不断拓展,数据可视化技术将在更多领域发挥更大的作用。未来,我们可以期待更加智能化、实时化、沉浸式和民主化的数据可视化解决方案的出现。同时,随着数据量的不断增加和数据类型的不断丰富,数据可视化技术也将面临更多的挑战和机遇。只有不断创新和优化技术才能满足日益增长的需求并推动数据可视化技术的持续发展。
|
4月前
|
数据可视化
Echarts数据可视化大屏开发| 大数据分析平台
Echarts数据可视化大屏开发| 大数据分析平台
|
6月前
|
机器学习/深度学习 数据可视化 数据挖掘
数据可视化在大数据分析中的重要作用
数据可视化在大数据分析中的重要作用
147 0
|
7月前
|
监控 数据可视化 搜索推荐
数据可视化:将大数据分析转化为视觉洞察
【5月更文挑战第30天】数据可视化是将复杂大数据转化为图形,便于理解和分析的工具,对于决策至关重要。它涉及选择合适的可视化方法、数据处理和探索性分析。应用广泛,如商业智能、客流管理、医疗服务和生产监控。未来趋势关注交互性、个性化及处理海量数据的挑战。掌握数据可视化将成为必备技能。
110 0
|
7月前
|
机器学习/深度学习 人工智能 数据可视化
基于Python的数据可视化技术在大数据分析中的应用
传统的大数据分析往往注重数据处理和计算,然而数据可视化作为一种重要的技术手段,在大数据分析中扮演着至关重要的角色。本文将介绍如何利用Python语言中丰富的数据可视化工具,结合大数据分析,实现更直观、高效的数据展示与分析。
|
7月前
|
数据可视化 Linux Apache
CentOS部署Apache Superset大数据可视化BI分析工具并实现无公网IP远程访问
CentOS部署Apache Superset大数据可视化BI分析工具并实现无公网IP远程访问
|
7月前
|
SQL 数据可视化 数据建模
大数据分析利器之Power BI,你是否已经掌握?
大数据分析利器之Power BI,你是否已经掌握?
128 0