彻底搞定数据产品选型-报表平台、BI平台、大数据平台、数据中台一网打尽

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 彻底搞定数据产品选型-报表平台、BI平台、大数据平台、数据中台一网打尽

这是我的第47篇原创

来吧,废话不多说,直接上干货!


报表平台

到现在还在做报表的,已经很少了。上面三家都是中国主流报表厂商。不过在国外BI厂商的市场压力面前,也都做了BI套件。主流的就帆软和润乾,水晶报表最近见的少了。

普通小厂,1、2个数据工作者,建议采购一个报表平台就行了,不用买BI软件。

帆软功能齐全,生态很好,人比较好招,还有升级版帆软BI。但是价格略贵,乙方不建议用。

润乾价格便宜,一套万把块钱,如果年付的话,可以无限量安装,多一套也就多千把块钱。比较适合乙方。市场有“南帆软,北润乾”的说法


BI平台

早期都是国外市场的天下,BO、Brio、Cognos、MSTR等,都是老牌BI厂商了,我做纯技术的时候就大量使用他们的产品。东西都不便宜,而且是按产品+用户双重收费,不太划算。

早期国内只有报表,结果大单都被国外BI厂商接走了,于是他们痛定思痛,认真学习,就有了帆软BI、海致BDP、润乾BI、SmartBI、亿信BI等产品。东西也不差,价格比国外的美丽多了。而且基本都只是限定服务器,不限定用户数,怎么用都OK。

不过用BI,就不是2、3个人的事情了,必须得建数仓,然后再做各种可视化、多维分析等。所以就得有数仓工程师、ETL工程师、BI工程师等岗位。当然,你要是牛,一个人全兼了也没问题。

中型厂商,有好几个系统的,建议采购一套BI系统,什么数仓、指标体系、固定报表、多维分析、数据可视化就都有了。建设期得多几个人,建好之后就很舒服了,业务固定的话,留两个人维护就OK了。


大数据平台

2013年左右,Hadoop体系的不断完善,标志着大数据应用场景可以被满足了。这时候就有前沿的一些企业开始做大数据平台。厂商特别多,主流的就说3个吧:

这几年这些厂商也开始往“数据中台”的概念上走。但是毕竟是传统软件厂商,有点搞不太懂互联网公司提的“数据中台”到底是啥,貌似跟他们做的大数据平台没啥区别。

其实所有大数据平台都已经具备了“数据中台”的基础能力,你拿大数据平台和数据中台的产品对一下,各种功能其实基本都一样,只是数据中台加了一些类似3One、标签工厂等概念。

如果你的公司有很多业务系统,数据量非常大,面临海量数据的存储、计算的需求,随便找上门三个里挑一个,肯定够用。


数据中台

“中台”的概念就是阿里推广开的。阿里从SuperCell学过来这一套,然后化为阿里内功后,再向外推广。“数据中台”也是那时候一起推广出来的。所以主要的厂商都是阿里系的人出来创业的公司。

袋鼠云、数澜、奇点云都是阿里的P9出来创办的公司,技术都差不多。

袋鼠云是阿里DBA团队出来的,比较鸡贼,牢牢的跟阿里绑死,阿里接单,袋鼠云干活,跟在阿里一样一样的。

数澜是阿里产品团队出来的,产品设计的比较ok,宣传的也很不错,业务开展的风生水起。

奇点云是阿里数仓和数加团队出来的,貌似宣传的没上面两个强,接触不多。

数加是阿里自己的产品。

云徙科技很有意思。自己本身技术能力不强。但是它一直打的“双中台”的概念,接了项目之后,自己负责业务中台这边,技术这边的事情就分包给袋鼠云。他们只做行业内头部企业。


如果你们公司业务复杂,数据量大,有多个客户应用场景,需要大量的客户数据价值发现,那你可以考虑上一个中台。


更多数据中台的信息,可以参考我的另外一篇文章:《一口气说穿数据中台-给你架构师的视角》,点击链接即可查看。

总结

报表平台解决固定报表、数据可视化的工作;1、2个报表工程师就能搞定了;

BI平台是在报表平台上增加解决多维分析、自助查询报表的能力,需要数仓团队做底层数据支撑,需要BI工程师设定各种度量、维度,做多维分析报表;不用一张张的做固定报表了;

大数据平台是在BI平台基础上,解决大数据量的存储、计算、实时计算的问题;无需关注底层的海量数据存储、计算、实时计算等问题;需要增加大数据工程师进行集群的维护,基于大数据平台的各种开发工作。

数据中台是在大数据平台基础上,提供ID打通、统一模型、统一服务的能力,附加标签工厂、用户分析等偏互联网属性的功能。人员需要增加数据中台产品经理,其他的工作还是由大数据工程师、大数据分析师等完成。

数据治理能力是从BI平台就开始有了,在大数据平台和数据中台中不断被强化。所以BI平台、大数据平台、数据中台中都有数据治理的能力。在数据中台中还增加了数据资产和计费的概念和能力。

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
20天前
|
数据采集 存储 监控
从零到一建设数据中台 - 数据治理路径
从零到一建设数据中台 - 数据治理路径
63 6
|
30天前
|
存储 JSON Cloud Native
数据库ADB-PG问题之数据源处理如何解决
数据库ADB-PG问题之数据源处理如何解决
|
4天前
|
存储 机器学习/深度学习 数据采集
深入解析大数据核心概念:数据平台、数据中台、数据湖与数据仓库的异同与应用
深入解析大数据核心概念:数据平台、数据中台、数据湖与数据仓库的异同与应用
|
13天前
|
存储 自然语言处理 算法
【LangChain】如何本地部署基于chatGPT的实时文档和表格数据的助手,在自己的数据上构建chatGPT?
本文介绍了如何使用LangChain库和FAISS工具在本地部署一个基于chatGPT的实时文档和表格数据助手,详细阐述了项目原理、搭建步骤、环境配置、代码修改和运行流程,以及如何在自己的数据上构建和使用chatGPT。
26 1
|
1天前
|
数据可视化
Echarts数据可视化大屏开发| 大数据分析平台
Echarts数据可视化大屏开发| 大数据分析平台
|
24天前
|
缓存 DataWorks 数据可视化
DataWorks 数据服务 + BI 可视化分析报表 (搭建战报)
DataWorks 数据服务提供强大的数据 API 能力,并能与多种业界流行的 BI 报表 (DataV、QuickBI、PowerBI和Grafana) 结合,使用 API 数据源的好处是统一数据接口、统一权限管理、统一数据交换以及数据服务提供强大的各式各样的插件能力 (如缓存插件、流量控制插件、日志脱敏插件、断路器插件、IP访问控制插件、三方鉴权插件等),下文介绍各热门 BI 工具接入 DataWorks 数据服务的操作方式。
93 0
DataWorks 数据服务 + BI 可视化分析报表 (搭建战报)
|
1月前
结合LangChain实现网页数据爬取
LangChain框架简化了数据爬取和处理,如信息检索任务。在示例中,它结合Playwright抓取ceshiren论坛页面,使用BeautifulSoup处理HTML,然后应用LangChain的提取链获取帖子标题和URL。代码中定义了提取函数,通过`ChatOpenAI`模型和特定模式抽取数据。此示例展示了LangChain如何降低复杂性,便于快速实现网页内容的自动化提取。
48 6
|
20天前
|
数据采集 机器学习/深度学习 数据可视化
从零到一建设数据中台 - 数据服务开发
从零到一建设数据中台 - 数据服务开发
28 0
|
21天前
|
人工智能 关系型数据库 分布式数据库
PolarDB产品使用问题之如何将自有BI系统接入NL2BI的Web前端
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
22天前
|
Cloud Native 关系型数据库 MySQL
云原生数据仓库使用问题之如何将ADB中的数据导出到自建的MySQL数据库
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。

热门文章

最新文章