个推CTO谈数据中台(上):从要求、方法论到应用实践

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
简介: 当下,数据中台概念火热,但业界对于何谓数据中台,如何进行中台建设意见不一。如何拨开中台建设背后的迷雾,开启对于企业而言意义深远的数字化战略之路?作为数据智能领域的专家,每日互动(个推)CTO叶新江开启了一场有关数据中台的深度分享,从概念定义、价值赋能、战略理论、落地实践等方面层层剖析,旨在帮助大数据、数字化领域以及相关行业从业者梳理出一个聚焦当下、增能未来的中台建设新路径。

当下,数据中台概念火热,但业界对于何谓数据中台,如何进行中台建设意见不一。如何拨开中台建设背后的迷雾,开启对于企业而言意义深远的数字化战略之路?作为数据智能领域的专家,每日互动(个推)CTO叶新江开启了一场有关数据中台的深度分享,从概念定义、价值赋能、战略理论、落地实践等方面层层剖析,旨在帮助大数据、数字化领域以及相关行业从业者梳理出一个聚焦当下、增能未来的中台建设新路径。


本次访谈将分为上下两篇,上篇我们将围绕中台的定义、方法论、每日互动的实践成果等进行答疑解惑,为大家揭开中台的神秘面纱。下篇我们将着重剖析每日互动数据中台与其他中台的异同以及公司在中台方面的战略思考。


当我们谈论中台时,真正在谈论什么?


1. 当前,中台的概念,见仁见智,始终没有一个统一的见解。那么您所理解的数据中台到底是什么?


业界中台概念的提出距今已有2~3年的时间。最初提出中台概念,其主要是与前台和后台的概念做区分。特别是一些大型企业,会有很多所谓的后台系统和前台系统。后台系统指的是财务系统、结算系统以及审批系统等。前台系统,顾名思义指的是和客户打交道的有关系统。随着企业发展壮大,业务越来越复杂,数据也会相应地变得繁杂。此时,如果让前台系统和后台系统进行直接的数据对接,将会十分耗时耗力。于是,数据中台这个理念应运而生。中台作为衔接多个“前台”和多个“后台”的中间层,把很多与数据相关的共性功能抽离出来,减少了后台的重复建设。


每日互动着力打造的数据中台,“核心定位是数据治理及应用,所以我们把它称之为治数平台。” 该平台遵循行业关于中台的基本内涵,但又在此前提下进行了拓展升级。共性部分指的是包括数据的汇集、融合、数据资产化等工作,都会在该治理平台上完成。扩展的部分是治数平台会更多结合有关细分领域,沉淀出知识,再提供可用于开发、挖掘的能力。


“打一个形象的比喻,我们认为每日互动的治数平台就像大家电脑里使用的操作系统一样,每日互动提供的是对于整个电脑资源的管理,至于用什么样的应用,比如说是开发一个office,或者设计师用的设计软件等,则是与各个行业高度相关,我们界定其不属于治数平台的范畴。每日互动治数平台的核心还是在于数据治理,我们会在此基础上再提供对外所需的服务。”


2. 企业为什么要建中台,数据中台对企业的价值是什么?


数据时代,数据价值的最大化需要在融合的前提下才能更好地发挥出来。数据中台首先通过统一的标准把分散在各个地方的数据归集、融合到一起进行治理,再将治理结果进行数据资产化,资产化要求可归类、可定价、可管理、可审计,然后再使资产进行增值,让数据的价值充分发挥。当完成数据的盘点、规整与统一后,我们就能够以数据与技术为手段,重塑工作的各个环节,让“数据业务化、业务数据化”,助力企业构建数据资产化和应用增值的战略体系,提高企业运营效率。


归纳而言,“我们认为数据中台的价值是对企业资产的一种重构,或者说是对于企业资产的一种重新定义。有了全新的资产以后,企业便能产生更大的效益。”


数据中台建设的思路及本质

3. 行业客户建设数据中台前需要重点考虑哪些问题?

建设数据中台要遵循企业数字化进程各阶段的要求。我们认为,企业数字化发展可以分为数据汇集、融合、开放、智能化处理几个阶段。在第一阶段,对于本身已经覆盖较多信息系统的企业,需要考虑把有关数据汇聚到一起。而对于信息化程度相对偏低的企业,则要实现企业业务的在线化。


第二阶段需要企业评估其自身数据是否已经实现了有机地融合。所谓的“融合”指的是企业通过一种标准把各个系统产生的数据进行有效的资产化。也就是说,这个阶段企业需要完成数据治理和归集工作。


第三阶段涉及数据的开放,即企业需要有专门的部门把归集以后的数据开放给内部各个部门,让各部门了解企业的数据资产情况,从而更好地实现企业基于数据的服务提升与创新。有条件的企业再把数据开放给生态链上下游的企业,实现服务创新、协作方式的重构,从而形成更大范围的协同。


第四阶段指的是利用数据进行智能化处理。众所周知,企业通过机器学习等人工智能的方式进行数据处理,可以创造出十分广阔的增值空间,就像寻找矿产资源一样,通过数据智能的方式,企业可以从前所未有的角度挖掘出全新的数据价值。


以上的数字化进程对于计划实施数字化战略的企业而言,是相对比较适合的一个过程。同时,由于各企业的实际情况不同,各自的战略也会有所差别。我们认为,大型企业建设中台主要需要考虑转体系问题,即企业应从整个组织、商业模式、战略协同方面,开展全面的改造,我们也把它称为三个全:全在线、全链接、全协同。而发展中企业则需要先考虑“工具化”问题,即企业可以借助数据平台、工具,首先实现业务的在线化,然后再考虑基于数据的服务提升。


当前,每日互动着力打造的治数平台可以作为大型企业整体战略一个重要的承载部分;对发展中企业,治数平台也可以作为一个工具进行使用,方便这些企业把自身的数据先汇集起来,再结合企业的实际情况制定具体的使用方法与策略。


4. 传统企业数字化转型的大潮越来越汹涌,中台切入传统行业的业务场景是什么?


不同行业由于特点各异,其各自所适用的业务场景也各不相同。举例来说,品牌营销行业的客户更关注的是如何实现企业的营销增长。每日互动基于自身对品牌营销等行业的深刻洞察,推出了一系列的产品与服务,包括底层的治数平台,以及应用层的行业数盘。这些数盘的核心是把我们开展业务过程中的方法论沉淀下来,通过一种易于操作的方式,快速地实现业务目标。比如每日互动面向品牌营销领域推出的“个灯数盘”,它是一款简单易用的SaaS洞察工具,具有全面洞察消费者、高效打通多源数据、秒级输出消费者画像等特点,助力品牌主充分挖掘并快速触达目标消费群体。


在打造治数平台及行业数盘过程中,公司围绕“数据积累(Data)-数据治理(Machine)-数据应用(People)”三层业务逻辑,开展数据智能业务以及推动行业客户数字化升级。



“D”代表数据,指的是我们通过一种合适的方法把散落在企业各个地方的数据进行盘点,汇集、整理、融合与资产化等工作都是在中间的M层完成的。“M”指的是有关平台性质的方法论、原理机制、管理系统等。上层“P”则代表人员、生产力以及专业性,我们只有把这三者进行有机地联动,整个数据业务的开展才能够顺畅地进行。


5. 每日互动是怎么建设中台的?公司数据中台有哪些落地应用成果?


在具体的实施过程中,我们通过Why-What-How三步走的形式构建起自身的数据中台。


首先,我们需要对行业有深刻的认识,了解当前行业最关心的问题。这个我们把它称之为Why。“你只有明白自己为什么要做这个事情的时候,你再去做才有目标。”


Why之后则是What,对应到每日互动的数据底层:“我们需要盘点行业客户已经拥有的数据,以及尚未完成治理的数据”。


最后是How,即我们通过治数平台把底层数据和上层应用层这两端连接起来,把产生的有价值的部分给到客户,助力客户更为全面、及时的决策。


依托前文提及的“Why-What-How”三步走理论,我们深耕于移动互联网、品牌营销、金融风控等行业,通过对数据智能领域的不断实践与创新,并将实践成果沉淀到我们公司的整个产品、服务中,助力客户实现价值最大化。


比如,在金融领域,为了解决银行等机构存在的数据系统独立分散,难以互通管理的痛点,我们全面整合数据资产,打造了鲸智运营中心,帮助金融机构进行数据分析-用户洞察-用户多渠道精准触达-智能策略优化和沉淀,为运营提供有力的数据支撑,强力推进金融行业数字化运营升级。


数据智能时代,数据的价值正在受到越来越多企业的关注,并逐渐成为不少企业的核心资产和生产要素。每日互动致力于打造的数据中台——每日治数平台,期望用前沿的技术为更多企业插上“智慧的大脑”,为大家带来更加便利的生活。


《每日互动CTO谈数据中台(下篇)》我们将会带大家了解公司数据中台的产品特点、为细分行业的增能效果以及产品的战略思考,敬请期待。


相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
目录
相关文章
|
3月前
|
前端开发 机器人 API
前端大模型入门(一):用 js+langchain 构建基于 LLM 的应用
本文介绍了大语言模型(LLM)的HTTP API流式调用机制及其在前端的实现方法。通过流式调用,服务器可以逐步发送生成的文本内容,前端则实时处理并展示这些数据块,从而提升用户体验和实时性。文章详细讲解了如何使用`fetch`发起流式请求、处理响应流数据、逐步更新界面、处理中断和错误,以及优化用户交互。流式调用特别适用于聊天机器人、搜索建议等应用场景,能够显著减少用户的等待时间,增强交互性。
716 2
|
19天前
|
数据采集 供应链 搜索推荐
商业案例 I AllData数据中台商业版落地实践
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
2月前
|
JSON 数据可视化 NoSQL
基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践
本文介绍了LangChain的LLM Graph Transformer框架,探讨了文本到图谱转换的双模式实现机制。基于工具的模式利用结构化输出和函数调用,简化了提示工程并支持属性提取;基于提示的模式则为不支持工具调用的模型提供了备选方案。通过精确定义图谱模式(包括节点类型、关系类型及其约束),显著提升了提取结果的一致性和可靠性。LLM Graph Transformer为非结构化数据的结构化表示提供了可靠的技术方案,支持RAG应用和复杂查询处理。
164 2
基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践
|
5月前
|
监控 数据安全/隐私保护 异构计算
借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据
【8月更文挑战第8天】借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据
111 1
|
5月前
|
存储 机器学习/深度学习 数据采集
深入解析大数据核心概念:数据平台、数据中台、数据湖与数据仓库的异同与应用
深入解析大数据核心概念:数据平台、数据中台、数据湖与数据仓库的异同与应用
|
5月前
|
人工智能 异构计算
基于PAI-EAS一键部署ChatGLM及LangChain应用
【8月更文挑战第7天】基于PAI-EAS一键部署ChatGLM及LangChain应用
|
5月前
|
数据采集 自然语言处理 语音技术
LangChain进阶:创建多模态应用
【8月更文第4天】随着自然语言处理 (NLP) 和计算机视觉 (CV) 技术的不断发展,多模态应用变得越来越普遍。这些应用结合了文本、图像、音频等多种数据类型,以增强用户体验并解决复杂的问题。LangChain 作为一款强大的工具链,可以很好地支持多模态数据的处理,从而开发出具有高度互动性和实用性的应用。
377 1
|
5月前
|
机器学习/深度学习 自然语言处理 搜索推荐
LangChain在个性化内容生成中的实践
【8月更文第3天】随着人工智能技术的发展,个性化内容生成已经成为许多应用的核心竞争力。LangChain 是一种开源框架,旨在简化语言模型的应用开发,尤其是针对自然语言处理任务。本文将探讨 LangChain 如何帮助开发者根据用户的偏好生成定制化的内容,从挑战到实践策略,再到具体的案例分析和技术实现。
321 1
|
5月前
|
存储 缓存 自然语言处理
LangChain在构建智能文档检索系统中的应用
【8月更文第3天】随着大数据时代的到来,企业和组织积累了大量的文档资料。如何有效地管理和检索这些文档成为了一个重要的问题。传统的关键词搜索虽然简单,但在面对复杂查询和模糊匹配时显得力不从心。LangChain 是一个强大的框架,旨在帮助开发者构建文本生成应用程序,它能够利用最新的自然语言处理技术来理解和响应自然语言查询。本文将探讨如何利用 LangChain 构建一个能够理解和响应自然语言查询的文档检索系统。
98 0
|
7月前
|
机器学习/深度学习 自然语言处理 API
大模型应用框架-LangChain(一)
LangChain由 Harrison Chase 创建于2022年10月,它是围绕LLMs(大语言模型)建立的一个框架,LLMs使用机器学习算法和海量数据来分析和理解自然语言,GPT3.5、GPT4是LLMs最先进的代表,国内百度的文心一言、阿里的通义千问也属于LLMs。LangChain自身并不开发LLMs,它的核心理念是为各种LLMs实现通用的接口,把LLMs相关的组件“链接”在一起,简化LLMs应用的开发难度,方便开发者快速地开发复杂的LLMs应用。 LangChain目前有两个语言的实现:python、nodejs。
下一篇
开通oss服务