AI战略丨蓝凌 + 通义千问,让知识管理产生新质变

简介: “知识管理 + 大模型”落地通常不是简单的 1+1=2 的公式。

uiqpush4khazq_c5f942152c38494b916a1fb38c943ee1.jpg

导读:“知识管理 + 大模型”落地通常不是简单的 1+1=2 的公式。

从大模型混战到 AI 原生应用涌现,耗时仅一年。如今,生成式人工智能(GenAI)早已从 C 端应用渗透进企业级(ToB)业务领域,尤其是那些依赖于信息的专业化提炼加工、内容生成、信息传递分发的业务,成为 GenAI 渗透各个领域最开始的“切口”。

正如蓝凌研究院副院长黄德毅所说:“GenAI 冲击最显著的领域,首先是内容生成行业,比如媒体和法律服务。这些行业原来最大的价值体现是内容分析、生成和分发,但是当 AIGC 愈发成熟之后,内容制作的成本大幅降低甚至降为零,这导致原有的价值体系不可避免地瓦解。相应地,该行业的传统业务模式所承载的价值将 日渐式微,价值创造的重心转移到了分发的平台上。”

面临 GenAI 这样一个巨大的技术爆点,企业、数字化厂商以及周边的生态该如何去拥抱,从什么样的业务和场景作为切入点,成为新周期的第一个难题。

对蓝凌而言,通过大模型赋予知识管理业务新的活力,已经走出了一条可行的路。

智能升级方法论

要想搭上 GenAI 的东风,黄德毅院长根据蓝凌的经验,给出了一个解题思路——需要解构 AI 2.0 时代的底层逻辑,并筛选有价值场景,才能乘风而上。

首先,理解当前 GenAI 带来的第一价值点——降低依赖人的成本。

从个人角度,GenAI 大幅降低了内容工作者检索信息的时间成本和机会成本。通过大语言对话模型,对全网信息进行检索并生成流畅的回答,使得信息检索的目的性、准确性与提问内容更加匹配,为个人省略了大量信息的检索、筛选和再加工时间。

从组织角度,GenAI 打破了部门、组织间信息对称的壁垒,快速生成对应结果。部门、组织每天都会产生大量的结构化或非结构化数据,有些数据需要加工、处理分析,有些数据需要快速传递,GenAI 恰好可以快速地自动化生成、并被需要的人或组织检索到,大幅降低了信息组合、生成、传递的时间成本。

可以理解为,现阶段的 GenAI 摆脱了部分通识性认知对人的依赖,以更强的自动化大幅降低获得认知的成本。

其次,用合理的机制筛选高可行性场景。

近水楼台先得月,是当前 GenAI 拥抱业务的中心思想。

与内容强相关的业务天然与 GenAI 更容易擦出火花,聪明的市场也很快在探索中找到了一些场景,比如 MCN 产业的内容生成、游戏行业的图像生成、软件开发领域的 Coding 以及几乎所有企业都需要的知识管理。

再考虑当前 GenAI 暴露出来的一些短板——比如大模型幻觉,所以要考虑因为自动化带来的信息错误率,以及该场景对这种错误率的接受度因素。

这样就形成了基于内容强相关、内容容错率的筛选机制,“更合适”的业务场景逐渐清晰的被剥离出来。比如更具体的 MCN 脚本生成、游戏的插图生成、软件开发的代码优化,以及在企业级知识管理场景下的搜索和问答,大模型加持带来了对原有业务质的提升。

所以总结来看,找出好的场景要重点考虑两个度——业务可自动化程度,业务对结果容错的忍耐度。

因此在更泛化、更通用性诉求中,企业知识管理场景脱颖而出。

企业应用“知识管理 + 大模型”的必备条件

任何一项足以改变时代的技术出现,都不会是一蹴而就的。

站在黄德毅院长的角度:“蓝凌拥抱大模型既是自身业务、产品的延续,也是企业客户对革命性技术加持业务的尝试。”即蓝凌将知识管理业务与大模型结合落地到客户的业务当中去,需要有两个判断。一是判断在技术储备上与 AIGC 三要素的匹配,二是判断客户当下对大模型 + 知识管理的 “合理幻想”。

匹配 AIGC 三要素,即数据、算力、算法。

在数据准备上,知识管理从早期显性知识的文档管理、内容管理;到云计算时期的包含行业知识、经验在内的隐性知识管理;再到 AI 1.0 时期的知识场景化,推荐、搜索供给;演进到现在 AI 2.0 阶段的大模型集约化、灵活化,革命性的将经验与数据一同萃取、输出,更精准的问答式供给。

这里的数据准备既有蓝凌对知识管理经验性数据的长期积累,也有客户自身业务数据、企业专业知识性数据的积累。同时满足这两类属性专有数据的基础量,才算达标“知识管理 + 大模型”的数据要素。

在算力准备上,目前大模型算力主要供给方式,一是云服务商的支撑,二是与算力服务商合作共建。而蓝凌的业务很早就与阿里云展开深度合作,在调用算力方面,阿里云作为国内领先的云服务商,能够保证算力的充足供给,并且公共云也是目前获得算力性价比最高的方式。

在算法准备上,基于国内知识管理领域多年的深耕,蓝凌打磨出了一套知识管理的业务模型,在搜索、问答、流程等业务积累了优质的算法模型。

同时阿里通义大模型本身也有许多支持和针对知识管理的具体业务模型,蓝凌只需要做好自身算法模型与通义大模型的对接。

另一个判断,是从企业用户的需求出发,了解它们对大模型 + 知识管理的诉求是什么。

在知识管理场景下,企业对大模型的设想主要体现在两方面。

一是个体效率提升。例如,企业希望业务人员在更短时间内找到更好、更合适的案例用以展示输出;领导想要看各类报表和数据时即刻就能查到相关内容;新入职人员尽快了解规章制度投入工作等等。

二是辅助性诉求。例如,知识搜索助手自动化拆解案例行业、业务场景信息并构建案例图谱;报表助手快速从所有数据中摘取答案并自然回答,同时标注来源;新人助手随时回答交流,帮助新人快速成长上岗等。

在效率和加强辅助的基础上,安全性与成本也是企业用户非常关注的两大要素。

企业希望应用的 AI 知识管理在数据安全、模型安全、算法安全、技术伦理合规、应用本身安全等有所保障。

此外,企业需要以一种相对可控成本的方式去使用大模型能力,这就不得不考虑包括算力训练成本、专业人才成本、数据准备成本等不能绕开的支出项。

从准备条件来看,企业想要把“知识管理 + 大模型”成功落地,既要明确诉求的侧重点,也要评估数据、算法、算力、成本代价等硬性条件是否允许。

“知识管理 + 大模型”的落地路径

“知识管理 + 大模型”落地通常不是简单的 1+1=2 的公式。

黄德毅院长通过蓝凌大量的客户实践,将其总结为“1+N=2”,其中“1”为知识管理下的确定场景,“N” 为任意模型的组合。原因在于 AI 知识管理在现阶段几乎不可能只通过一个基础大模型就能达到业务目标。

例如在合同起草、签订、流转审批的场景下,需要通义千问、通义妙笔、通义法睿、语义向量模型同时支持,既有基础大模型,也有专有模型,又有私有模型一同协作,才能实现合同业务的正常流转。

而在知识管理领域,又可细化出搜索、问答、合同、流程、报表、制度、培训等场景,面向这些不同的细分场景就需要不同模型的参与组合。

常见的搜索、问答会用到通义千问、语义向量模型、摘要模型、文档分类一同协作,生成信息抽取、生成式问答能力;报表、制度、流程等场景就会用到通义千问、通义妙笔、语义向量模型,生成代码能力、问答能力、 NL2SQL(Natural Language To SQL,将用户输入的自然语言转为可执行的 SQL 语句)能力,完成场景诉求。

当把这些具体场景放到更广泛的客户群体当中去时,其变量又会增加。比如客户的业务已经在不同的云上,也可能同时用私有云、专有云、公共云、混合云的业务承载方式,这就需要多模型的策略去实现业务落地。

所以,要在企业客户落地“知识管理 + 大模型”是一套复杂的“1+N=2”工程,这个复杂度更多的来自于客户原有的数字化基础特点与模型能力的垂直细分。

由此,黄德毅院长也给出了一个大模型的选型思路。他认为,经历过国产大模型的百模大战之后,当前国产大模型之间的能力差距并没有非常明显,企业在选择模型合作时,可以更多的考虑 ToB 属性。

在众多模型之中,通义大模型的 ToB 属性相对比较强,在模型能力、客户应用规模上都有基础,无论是面向客户还是面向生态,ToB 的业务场景数量足够多、足够细分,同时服务的经验相对更丰富,通义大模型现阶段在 ToB 产业链的宽度与长度可能会更有优势一些。

选型过后,将是落地大模型最难的部分——技术实践。

现阶段大模型的技术路线主要是三类:1.直接使用大模型;2.工程化适配,包括微调、提示工程、检索增强生成(Retrieval Augmented Generation,RAG) 等方式;3.自主研发。

显而易见的是,企业用何种技术路线实现大模型应用都逃不开大模型的“不可能三角”——即从成本、性能、效果的三角关系间取舍、权衡。

从当前企业用户的应用情况来看,对大模型的核心要求是稳定和价格可控。所以在遵循“不可能三角”条件下,蓝凌基本上排除自研大模型的路径。

黄德毅院长总结蓝凌的成功经验时提到:“蓝凌在面向客户提供知识管理服务时,如果采用直接调用大模型,那么实际上得到的结果是大模型本身的知识,与企业特色化的业务有很大差距,从效果的呈现来看并没有给企业带去足够的价值。”直接使用的路径也不太可行。

只剩下一条工程化适配的路。

在工程化适配的路径中,其中一种方式是基于开源模型,通过提示词工程、微调等多种方式,将业务落地。但从成本角度以及预期结果效果来看,企业用这种方式的 ROI 不好预测。

另一种方式是用企业内部的专属知识与闭源大模型的泛化能力、推理能力融合。把企业内部的知识、数据转化到大模型当中,将企业内部向量数据库和通义千问大模型对接,基于 RAG 等大模型工程化适配技术,利用大模型能力来处理带有企业属性的数据,并输出符合企业 属性的回答和生成式的内容。

通过大量的实践效果来看,根据企业用户的技术储备、成本、业务复杂度等多方因素综合评估,蓝凌将两种工程化适配的方式结合使用,更快、更灵活的将“知识管理 + 大模型”在企业端成功落地。

更好的 TC-PMF,预期更好的生产力

新技术、新产品体现的生命周期价值,一定要在效果当中反映出来,过去 ToB 的业务追求 PMF(产品市场契 合度),随着大模型的兴起,TC-PMF(技术成本与 产品市场契合度)或将成为新的标准。

黄德毅院长认为:“无论是蓝凌自身,亦或应用“知识管理 + 大模型”的企业客户,既是 GenAI 的开拓者也是红利受益者,都非常关注 TC-PMF,只是所站的角度不同。”

为了更高效地满足跨行业跨领域客户的各类不同场景需求,蓝凌 AI-PaaS 使用了阿里云百炼大模型服务平台,进行各种大模型能力的一站式管理、调用和调优,以降低使用的成本和复杂性。

此外,百炼平台“开箱即用”的功能通过标准化的接口使模型间和系统间的对接更为快捷,进一步加速了应用开发进程。

简而言之,通过调用百炼平台上统一、即插即用的大模型能力,不仅提升了开发效率,还优化了资源利用效率,减少了对外部多方协调的依赖。

对蓝凌而言可能只需要在一个模型平台上就能获取足够的服务,极大降低了找模型、选模型、再训练、整合、实施、配置的成本,从而达到一个好的TC-PMF。

站在蓝凌的视角,最理想的状况就是,通过与极少数大模型服务商进行合作,就能够获得全方位服务,简化前期选型交流和后期部署交付流程,避免跨厂商合作带来的高昂成本。希望将来阿里百炼平台能够推出更多模型种类,封装更多的细分场景模型,比如信息抽取模型、摘要模型、文档分类模型、专业模型等等,越是细分的模型组合越能支撑复杂的业务场景。

站在企业客户的视角,他们希望蓝凌带来的“知识管理 + 大模型”能大幅提升业务效能,甚至创造额外的业务价值,期待这种新技术、新产品能够帮助它们快速获得新周期的竞争优势,同时要在成本可控的前提下,更快速、更灵活的落地,更及时的响应服务调整。

两种视角的 TC-PMF 都对通义大模型提出了更高的技术和产品要求,也期待下一阶段的 AI Agent 产品,甚至更广义的 MaaS 服务或者模型中台产品诞生。

“知识管理 + 大模型”给 AI2.0 时代的 ToB 服务开了个好头,未来也必将诞生能力更强的模型产品、服务,助力产业链整体激发新质生产力。

相关文章
|
10月前
|
存储 机器学习/深度学习 人工智能
告别信息焦虑,用这个国产AI工具做知识管理,大脑终于解放了
文章介绍了纳米AI知识库作为“第二大脑”的强大功能。它能高效管理海量信息,支持54种文件格式上传,自动提取关键数据并打标签,轻松整合工作与生活中的碎片化信息。通过场景测试显示,在工作和生活中,纳米AI可快速生成报告、提供精准数据,极大提升效率。其共享机制还促进了团队协作,释放了创造力,让用户从琐碎事务中解脱,专注于深度思考与创新。
|
3月前
|
人工智能 自然语言处理 供应链
应用创新丨从赋能到重塑,AI Agent 构建企业智能新引擎
企业应用 AI 正经历从“调用模型”到“构建 AI Agent”的根本性范式转变。
应用创新丨从赋能到重塑,AI Agent 构建企业智能新引擎
|
人工智能 自然语言处理 搜索推荐
创新场景丨听力熊:让 1 亿 10 后拥有“随身智能体”
大模型在青少年场景的应用价值已经远超其它传统教育硬件,听力熊由此也开始向 AI 随身智能体转型。
|
12月前
|
人工智能 自然语言处理 语音技术
Ai好记全面接入DeepSeek大模型!重塑知识管理新体验
Ai好记融合DeepSeek大模型,带来知识管理新纪元。视频秒变知识胶囊,外语资料自动转母语,一键构建思维导图。六大核心能力包括结构化笔记、AI播客、全平台解析等,全面提升学习和工作效率。立即登录aihaoji.com体验!
|
存储 机器学习/深度学习 人工智能
创新场景丨小鹏汽车:端到端智驾真正竞赛在云端
算力上的提前布局,让小鹏汽车在国内率先实现端到端智能驾驶大模型量产上车。小鹏汽车认为,端到端只是开始,不是终局,真正的竞赛正在云端展开,云端大模型才是制胜关键。拥有强大算力的阿里云,支撑小鹏汽车端到端大模型的快速迭代。
|
人工智能 安全 算法
AI战略丨协同共治,应对 AI 时代安全新挑战
人工智能行业的安全发展,需要整个行业“产学研用”等多方协同共治,才能实现人工智能的高质量发展目标。
|
6月前
|
人工智能 安全 小程序
大模型登记指南—全网最详细解读版,纯干货快收藏!
本文解析了大模型“备案”与“登记”的区别,适用于不同场景的申报要求,并结合实际案例讲解登记流程、材料准备及安全评估要点,帮助企业合规申报,避免因未备案/登记而违规。
|
人工智能 自然语言处理 语音技术
创新场景丨下一个iPhone 时刻,AI+AR 加速虚实融合世界的到来
仅仅以大模型通用能力帮助 AR 眼镜实现了多个场景下的交互还不够,关键在于大模型没有针对 AR 眼镜的需求做深度的定制和匹配。
|
人工智能 自然语言处理 机器人
创新场景丨大模型时代,重塑智能终端新体验
大模型为智能终端带来的变革是全方位的,但挑战也同样显而易见。云侧部署的大模型加端侧应用的大模型是综合平衡性能、成本、功耗、隐私、速度之下的最佳选择。
|
传感器 人工智能 算法
AI战略丨AI 改变物理世界,绘制智实融合产业发展图谱
通过打破传统界限,实现虚拟与现实之间的无缝对接,我们正步入一个前所未有的智能新时代。