当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天(2)

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天

全新内容生产方式 ——AIGC

从对话到写作、作画,度晓晓俨然成为了数字人中的「多面手」。一方面,在百度文心大模型整合的多模态交互、3D 建模、机器翻译、语音识别等多项技术的助力下,度晓晓已经在百度 APP 端内实现了生动拟人智能的互动交流。另一方面,由于文心大模型超强的理解和生成能力,度晓晓的创作能力被充分地挖掘和展现出来。

可以这样说,此时的度晓晓已经脱离了传统意义上的 CG 数字人,有了「内涵」,而这些恰好契合了当下备受关注的新型内容生产方式 ——AIGC,即通过人工智能技术自动生产内容。继 UGC、PGC 之后,大模型赋能下的 AIGC 已经成为了过去一年来百度 AI 技术加速落地的着陆点。

不仅如此,度晓晓近来展现的编曲、互动交流、写作和作画,都只是百度大模型技术支撑下在 AIGC 层面的牛刀小试。随着底层 AI 大模型技术的不断完善,AIGC 的可用性和适用性势必会迎来提升和扩展,更多内容生产领域会被发掘出来。

像度晓晓这样的数字人,落地场景也就不再局限于单一的端内互动或图文创作,未来的舞台可以遍布影视、金融、文旅等各个领域,「天空才是她的极限」。

让大模型不再流于参数,终究还是要落地,实现应用价值

在近年来深度学习领域掀起这波「练大模型」潮流之际,百度持续发力文心大模型也是顺势而为,力争在 AI 巨头的竞争中始终保持领先优势。就之前的趋势而言,追逐参数的多、模型的大似乎在国内外巨头们之间形成了一种默契。

从 GPT-3 开始,千亿、万亿级大模型纷至沓来,如国外谷歌 1.6 万亿参数大模型 Switch Transformer、微软联合英伟达的 5300 亿参数模型 MT-NLG,国内浪潮 2457 亿参数单体模型源 1.0、阿里达摩院 10 万亿参数多模态大模型 M6。

慢慢地,当堆参数及其带来的巨额训练成本不再那么吸引 AI 巨头们时,如何使自身大模型更广泛地落地成为了他们新的目标。作为从 2019 年就开始积累预训练技术和大模型的 AI 头雁,百度在探索大模型过程中修炼了自己的武功秘诀 —— 知识增强

2021 年 12 月,百度发布全球首个知识增强千亿大模型鹏城 - 百度・文心发布,它的参数量达到了 2600 亿,是一个融合了 NLP 和 NLG 的全能模型。当时,百度产业级知识增强大模型文心全景图首次亮相。
今年 5 月的 Wave Summit 峰会上,百度聚焦「前沿大模型技术如何匹配真实场景中的方方面面要求」这一问题,提出了大模型产业落地的三个关键路径,包括更适配应用场景的模型体系、更有效的工具和方法以及更开放的生态。方方面面无不呼应着落地。

同时,文心大模型除了迎来新成员之外,还可以通过百度飞桨的一系列大模型开发套件、大模型API和集成文心大模型的飞桨企业版EasyDL和BML开发平台,全面释放使用效能,进一步降低应用门槛。在生态和社区层面,构建文心・旸谷社区,将大模型能力开放给普通开发者,人人皆可触碰 AI 的魅力。文心大模型的个人、企业开发者数量已超过 6 万人

文心・旸谷社区地址:https://wenxin.baidu.com/younger

全新升级的文心大模型在知识增强和产业级这两方面得到了进一步加强,10 个大模型新成员中的国网 - 百度・文心和浦发 - 百度・文心就分别将文心大模型的能力输入到了能源电力行业和金融服务行业,这也预示着文心大模型与行业的联系越来越紧密。

目前,以知识增强和产业级为指导的文心大模型已经逐渐在百度内外「兑现」了自己的能力。

在百度内部,搜索、信息流、百度地图等场景中可以看到文心大模型的身影,如上文在百度 APP 端智能互动的度晓晓以及小度智能屏等;在百度外部,文心大模型在工业、能源、金融、教育、通信、媒体、医疗等各行各业都有了实战场地,如工业领域的零部件质量检测、金融行业的合同信息抽取等,在赋能行业中真正实现了自身的应用价值。

度晓晓最近频频出圈,让更多人看到了其背后文心大模型的技术内驱力。然而,未来文心大模型的落地场景不应受限。

一方面,文心大模型可以按照能源行业国网 - 百度・文心和金融行业浦发 - 百度・文心的模式继续推出更多行业大模型,持续推进大模型在各行各业的深度应用,满足多样化场景任务需求。

另一方面,在 AI for Science 领域,文心大模型中已经有了两个生物计算大模型(HELIX-GEM 和 HELIX-Fold),未来同样有可能在数学、物理、化学等更多基础学科领域构建专属大模型。这样做可以持续探索大模型在科学领域解决问题的巨大潜力,更全面地推进 AI 与 Science 的融合。

大模型成为行业热点已经有两三年时间,在百度看来,2022 年是大模型产业落地的关键年。不管是度晓晓这一系列的创意应用,还是深入到更广泛的行业和前沿技术领域,百度势必会抓住大模型发展的这一机遇,在产业化落地的融合创新之路上继续又稳又快地走下去。

参考链接:https://arxiv.org/pdf/2109.09519.pdfhttps://arxiv.org/pdf/2006.16779.pdfhttps://aclanthology.org/2020.acl-main.9.pdfhttps://www.jiqizhixin.com/articles/2022-05-20-8https://wenxin.baidu.com/wenxin/modelbasedetail/plato/https://wenxin.baidu.com/wenxin/modelbasedetail/ernie_vilg/https://wenxin.baidu.com/wenxin/modelbasedetail/ernie3_zeus/

相关文章
|
22天前
|
机器学习/深度学习 存储 缓存
加速LLM大模型推理,KV缓存技术详解与PyTorch实现
大型语言模型(LLM)的推理效率是AI领域的重要挑战。本文聚焦KV缓存技术,通过存储复用注意力机制中的Key和Value张量,减少冗余计算,显著提升推理效率。文章从理论到实践,详细解析KV缓存原理、实现与性能优势,并提供PyTorch代码示例。实验表明,该技术在长序列生成中可将推理时间降低近60%,为大模型优化提供了有效方案。
116 15
加速LLM大模型推理,KV缓存技术详解与PyTorch实现
|
25天前
|
人工智能 搜索推荐 API
AI赋能大学计划·大模型技术与应用实战学生训练营——华东师范大学站圆满结营
4月24日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行大模型应用实战学生训练营——华东师范大学站圆满结营。
78 2
|
28天前
|
人工智能 自然语言处理 知识图谱
Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库
Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台,支持多格式文档处理和复杂知识关系查询,具备多模型适配和智能体拓展能力。
158 0
Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI大模型进阶系列(01)看懂AI大模型的主流技术 | AI对普通人的本质影响是什么
本文分享了作者在AI领域的创作心得与技术见解,涵盖从获奖经历到大模型核心技术的深入解析。内容包括大模型推理过程、LLM类型、prompt工程参数配置及最佳实践,以及RAG技术和模型微调的对比分析。同时探讨了AI对社会和个人的影响,特别是在deepseek出现后带来的技术革新与应用前景。适合希望了解AI大模型技术及其实际应用的读者学习参考。
|
17天前
|
人工智能 自然语言处理 安全
通义灵码技术进阶实战:三个企业级应用案例深度解析
本文介绍了通义灵码在企业级场景中的三个真实应用案例:一是优化金融交易系统性能,通过改进代码锁机制将延迟降至8ms;二是为电商平台设计弹性扩容方案,在双11期间成功应对流量高峰并降低40%资源成本;三是帮助跨国团队统一代码规范,显著减少冲突率并提升协作效率。文章还总结了技术进阶的关键要点,包括上下文工程、明确约束、文化适配和迭代优化,并提出了将通义灵码融入DevSecOps流程的建议,展示了其作为核心生产力工具的价值。
93 14
|
1月前
|
缓存 算法 Java
通义灵码技术解析:大模型如何重构开发者工作流
通义灵码是一款基于通义千问代码大模型的智能编程工具,专为中文开发者设计。它不仅提供代码补全功能,还覆盖需求分析、架构设计、代码生成与缺陷检测等全链路开发场景。文章从核心架构(多模态代码模型设计)、关键算法突破(语义驱动生成与双引擎缺陷检测)及工程实践(低延迟优化与企业级部署)三个维度剖析其创新逻辑,并通过性能基准测试展示其优越性。未来,通义灵码将持续探索AI-Native开发范式,重新定义开发者生产力。
103 8
|
3天前
|
人工智能 前端开发 开发工具
对话阿里云通义灵码技术负责人陈鑫:AI编程的现状与未来
在AI快速发展的2025年,通义灵码作为国内领先的AI编程助手,正通过其独特的智能体架构和强大模型能力重新定义开发方式。本文邀请技术负责人陈鑫(神秀),探讨AI编程现状与未来。通义灵码基于Qwen3模型打造,具备记忆系统革新、MCP工具生态和多模态交互等优势,推出三种工作模式以适应不同场景。尽管行业仍面临挑战,但国产模型正在崛起,企业可采用“三步走”策略引入AI工具。未来,AI将从辅助走向主导,深化代码理解并重构开发工具,助力更高效、创造性的编程方式。
|
1月前
|
存储 自然语言处理 前端开发
2025年大模型发展脉络:深入分析与技术细节
本文深入剖析2025年大模型发展脉络,涵盖裸模型与手工指令工程、向量检索、文本处理与知识图谱构建、自动化提示生成、ReAct多步推理及AI Agent崛起六大模块。从技术细节到未来趋势,结合最新进展探讨核心算法、工具栈与挑战,强调模块化、自动化、多模态等关键方向,同时指出计算资源、数据质量和安全伦理等问题。适合关注大模型前沿动态的技术从业者与研究者。
473 9
|
1月前
|
自然语言处理 API 数据库
2025年大模型就业:核心技术趋势、技能要求与职业发展全景解析
随着大语言模型(Large Language Models, LLMs)的技术飞速迭代,人工智能领域正经历从通用对话工具向高度智能化、任务导向的智能体(Agent)系统的深刻转型。到2025年4月,企业对掌握LLM相关技术的专业人才需求持续高涨,核心能力聚焦于检索增强生成(RAG)、智能体任务自动化、模型对齐优化以及多模态融合。本文将全面剖析2025年大模型就业市场的技术演进路径、核心技能要求、行业应用场景、推荐实践项目以及职业发展建议,旨在为从业者提供详尽的职业规划指南,帮助其精准把握行业机遇。
415 5
|
1月前
|
人工智能 前端开发 Java
AI大模型进阶系列(03) prompt 工程指南 | 实战核心技术有哪些?
本文深入讲解了AI大模型中的prompt工程。文章分析了role角色(system、user、assistant)的意义,message多轮会话记忆机制,以及prompt的核心三要素(上下文背景、输入内容、输出指示)。同时介绍了多种提示优化技术,如少样本提示、CoT链式思考、prompt chaining链式提示、思维树ToT提示等,还展示了让AI生成提示词的方法,为实际应用提供了全面指导。

热门文章

最新文章