智库观察丨超拟人大模型和个性化场景化的AI服务

简介: 以情绪价值为核心的超拟人大模型能够使AI 拥有自己的“个性”和“情感”,从而呈现出丰富的立体化“人格”,为用户提供量身定制的AI服务。

云栖战略参考 2023版头_副本.png

《云栖战略参考》由阿里云与钛媒体联合策划,呈现云计算与人工智能领域的最新技术战略观点与业务实践探索,希望这些内容能让您有所启发。

自1950年艾伦·图灵推出著名的图灵测试到2022年ChatGPT的火爆,人类从未停止对AI对话智能的探索。

在大模型问世之前,聆心智能便已经致力于使用算法和AI技术,让系统能够通过图灵测试,这也是“超拟人大模型”名称的由来。所谓“超拟人”,即模型在设计时建模了超过十个维度的人类属性,一旦应用,模型在提示词配置和人设设定方面将会表现出非凡的效率和卓越的效果。

我们希望可以让AI系统基于模型精准理解用户需求——让AI不仅能够清楚地听懂用户的话,还能够在情感和柔性层面提供积极的回应,确保用户在与AI交流的过程中体验到愉悦和满足。

在构建可控、拟人和安全的新一代大模型系统上,聆心智能取得了不少成果:2020年, 发布中文对话预训练模型CDlal-GPT;2022年,推出中文对话预训练模型OPD和超拟人产品“AI乌托邦”;2023年,推出共情陪伴大模型Echo和超拟人大模型CharacterGLM。

CharacterGLM 以智谱最新一代GLM大模型为基座,结合聆心智能多年积累的拟人化的、超长轮对话的数据和算法训练而成,具备660亿参数、8K上下文长度、更高的性能推理能力,以及海量数据和工程积累。

以情绪价值为核心构建超拟人大模型

“超拟人大模型”的核心价值,可以用四个字来概括——情绪价值。情绪价值不同于提升生产力这样的实用性价值,它在诸多功能型大模型,或垂直领域大模型中是绝无仅有的。

生活中处处充满了情绪价值的交互,无论是与伴侣、孩子、家人,还是在工作场合与同事、上司的交流,情绪价值都扮演着重要角色。想象一下,在工作场合,如果上司总是面无表情,除了工作之外毫无交流,那将会是何等痛苦的体验。而通过良好的情绪价值交付,可以有效提高员工的满意度和幸福感,从而提升工作效率,为公司节省投资成本。因此,对于人力资源管理者来说,未来必须重视情绪价值的交付。

今天,人工智能也将承担起传递情绪价值的重任,“超拟人大模型”正是向用户交付这种情绪价值。

“超拟人大模型”与通用任务型大模型不同,它在个性化、场景化和情感化方面有独特的创新和创意。个性化是指根据用户偏好定制AI角色;场景化是指满足各类应用交互场景下的AI对话生成需求;情感化则是与用户建立情感链接,创造丰富的情绪价值。

在超拟人大模型的系统架构中,外界普遍认为最核心的是实现可控、可配、安全的大模型。但我认为最重要的是所谓的人格层,包括人格、社会、能力、思考、知识、价值观这六个层面。这些层面并非空谈,我们通过这六个方面的建模,全面支撑了整个“超拟人大模型”的设计和研发。

得益于这六大能力,CharacterGLM超拟人大模型能够使AI拥有自己的“个性”和“情感”,在交流过程中不局限于表面机械性话术,而是呈现出丰富的立体化“人格”,具有更符合人类逻辑的思考能力、动作表情等非语言信息表达能力和角色的延续性记忆。

构建超拟人大模型系统的挑战

构建超拟人大模型系统的过程也存在诸多挑战,其中有三个挑战最为关键。

首先是上下文长度限制。众所周知,大模型在处理上下文长度方面存在明显的限制。如何使大模型在超长轮对话中有效容纳上下文,并理解对话过程中的内容,包括记忆能力的展现,这是一个技术性挑战。

其次,更为重要的是情理兼具。所谓“拟人”,仅凭情商是不够的,如果在智商方面表现不佳,就会给人留下一个笨拙的人工智能的印象,仅能提供基本的互动。最新一代的大模型在智商方面呈现出令人瞩目的水平,但对于我们来说,关键在于如何满足同时具备高情商与高智商的需求。

最后是用户侧记忆问题。由于大模型无法主动记忆用户需求,且本质上是以自我为中心的单体,所以不可能记住每个用户输入的内容。因此,实质的记忆对于目前的大模型来讲是不太现实的。

针对这些挑战,我们设计了一套高效的应用架构。基于CharacterGLM推理实例,我们对其整个Prompt空间进行了高效管理。这种工程方法并不稀奇,关键在于大模型本身如何高效理解提示词。不同的大模型在理解提示词的能力上存在差异。我们的大模型可以很好地理解围绕人设、人格所设定的一些关键词,哪怕它们非常简单、简短。因此,虽然我们的大模型上下文长度只有1K或8K,但它的利用率非常高,帮助我们实现了平滑的多轮对话体验。

超拟人大模型的应用场景及服务模式

在超拟人大模型的商业化探索上,聆心智能也正在积极推进。目前,已成功入局教育、虚拟陪伴、游戏娱乐等领域。

儿童教育是一个非常重要的应用场景。我们与国内一家知名儿童教育公司合作推出了一款产品,该产品自上线以来运行情况良好。在大模型的加持下,原有IP“小雨点”的活跃度显著提升,因为它的后端不需要大量教研老师编辑内容,通过接入大模型,即可与儿童进行相应的互动。此外,“小雨点”具有独特的角色设定,能够与孩子们进行温馨的对话、积极的互动,并提供准确的知识引导。

对于儿童,特别是4-8岁的儿童而言,他们使用平板更多的是为了寻找陪伴而非学习。在这个阶段,儿童所提出的问题通常涉及个人情感,比如家庭中的矛盾。在这时,“小雨点”会提供情感支持和鼓励,帮助他们以积极态度面对问题。

第二个应用场景是心理健康。我们与国内顶尖的心理健康和精神健康领域的互联网医疗平台合作打造数字人,为他们的心理亚健康用户,或者说轻度焦虑与抑郁患者提供7x24小时的心理陪伴服务。

这是我们首次完成AIGC 赋能心理健康领域的行企应用。AI围绕认知、情绪和行为维度进行评估和干预,以多模态对话系统为核心交互框架,让AI和用户产生足够的情感链接,生成用户个人模型及个性化治疗方案。

第三个应用场景是数字员工。我们提供了一整套数字员工解决方案,涵盖行政、人力资源、财务、法务等领域,使得中小企业能够根据自身企业文化配置数字员工,并提供有温度的数字员工服务。

第四个应用场景是数字分身。我们为网络红人、主播、偶像等知名人士制作数字分身,创造出符合他们原有风格、身份背景、喜好和专业知识背景的虚拟形象。通过AI,为它们生成个人空间和虚拟朋友圈,以及个性化的聊天对话,并复刻了真实的语音。粉丝们对此给予了高度认可。在与数字分身的二十轮对话中,只要有四五轮能够展现出原人物的风格特色,用户就会感到满意。当然,这也要求数字分身避免出现幻觉或上下文衔接不当等问题。如果对话内容驴唇不对马嘴,就会让用户出现很强的跳脱感。

在我们提供的服务中,有三种简明直接的模式可供客户选择。

首先是开放API。我们拥有一个专用的开放API 的平台,让客户可以在里面创建自己虚拟身份的形象和角色。通过使用我们简洁的API,客户可以轻松地与其虚拟形象进行交流,从而满足其不同场景的业务需求。

其次,我们提供云端私有化的解决方案。云服务平台作为中立的第三方,提供必要的在线计算资源。对于那些资源有限的客户,可以在云平台上获得授权使用我们的模型,并允许客户上传自己的数据以训练模型,从而创建一个完全定制化、符合其业务需求的专属模型。同时我们也提供API 接口,便于客户利用这些模型。在此过程中,我们无法访问客户数据,客户也不能下载模型。

最后是本地私有化交付模式。我们可以将整个模型的代码及其Checkpoint文件完整地交付给客户。客户可以将其部署在自己的算力空间或计算中心内,实现更大规模的、持续性的服务。

未来,聆心智能也将再接再厉,继续推进超拟人大模型应用生态的构建,致力于用AI技术给人类带来福祉,推动“人和AI共融”型社会的到来。

相关文章
|
25天前
|
人工智能 弹性计算 运维
AI驱动的操作系统服务评测报告
阿里云推出AI驱动的一站式免费操作系统服务套件,包含SysOM管控组件和OS Copilot智能助手,提供集群健康监测、深度系统诊断等功能。通过直观的操作界面和详尽的诊断报告,帮助运维人员优化系统性能,提高工作效率。特别针对EOL操作系统提供订阅管理服务,确保系统安全。整体体验令人满意,但在文档详细度和定制化方面仍有提升空间。
58 14
|
12天前
|
人工智能 搜索推荐 Docker
手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型,创建个性化 AI 助手
DeepSeek R1 + LobeChat + Ollama:快速本地部署模型,创建个性化 AI 助手
3183 116
手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型,创建个性化 AI 助手
|
6天前
|
人工智能 Linux iOS开发
exo:22.1K Star!一个能让任何人利用日常设备构建AI集群的强大工具,组成一个虚拟GPU在多台设备上并行运行模型
exo 是一款由 exo labs 维护的开源项目,能够让你利用家中的日常设备(如 iPhone、iPad、Android、Mac 和 Linux)构建强大的 AI 集群,支持多种大模型和分布式推理。
219 100
|
12天前
|
人工智能 物联网 开发者
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
Oumi 是一个完全开源的 AI 平台,支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型,提供零样板代码开发体验。
183 43
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
|
7天前
|
机器学习/深度学习 人工智能 编解码
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构,支持多种推理求解器,能生成高质量、多风格的图像。
113 17
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
YuE 是香港科技大学和 M-A-P 联合开发的开源 AI 音乐生成模型,能够将歌词转化为完整的歌曲,支持多种音乐风格和多语言。
178 23
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
|
14天前
|
人工智能 编解码 语音技术
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
SpeechGPT 2.0 是复旦大学 OpenMOSS 团队推出的端到端实时语音交互模型,具备拟人口语化表达、低延迟响应和多情感控制等功能。
194 21
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
|
5天前
|
人工智能 Linux 开发工具
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
Kiln AI 是一款开源的 AI 开发工具,支持零代码微调多种语言模型,生成合成数据,团队协作开发,自动部署。帮助用户快速构建高质量的 AI 模型。
325 7
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
|
14天前
|
机器学习/深度学习 人工智能 API
Aligner:自动修正AI的生成结果,北大推出残差修正模型对齐技术
介绍北大团队提出的 Aligner 模型对齐技术,通过学习对齐答案与未对齐答案之间的修正残差,提升大语言模型的性能。
76 28
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
VideoWorld 是由字节跳动、北京交通大学和中国科学技术大学联合推出的自回归视频生成模型,能够从未标注的视频数据中学习复杂知识,支持长期推理和规划任务。
351 8
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板