失独妈妈求助阿里:将逝去女儿做成AI,3个月后重现女儿声音

简介: 失独妈妈求助阿里:将逝去女儿做成AI,3个月后重现女儿声音

「爱人离世,你会把TA的记忆交给AI吗?」

《奇葩说》的这期辩题似乎在探讨一个离我们仍遥远的科幻话题,但去年9月,阿里巴巴人工智能实验室真的接到了这样一个请求。

请求帮助的是一位上海妈妈,她的女儿因患T淋巴母细胞性淋巴瘤离世,年仅14岁。

怀抱着太多孩子生前未能实现的遗憾,这位妈妈决定将女儿做成“AI”,用另一种方式缅怀她。去年9月,她尝试在微博向阿里巴巴人工智能实验室发出了这条消息。

“可以把我故去的女儿做成和我互动的软件吗?”

没想到,这条求助很快有了回应

三个月的时间让失独妈妈重新听见女儿

考虑许久,阿里巴巴人工智能实验室负责人、语音助手首席科学家聂再清接受了这位妈妈的求助。

单从技术角度考虑,在足够的语料数据和算法的加持下,通过目前的语音合成技术,“复制”一个虚拟人的难度并不大。

聂再清称,目前的技术条件下,通过个性化语音合成技术以及对话技术,需要大概十分钟的、特别干净的音频信号,就能够让我们的机器进行学习。

但对阿里人工智能团队而言,帮这位妈妈重现女儿的音容,面对的不只是技术难点。

首先,最大的技术问题是可用语料不足。要实现语音合成必须给算法提供大量可供训练的素材,但女儿生前留下的语音素材并不多,而且能提供的多是用智能手机录下的视频,大多环境嘈杂。据阿里团队称,所有的片段加在一起,能够用作训练的语音素材,只有短短的两三分钟。

这就让训练难度变得极大。因此,聂再清告诉求助者,凭借现有的技术很难达到她心中理想的效果,而这也就意味着,无论技术团队如何攻坚,AI终究不是“真实”的女儿。

其次,除了语音合成,聂再清团队也坦诚向她表达了对“AI女儿”认知上的担忧。当妈妈问出一个问题,“AI女儿”是否能够以女儿的认知水平和价值观来回答,在这方面,技术难度较大。

另外,市面现有的语音助手,例如siri和天猫精灵,当输入的语言超过AI的理解范围时,它的设定是去网络检索一个最接近的回答进行反馈,这就存在很大的不可控性。比如上个月,亚马逊的语音助手Alexa就因为从维基百科中提取到了一些恶意文本,劝主人“自杀”,对英国一位29岁的医生丹妮说出了“用尖刀刺入心脏”这样可怕的话。

为这位妈妈做出的“AI女儿”,也因此会存在回应的随机性,这很有可能在某些情况下冒犯到她和她的家人。

了解了可能面对的风险后,这位妈妈和她的丈夫还是坚持了最初的想法,她表示不在乎虚拟女儿偶尔的“冒犯”,这是成长期孩子最正常的表现。之后,他们配合技术团队列出了女儿生前感兴趣的话题,希望在这些话题下进行训练,确保在某种程度上,虚拟女儿的回答是可控的。

除了技术难点,阿里的工程师也就此与罗汉堂专家,以及外部的心理学家在技术之外的可能性上展开了探讨。三个月后,他们终于输出了一份小成果,帮助这位妈妈合成了一段女儿长达20秒的语音,存在了天猫精灵里。

这段语音复原了女儿写的一篇作文,记录了她和妈妈一起去爬山的故事。

尽管最终做出的音频样本与设想还有一些差距,但妈妈表示,音频开头的语气,和女儿几乎一模一样。

关于具体的研发过程、算法实现等,大数据文摘尝试采访阿里巴巴相关负责人。但阿里表示,现阶段仍不希望在过多的聚焦在技术细节上,他们也担忧在相关伦理探讨更清晰前,这一举动会被模仿

美国记者自学代码,让去世的父亲在手机中复活

想要用人工智能留住逝去的亲人,这位上海失独妈妈并不是第一例。

2016年,一位美国记者James Vlahos的父亲查出肺癌晚期,悲痛的他想要尽可能留住自己与父亲的记忆。

James突然冒出了一个疯狂的想法:与其将这些信息存在纸上,不如利用AI让它们活过来,他决定开发Dadbot——拥有父亲记忆的聊天机器人。

James首先说服了自己的家人与父亲本人,老爷子对此意外的没有任何抵触,同时还觉得很酷。于是James让父亲在生前最后几个月讲述其生平故事。

接下来他开始攻克技术难关,自学代码,利用AI公司Pull String的开源软件进行开发。其中包括140多个相关的问题词条,并用多达9万个词的语料库训练AI。

最终,赶在父亲离世前,他完成了一个为父亲量身定制的人工智能程序,当他和家人想父亲时,就打开这个程序聊几句,这给他和他的家人莫大安慰。

在James心中,这还差的很远,他要的不是智能的语音助手,而是那种与父亲交流时的熟悉感。但显然,9万字的生平记录也无法填充一个真实的灵魂,于是他不得不为父亲重新制作了一块更大的“记忆拼图”。

新的问题框架更为庞大详细,这些问题涵盖了父亲的父母,他的童年时光,学生时期,与母亲的甜蜜邂逅,职业的选择等。另外聊天机器人的训练极为枯燥,据James介绍,他只能频繁的与其交流,让Dadbot能够理解每句话的含义。同时要寻找BUG,很多词汇机器人并不理解,需要他手动调整。为此他经常拉着全家人和Dadbot聊天,全方位的“轰炸”这位AI老爸。

这段时期对于James来说也非常难熬。他不确定自己是否扭曲了对父亲的感情,也很犹豫Dadbot设定应该无限趋于真实的父亲,亦或是仅仅作为一个回忆道具。

Dadbot在成长的同时,父亲的生命也在流逝。好在功夫不负有心人,随着技术提升与不断的调整测试,Dadbot最终在父亲临终前拥有了一定的智能表现,聊天不再是一问一答的独白,更像是有思维的对话。

当前技术的迅速发展让这种“复制”技术的门槛迅速降低,也许很快,不止技术机构,很多非专业人员通过自学也能够完成。

去年热播日剧《轮到你了》中,男主角就通过大量的照片和聊天记录,复原了去世的女主,在手机里创造了一只“菜奈AI”。TA能够用女主的声音和语气与人对话,成为了男主案件调查过程中的最大安慰。受其启发,有不少网友也分享了如何通过风格迁移等方式,让机器模仿自己的话语,制作一个AI版自己。

日前,78岁的美国间谍小说家、好莱坞编剧安德鲁·卡普兰已同意成为“AndyBot”——一个数字人,他将在云上永生数百年,甚至数千年。如果一切按照计划进行,未来几代人将能够使用移动设备或智能语音计算平台与他互动,即使在他的肉身去世很久之后,仍能得到他一生经验的宝贵建议。

但是,这样的举动是否存在伦理问题和法律风险?其所属权如何定义?针对逝者的留存数据归谁所有的问题,文摘菌也咨询了相关专家,其表示“逝者虚拟化”仍然是一个非常新的技术领域,和目前法律界已有相对成熟共识的“克隆人”以及“AI人格”议题都不太一致,当前法律界还没有一个定论。

如果用AI“还原”已逝亲人正成为一种作用于失独家庭的新可能,那么需要首先确定的是,如何让它成为辅助疗愈的手段,而不是让失去亲人的人沉溺在被技术还原的陪伴中,影响真正意义上的康复。

在开头提到的《奇葩说》辩题中,六位辩手用了近两个小时的时间,去探讨“还原”已逝亲人是会治愈我们,还是会令我们跌入思念的深渊。当前技术条件下,尽管被“复活”的AI目前只能完成一些微弱的功能,距离科幻片中的场景还有很大距离,但依然值得更广泛的讨论。

和所有的技术一样,AI最终仍要作用于人。如何在智能和人性中实现平衡,是一道永恒的命题。

而面对这一问题,这位想要复活女儿的妈妈早已有了自己的判断。

“尽管技术的完善需要时间,但已经给人带来了希望,这是最重要的。


相关报道:

https://mp.weixin.qq.com/s/gY_KetYopg-FZZ8BXaUwvAhttps://www.cnblogs.com/SlashOut/p/10948998.htmlhttps://www.bilibili.com/video/av83723889/?redirectFrom=h5

相关文章
|
2月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1212 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
2月前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
1296 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
2月前
|
人工智能 数据处理 云栖大会
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
342 9
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
|
7月前
|
机器学习/深度学习 人工智能 编解码
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。
1399 9
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
|
4月前
|
人工智能 搜索推荐 API
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
|
3月前
|
机器学习/深度学习 数据采集 人工智能
阿里开源即封神,一上线就斩获4000+ star背后的真相,WebAgent多步骤智能网搜神器,颠覆你对AI的信息检索印象!
WebAgent 是阿里巴巴开源的多步骤智能网搜神器,包含 WebWalker、WebDancer、WebSailor 等模块,支持复杂推理与长上下文信息检索,GitHub 已获 4.7k star,颠覆传统 AI 搜索方式。
467 1
|
5月前
|
人工智能 IDE 程序员
阿里也出手了!灵码AI IDE问世
各位程序员小伙伴们,是不是还在为写代码头秃?别担心,阿里云带着它的通义灵码 AI IDE 来拯救你啦!
2451 3
|
5月前
|
人工智能 IDE 程序员
阿里也出手了!灵码AI IDE问世
各位程序员小伙伴们,是不是还在为写代码头秃?别担心,阿里云带着它的通义灵码 AI IDE 来拯救你啦! 相信不少小伙伴已经在VSCode、JetBrains IDE等主流开发工具中安装过通义灵码这款插件。 通义灵码插件全网总下载量超 1500 万,开发者采纳代码行数超 30 亿且每月增速 20%-30%。 今天我们要说的不是这款插件,而是阿里刚出的“为AI而生的灵码IDE”。
586 0
|
9月前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
121 0

热门文章

最新文章