前沿科技 | 与人共鸣,让AI发声

简介: 编者按:声音是塑造一个有血有肉人物的关键,声音和视觉之间的不一致会破坏用户身临其境的体验。但以目前技术发展来看,声音质量还不能实时与视觉质量相匹配。尽管如此,许多科技公司和平台开发者努力提供可用的最新解决方案,使虚拟形象能够在展示场景中实时按需生成自然且有人类情感的声音。 本文约2036字,建议阅读时间6分钟。


导语

2013年,一部科幻电影《Her》讲述了,宅男作家西奥多(Theodore)爱上了人工智能系统萨曼莎(Samantha)那略微沙哑的性感嗓音的故事。


,时长02:30


受这部电影启发,一家AI语音初创公司Sonantic创造出了一种合成声音,可以表达微妙的情感。


AI可以学到什么?

Sonantic的目标关键在于将非语音声音融入到音频中,训练AI模型重现那些微弱的呼吸声、嘲笑和半掩的笑声等等。这些声音和人类生物学特征相吻合,可以呈现出一场真实的演讲。


Sonantic的联合创始人和首席技术官John Flynn表示,我们以作为主题,就是为了是看看AI是否能够模拟微妙的情绪


先看个视频,感受一下。


,时长01:54

在第一次听的时候,大多数人都会认为这个声音和真人的声音几乎没什么区别。当你听到人工智能说,“I think I, I think I love you, I love you”时,就会有一种舒适感。视频中,她的呼吸声,笑声都让人不得不相信这就是真人发出的声音。



Sonantic的首席执行官Zeena Qureshi将公司的软件描述为“声音的 Photoshop”。这一软件的界面允许用户输入他们想要合成的语音,指定传递的情绪,然后从一组人工智能声音(其中大部分是从真人演员那里复制的)中选择。



情绪的选择包括愤怒、恐惧、悲伤、快乐和喜悦,以及刚刚更新的调情、害羞、取笑和吹嘘。“导演模式”(director mode)能够进行更多的调整,包括声音的音调,传达的强度,还有那些微弱的非语音发声,比如笑声和呼吸声。



有网友表示,“这个声音听起来也太真实了吧!”“我现在终于可以创造我自己的Her。”



首先,为了让AI的声音更加逼真,必须要有人工润色这一步。在很多人工智能的领域都是这样,比如无人驾驶。无人驾驶已经基本上实现了自动驾驶,但是还有最后非常重要的5%的部分需要人工参与。


这就说明完全自主、完全合格的AI语音合成还有很长的一段路要走。另外,心理学上有个词叫“启动效应”,它能做到欺骗你的感官。



这段演示版的视频,展示了一个真人演员在镜头前局促不安的片段。这个片段会激发你的大脑,让你觉得同时播放的声音也是真人声音。这说明,最好的合成音频,就是“半真半假”。有的输出是真实的,有的是AI合成的。


灵感源头《Her》

除去AI音频逼真到什么程度的问题,Sonantic放出的音频还暴露了其它一些问题。比如,创建一个会调情的AI需不需要遵守什么道德规范?用AI的声音欺骗听者是否公平?Sonantic又为什么选择女性的声音来制作调情音频?


实际上这个问题说明,在当今男性主导的科技行业,这种选择暗含了一种微弱的性别歧视。一般都会把这种AI助理设置成顺从、甚至有些轻浮的秘书形象。



关于这个问题,该公司表示,“我们之所以选择女性的声音,只是因为我们这个点子是受Spike Johze在2013年电影Her所启发的。这部电影的主角就爱上了一个女性AI助理,名叫Samantha。”


在第二个问题上,Sonantic表示,“公司清楚这项技术的发展可能会带来哪些道德上的难处。所以公司在如何使用和哪里使用AI音频的问题上非常小心。”该公司的CEOQureshi表示,“正是因为这些原因,我们目前只把这项技术应用在娱乐方面。不能什么地方都用CGI,目前只是为了提供最好的娱乐体验和模拟效果才用。我们也同意这项技术会遇到这样或那样的问题。”



她还补充说,该公司展示的所有视频都说明了其中的声音是合成的,不是真人的声音。但这并不代表不会有人为了欺骗,而用这款软件去生成一些音频。这项技术其实和一些别的娱乐产品有一些共同点。毕竟电影和电视剧的创作也是用一些不真实的东西来吊住观众的胃口。但有一点区别是,AI技术可以大规模的扩散,人们往往会忽视对每个个体的具体影响。


打个比方,从全世界来看,人们早已开始和AI聊天机器人构建各种关系,甚至还有爱上AI聊天机器人的情况。如果能给这些聊天机器人加上用AI生成的音效,无疑会让原有的功能更加强大。



结语

科技向前,智能助力变革,该如何设计、操作并使用这类系统,将是未来科技公司或平台需要思考的重要问题。毕竟,AI的声音已经可以和人类产生共鸣了,谁知道下一步它们还能做出什么呢?


内容来源:新智元

编辑:阿里云研究院市场活动主管 马骏驰


阿里云研究院

阿里云研究院定位是阿里云智能事业群数智化转型智库机构,汇集多名来自数字科技头部企业、国际知名咨询机构和国家高端研究平台的资深专家,以“定义行业、洞察态势、拓展赛道、引领心智”为愿景,以“著书立说布道场,数智驱动新增长”为使命,以“引领数智化转型新思想”为目标,致力于“用科技探索新商业边界”。


研究领域涵盖云计算、人工智能、大数据与产业互联网,以及数字政府、新零售、新制造、新金融、新能源等政企各行各业数智化转型路径及商业实践,关注前沿科技趋势、数字创新、数字治理、新基建等方向。依托指数分析、战略顶层设计、行业数智洞察、产业研判、案例透视等多类型研究产品,阿里云研究院联合国家科研机构、顶尖智库、头部高校、行业协会、咨询机构、投资机构、合作伙伴和客户,拉通阿里巴巴集团各事业群,共拓研究新生态。与全球知名商学院共同开设数智创新学院、新国潮品牌加速器、新增长实验室等项目,举办高端企业家和高管培训,培育面向未来的数智化创新领袖。


同时面向各行各业企业CXO人群及企业数智化实战人才,打造“CXO数智创新营”,构建一个走进阿里巴巴,了解阿里战略、文化与业务生态,共创数智化转型路径与实践的链接服务,是国内领先的数智化转型升级服务平台。

相关文章
|
7月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
7月前
|
人工智能 算法 数据安全/隐私保护
拔俗AI多模态心理风险预警系统:用科技守护心理健康的第一道防线
AI多模态心理风险预警系统通过语音、文本、表情与行为数据,智能识别抑郁、焦虑等心理风险,实现早期干预。融合多源信息,提升准确率,广泛应用于校园、企业,助力心理健康服务从“被动响应”转向“主动预防”,为心灵筑起智能防线。(238字)
803 0
|
存储 人工智能 监控
星云智控科技-优雅草星云物联网AI智控系统软件产品技术栈一览表-优雅草卓伊凡
星云智控科技-优雅草星云物联网AI智控系统软件产品技术栈一览表-优雅草卓伊凡
382 7
星云智控科技-优雅草星云物联网AI智控系统软件产品技术栈一览表-优雅草卓伊凡
|
11月前
|
机器学习/深度学习 人工智能 算法
ai赋能科技
本内容探讨了AI技术在教育领域的深度应用,涵盖教学设计、课堂互动、科研赋能、教学管理和伦理实践五大方面。从智能备课到动态学情分析,从跨学科创新到自动化评估,展示了AI如何优化教育全流程。同时强调数据安全与算法公平性,确保技术发展不偏离教育本质。最后指出,在AGI时代,学习AI大模型不仅是为了适应技术浪潮,更是为了填补400万人才缺口,成为高薪“AI+”岗位的抢手人才。教育的目标已转变为培养驾驭AI的思考者,而不仅仅局限于竞争者角色。
274 1
|
12月前
|
人工智能 定位技术
挑战杯丨2025年度中国青年科技创新“揭榜挂帅”擂台赛阿里云榜题发布!用AI助力乡村振兴丨云工开物
第十九届“挑战杯”竞赛2025年度中国青年科技创新“揭榜挂帅”擂台赛,由阿里巴巴公益、阿里云等主办。赛事以AI技术助力乡村振兴为主题,鼓励高校师生设计长虹乡特色文创产品、农特产品包装等。作品需紧扣开化特色。评选标准涵盖创意、文化呈现和技术应用等方面。比赛设擂主奖及多项奖项。报名截止至2025年6月30日,作品提交截止至8月15日。
|
机器学习/深度学习 人工智能 自然语言处理
科技巨头加倍押注生成式 AI
谷歌母公司 Alphabet 计划 2023 年投入约 750 亿美元用于资本支出,主要用于数据中心扩建、芯片与服务器采购,支持核心业务及 AI 服务发展。CEO 皮查伊强调,此举将提升搜索等领域的竞争力,并推动 Gemini 等生成式 AI 模型进步。尽管经济形势不明朗,谷歌仍对 AI 领域充满信心,认为其投资将惠及消费者与企业客户。同时,微软与 Meta 等巨头也在加大 AI 基础设施投入,竞争激烈。普通人可从学习 AI 技能、结合自身领域、利用工具提效等方面抓住 AI 时代的机遇。相关学习资源包括《跟老卫学 AI 大模型开发》教程及 HarmonyOS NEXT+AI 课程。
271 1
科技巨头加倍押注生成式 AI
|
存储 人工智能 缓存
AI变革药物研发:深势科技的云原生实践之路
阿里云助力深势科技推出创新的玻尔Bohrium®科研云平台和Hermite®药物计算设计平台,并持续完善。这两项先进的工业设计与仿真基础设施成果通过AI技术赋能科学研究和工业研发,不仅大幅缩短了药物研发周期,降低了成本,还显著提高了研发成功率,为生物医药行业带来了前所未有的变革,这是AI for Science领域的重大突破。
842 38
|
机器学习/深度学习 人工智能 算法
从春招“AI热潮”看科技变革中的就业新趋势
随着2025年春招市场的火热,人工智能(AI)相关岗位成为求职焦点。AI技术的快速发展不仅催生了大量新兴职业,还推动了就业市场的转型。从传统岗位的自动化替代到新职业的涌现,AI正深刻改变着职业结构与就业形态。面对这一变革,求职者需主动学习AI技能、培养跨界能力并关注新兴领域。生成式人工智能认证(GAI认证)更成为提升竞争力的关键。同时,企业应加大AI技术研发投入,构建人才生态,推动技术与业务深度融合,共同开创人机协作的新未来。
|
人工智能
中国AI崛起与生成式人工智能(GAI)认证:驱动全球科技变革的人才战略
本文探讨了中国在人工智能(AI)领域的崛起及其对全球科技和经济的影响。文章回顾了中国AI研究的发展历程,从引进吸收到自主创新,政府政策支持与企业投入推动了AI技术的突破与广泛应用。同时,生成式人工智能(GAI)认证的重要性被强调,其为AI人才培养提供了专业标准,助力行业规范化发展。未来,中国将继续深化AI研究,加强国际交流,通过技能认证项目如GAI认证,为AI领域培养更多高素质人才,推动全球AI技术的繁荣发展。
|
机器学习/深度学习 人工智能 自然语言处理
TsingtaoAI亮相2025青岛西海岸科技成果对接会,以具身智能实训赋能AI人才培养
3月26日青岛——由青岛市科学技术局指导、青岛西海岸新区管委联合上海技术交易所等多家机构主办的“2025青岛西海岸新区科技成果对接会”在青岛金沙滩蓝海御华酒店盛大启幕。青岛市委常委,西海岸新区工委书记、区委书记孙永红,青岛市科学技术局副局长张栋华和上海技术交易所总裁颜明峰等参加会议并致辞。TsingtaoAI受邀参会并发表主题分享,公司负责人汶生以《基于DeepSeek的具身智能实训》为题,向与会嘉宾展示了AI具身智能技术如何突破传统边界,助力AI人才从实验室走向产业一线。
362 1