前沿科技 | 与人共鸣,让AI发声

简介: 编者按:声音是塑造一个有血有肉人物的关键,声音和视觉之间的不一致会破坏用户身临其境的体验。但以目前技术发展来看,声音质量还不能实时与视觉质量相匹配。尽管如此,许多科技公司和平台开发者努力提供可用的最新解决方案,使虚拟形象能够在展示场景中实时按需生成自然且有人类情感的声音。 本文约2036字,建议阅读时间6分钟。


导语

2013年,一部科幻电影《Her》讲述了,宅男作家西奥多(Theodore)爱上了人工智能系统萨曼莎(Samantha)那略微沙哑的性感嗓音的故事。


,时长02:30


受这部电影启发,一家AI语音初创公司Sonantic创造出了一种合成声音,可以表达微妙的情感。


AI可以学到什么?

Sonantic的目标关键在于将非语音声音融入到音频中,训练AI模型重现那些微弱的呼吸声、嘲笑和半掩的笑声等等。这些声音和人类生物学特征相吻合,可以呈现出一场真实的演讲。


Sonantic的联合创始人和首席技术官John Flynn表示,我们以作为主题,就是为了是看看AI是否能够模拟微妙的情绪


先看个视频,感受一下。


,时长01:54

在第一次听的时候,大多数人都会认为这个声音和真人的声音几乎没什么区别。当你听到人工智能说,“I think I, I think I love you, I love you”时,就会有一种舒适感。视频中,她的呼吸声,笑声都让人不得不相信这就是真人发出的声音。



Sonantic的首席执行官Zeena Qureshi将公司的软件描述为“声音的 Photoshop”。这一软件的界面允许用户输入他们想要合成的语音,指定传递的情绪,然后从一组人工智能声音(其中大部分是从真人演员那里复制的)中选择。



情绪的选择包括愤怒、恐惧、悲伤、快乐和喜悦,以及刚刚更新的调情、害羞、取笑和吹嘘。“导演模式”(director mode)能够进行更多的调整,包括声音的音调,传达的强度,还有那些微弱的非语音发声,比如笑声和呼吸声。



有网友表示,“这个声音听起来也太真实了吧!”“我现在终于可以创造我自己的Her。”



首先,为了让AI的声音更加逼真,必须要有人工润色这一步。在很多人工智能的领域都是这样,比如无人驾驶。无人驾驶已经基本上实现了自动驾驶,但是还有最后非常重要的5%的部分需要人工参与。


这就说明完全自主、完全合格的AI语音合成还有很长的一段路要走。另外,心理学上有个词叫“启动效应”,它能做到欺骗你的感官。



这段演示版的视频,展示了一个真人演员在镜头前局促不安的片段。这个片段会激发你的大脑,让你觉得同时播放的声音也是真人声音。这说明,最好的合成音频,就是“半真半假”。有的输出是真实的,有的是AI合成的。


灵感源头《Her》

除去AI音频逼真到什么程度的问题,Sonantic放出的音频还暴露了其它一些问题。比如,创建一个会调情的AI需不需要遵守什么道德规范?用AI的声音欺骗听者是否公平?Sonantic又为什么选择女性的声音来制作调情音频?


实际上这个问题说明,在当今男性主导的科技行业,这种选择暗含了一种微弱的性别歧视。一般都会把这种AI助理设置成顺从、甚至有些轻浮的秘书形象。



关于这个问题,该公司表示,“我们之所以选择女性的声音,只是因为我们这个点子是受Spike Johze在2013年电影Her所启发的。这部电影的主角就爱上了一个女性AI助理,名叫Samantha。”


在第二个问题上,Sonantic表示,“公司清楚这项技术的发展可能会带来哪些道德上的难处。所以公司在如何使用和哪里使用AI音频的问题上非常小心。”该公司的CEOQureshi表示,“正是因为这些原因,我们目前只把这项技术应用在娱乐方面。不能什么地方都用CGI,目前只是为了提供最好的娱乐体验和模拟效果才用。我们也同意这项技术会遇到这样或那样的问题。”



她还补充说,该公司展示的所有视频都说明了其中的声音是合成的,不是真人的声音。但这并不代表不会有人为了欺骗,而用这款软件去生成一些音频。这项技术其实和一些别的娱乐产品有一些共同点。毕竟电影和电视剧的创作也是用一些不真实的东西来吊住观众的胃口。但有一点区别是,AI技术可以大规模的扩散,人们往往会忽视对每个个体的具体影响。


打个比方,从全世界来看,人们早已开始和AI聊天机器人构建各种关系,甚至还有爱上AI聊天机器人的情况。如果能给这些聊天机器人加上用AI生成的音效,无疑会让原有的功能更加强大。



结语

科技向前,智能助力变革,该如何设计、操作并使用这类系统,将是未来科技公司或平台需要思考的重要问题。毕竟,AI的声音已经可以和人类产生共鸣了,谁知道下一步它们还能做出什么呢?


内容来源:新智元

编辑:阿里云研究院市场活动主管 马骏驰


阿里云研究院

阿里云研究院定位是阿里云智能事业群数智化转型智库机构,汇集多名来自数字科技头部企业、国际知名咨询机构和国家高端研究平台的资深专家,以“定义行业、洞察态势、拓展赛道、引领心智”为愿景,以“著书立说布道场,数智驱动新增长”为使命,以“引领数智化转型新思想”为目标,致力于“用科技探索新商业边界”。


研究领域涵盖云计算、人工智能、大数据与产业互联网,以及数字政府、新零售、新制造、新金融、新能源等政企各行各业数智化转型路径及商业实践,关注前沿科技趋势、数字创新、数字治理、新基建等方向。依托指数分析、战略顶层设计、行业数智洞察、产业研判、案例透视等多类型研究产品,阿里云研究院联合国家科研机构、顶尖智库、头部高校、行业协会、咨询机构、投资机构、合作伙伴和客户,拉通阿里巴巴集团各事业群,共拓研究新生态。与全球知名商学院共同开设数智创新学院、新国潮品牌加速器、新增长实验室等项目,举办高端企业家和高管培训,培育面向未来的数智化创新领袖。


同时面向各行各业企业CXO人群及企业数智化实战人才,打造“CXO数智创新营”,构建一个走进阿里巴巴,了解阿里战略、文化与业务生态,共创数智化转型路径与实践的链接服务,是国内领先的数智化转型升级服务平台。

相关文章
|
14天前
|
人工智能 前端开发 小程序
2024年12月30日蜻蜓蜻蜓AI工具系统v1.0.0发布-优雅草科技本产品前端源代码已对外开源可免费商用-优雅草老八
2024年12月30日蜻蜓蜻蜓AI工具系统v1.0.0发布-优雅草科技本产品前端源代码已对外开源可免费商用-优雅草老八
2024年12月30日蜻蜓蜻蜓AI工具系统v1.0.0发布-优雅草科技本产品前端源代码已对外开源可免费商用-优雅草老八
|
3月前
|
机器学习/深度学习 数据采集 人工智能
未来的守护神:AI驱动的网络安全之盾,如何用智慧的光芒驱散网络黑暗势力?揭秘高科技防御系统背后的惊天秘密!
【10月更文挑战第3天】随着网络技术的发展,网络安全问题日益严峻,传统防御手段已显不足。本文探讨了构建AI驱动的自适应网络安全防御系统的必要性及其关键环节:数据采集、行为分析、威胁识别、响应决策和执行。通过Python库(如scapy、scikit-learn和TensorFlow)的应用实例,展示了如何利用AI技术提升网络安全防护水平。这种系统能够实时监控、智能分析并自动化响应,显著提高防护效率与准确性,为数字世界提供更强大的安全保障。
75 2
|
1月前
|
人工智能 搜索推荐 安全
数百名研发人员用通义灵码,33%新增代码由AI生成,信也科技研发模式焕新升级
目前,信也科技数百名研发人员正在使用通义灵码,周活跃用户占比70%,新增代码中有33%由通义灵码编写,整体研发效率提升了11%,真正实现了数百研发人员开发效能的全面提升。
|
2月前
|
人工智能 Cloud Native 算法
|
2月前
|
人工智能 算法 新制造
走进北京科技大学,通义灵码与企业高校共筑 AI 创意课堂
近日,通义灵码有幸参与到一场由伊利集团主办的 AIGC 生态创新大赛路演舞台,与高校专家、企业代表、青年学子共同探讨 AIGC 创意应用,交流企业在数智领域转型、青年开发者科技创新的思路和落地实践。
|
3月前
|
人工智能 JSON API
利用TTS技术让你的AI Agent发声
【10月更文挑战第5天】
133 4
利用TTS技术让你的AI Agent发声
|
3月前
|
机器学习/深度学习 人工智能 监控
AI与未来医疗:重塑健康产业的双刃剑随着科技的迅猛发展,人工智能(AI)正以前所未有的速度融入各行各业,其中医疗领域作为关系到人类生命健康的重要行业,自然也成为AI应用的焦点之一。本文将探讨AI在未来医疗中的潜力与挑战,分析其对健康产业可能带来的革命性变化。
在医疗领域,人工智能不仅仅是一种技术革新,更是一场关乎生死存亡的革命。从诊断到治疗,从后台数据分析到前端临床应用,AI正在全方位地改变传统医疗模式。然而,任何技术的发展都有其两面性,AI也不例外。本文通过深入分析,揭示AI在医疗领域的巨大潜力及其潜在风险,帮助读者更好地理解这一前沿技术对未来健康产业的影响。
|
5月前
|
人工智能 运维 自然语言处理
从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)
【8月更文挑战第10天】从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)
从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)
|
5月前
|
机器学习/深度学习 数据采集 人工智能
未来的守护神:AI驱动的网络安全之盾,如何用智慧的光芒驱散网络黑暗势力?揭秘高科技防御系统背后的惊天秘密!
【8月更文挑战第13天】随着网络技术的发展,网络安全问题愈发严峻,传统防御手段已显乏力。本文探讨构建AI驱动的自适应网络安全防御系统,该系统能自动调整策略应对未知威胁。通过数据采集、行为分析、威胁识别及响应决策等环节,利用Python工具如Scapy、scikit-learn和TensorFlow实现网络流量监控、异常检测及自动化响应,从而提升网络安全防护的效率和准确性。随着AI技术的进步,未来的网络安全防御将更加智能和自动化。
72 6
|
5月前
|
人工智能 Serverless
AI 创作风潮起:函数计算探索科技与艺术的无限可能
AI 创作风潮起:函数计算探索科技与艺术的无限可能。

热门文章

最新文章