背景
前文:
你听过AI歌手吗?近日,“AI孙燕姿”火遍全网,AI孙燕姿翻唱林俊杰的《她说》、周董的《爱在西元前》、赵雷的《成都》等等歌曲让网友听了直呼:“听了一晚上,出不去了。”
就在这个五月份,有位“虚拟歌手”在网上火了起来,由于它本身是AI,还有着与孙燕姿完全相同的音色,故被称为“AI孙燕姿”,但是随着发展的进程,“虚拟歌手”不单单只是‘孙燕姿’了,我们熟悉的周杰伦、林俊杰、梁静茹、张信哲等流行歌手都在目前的AI技术之下,成为另一种新而又熟悉的歌手发,歌曲从原唱到各种小众民谣都有涉及,覆盖范围极其广泛。
AI虚拟歌手如此惊人的模仿能力,让很多的人都不禁赞叹,想试一试用自己的声音加入ai的元素变成拥有自己声音的虚拟歌手也不是不可能的。其实AI的技术应用我们之前就有见识过,比如某某任务的声线做的地图导航语音,就是用该声音去训练AI,使其完全掌握,然后替换掉原来的声音模型,便能达到以假乱真的效果。
就更最近比较火爆的ChatGPT横空出世一样,受到了很多人的关注,这就是新型AI产业模型的大比拼;
ChatGPT的发布持续点燃大众对于AI的热情。后来OpenAI又发布了大模型GPT-4。OpenAI将GPT-4直接升级ChatGPT识图能力、文字限制提升2.5万字、回答专业性、准确性以及风格变化能力。对比过去的模型,GPT-4最大的突破之一是模型的多模态能力。
面对AI大模型的热战,中国巨头正投入大量人力和资金加入了这场“技术赛跑”; 中国互联网科技厂商纷纷入局AI大模型赛道,厂商采用“模型+平台+生态”三层共建模式推动大模型的发展;
其实国外在很早的时候就开始进行一个AI的训练了,国内目前也在加紧操作一波,在目前的大趋势之下,谁要是抓住了机遇谁就是大赢家~
一、什么是AI音乐?它可以做什么?
AI音乐,简单理解就是人工智能创作音乐;AI 音乐创作领域可以做包括词曲写作、伴奏生成、歌声合成等。
1、曲谱生成,包括词曲和伴奏编曲的生成;
2、演奏生成,曲谱到声音需要经过演奏的过程,相同的曲谱经过不同的演奏技巧演奏可以有非常大的差别,所以我们要基于曲谱生成演奏技巧;
3、声音合成,根据曲谱和演奏技巧合成音乐声音,包括人声和乐器声音的合成。
二、AI歌手的音乐听起来是如何的?
根据我个人来看的话,单单从声音的层面来说,已经很还原了,但是如果作为该歌手的一名粉丝或者已经听习惯TA声音的人来说的话,从感情的方面来听,就是很单调,所流露出来的情感并没有像人一样那么的贴切,而且仔细听就容易分辨出来,要像真正实现到逼真的效果,还是需要其他方面的训练,不能单单是声音上的还原。
三、这种新型演艺模式能否获得广泛的市场认可?原因是什么?
我认为其中是有争议的。首先,演艺产业是基础性文化产业,在文化市场中占据重要地位;其次,“AI歌手”本质上需要以现实歌手为蓝本,这是权利之争的起点
。比如“AI孙燕姿”的火爆,需要现实音乐界提前存在一位已经成名且有众多代表作的歌手孙燕姿。因为“AI歌手”是在AI技术“音色转换”加持下生成的,如果要想真正还原歌手就需要提前收集歌手的音视频素材,然后经过一系列复杂的手续之后训练得出的。这些火爆的“AI歌手”就该意识到到这个问题,AI歌手”和明星二者如果没有进行正式‘
协商’,那么两者的矛盾就会一直存在。
具体而言,“AI歌手”主要涉及两方面的法律问题:一是声音权。声音和肖像一样,也有人身属性。
但是目前而言,对于一些厂商来说,ai模仿翻唱以及各种的应用,其中的成本会小得很多,而且现在又是ai技术发展的大潮流,所引起的矛盾却是不可避免的。
四、你所了解到的这类AI应用还有哪些呢?可以分享一下。
1.OpenAI GPT4
自然语言处理领域。GPT-4是一个基于深度学习的语言模型,它可以用来生成文章、回答问题、进行翻译等。例如,一些新闻机构开始使用GPT-4来撰写新闻稿件,例如The Guardian报道了一篇由GPT-4生成的新闻稿件,是目前来说影响力较大的一款ai应用了。
2.AI人脸识别系统
AI人脸识别系统主要是基于深度学习人脸识别算法,集合运动跟踪、人脸检测、人脸识别、大规模人脸检索等技术于一体,运用大数据平台,实现实时视频或离线视频的动态人脸识别、分析和处理。对嫌疑犯的抓捕,正是基于人脸识别在“天网”系统中的运用。
3.AI人脸识别助力司机安全驾驶
通过在车辆上安装AI智能摄像头,运用人脸识别、动作识别、视频图像分析等AI技术,建立对司机面部神态、动作的多维把控与主动提醒,
实现针对驾驶员抽烟、打电话、疲劳驾驶、分心等危险驾驶行为的智能监测和预警提醒,为驾驶安全保驾护航。