本文来自AI新媒体量子位(QbitAI)
你能听出几种鸟叫的声音?
在Google最新公布的一个实验里,三位研究者使用机器学习,把上千种鸟叫的声音,整合成一张可视化的互动图。鸟类的叫声很难学习,因为各种叫声都很有不同的特色,同时很多叫声听起来非常相似。
想体验这个可视化的鸟类叫声图,可以用过如下地址:
https://aiexperiments.withgoogle.com/bird-sounds/view/
为了将机器学习用于追踪鸟类的叫声,研究者做了一个小测试。基于康奈尔大学的鸟叫数据,在不给定电脑任何额外信息和标签,甚至不告知鸟类名称的情况下,看看电脑是否能学会组织这些叫声。
为了组织鸟叫,需要把鸟类叫声切成很小的片段,然后使用一种叫做t-SNE的机器学习算法,把这些片段组织在一起。首先电脑建立了一系列的声纹,然后t-SNE比较所有的声纹,并把类似的声音排布在一起。t-SNE的作用就是把这些声纹,从一个超过三个的高纬度的空间降到二维,以便进行后续的可视化。
关于t-SNE算法,可以参考这一页面:
https://github.com/lvdmaaten/bhtsne
最终,Google使用电脑创建了一个鸟类叫声的地图,机器学习算法把类似的叫声相邻排布,另外还支持搜索特定鸟类的叫声。未来研究者寄望于将这一研究推广到更多的领域。
Hacker News上有人评价说这是一个惊人的实验:可以通过声音监控生物多样性。未来通过一个全向麦克风矩阵,就能用来“捕捉”动物存在的证据,甚至发现全新的物种。
这一实验项目的代码公布在这里:
https://github.com/googlecreativelab/aiexperiments-bird-sounds
【完】
本文作者:问耕
原文发布时间:2017-06-18