几位 AI 工程师,开源了自己的泡妞项目

简介: 几位 AI 工程师,开源了自己的泡妞项目

如果你们还觉得工程师在撩妹上没有天赋的话,那你就大错特错了。

就在不久前 Facebook 的几个程序员最近也弄出一款音乐神器,可以把一首曲子,用 6 种不同的乐器演奏出来。然后 Google 的技术大拿们也不甘示弱,用 AI 搞出了一个音乐合成器正式加入专业撩妹俱乐部。


代码音乐家速成指南

大家都知道,通过 CNN 可以将图片进行风格重构,比如做点滤镜,让你的自拍照看起来像凡高的作品,业内也把这种卷积神经网络又叫神经网络迁移(Nural)。

受此启发,工程师们尝试把 CNN 运用到音乐上,希望搞点大事情,比如让 AI 像人类一样,用口哨来演奏音乐。

aaaa.png

小哥哥们认真 coding 的状态神似郎朗

实操上,大家也都知道 AI 不可能直接读取音符,所以首先必须将音符转换成机器能够识别的样式,然后通过 CNN 进行解码重构,再生成新的文件。

sssss.png

经过不断调试,他们已经可以将同一首曲子,用 6 种不同风格的乐器演奏出来,包括模仿人类吹口哨。


Google 小哥哥怎么搞 AI 音乐

FaceBook 小哥哥们鼓捣出的这套程序目前只能对音乐进行风格切换,听起来还不够浪漫,Google 的工程师随即放了撩妹大招:


「为妹子创造一个独一无二的声音。」

Magenta 是 Google 内部发起的一个与音乐结合的 AI 项目,专门探索如何将机器学习应用到音乐创作中。他们发布了 NSynth(神经合成器),这个项目是主要作者是 Yotam Mann ,他依靠深度神经网络来学习声音的特征,并根据这些特征生成一个前所未有的声音。


Yotam 认为之所以经典乐器会流行,就是因为无论是钢琴还是吉他,或是二胡,都有自己独特的音色和音域。而自己所写的 NSynth 并不是将声音简单的混合在一起,也不是重构音乐风格。

www.png

而是利用原始声音的声学特征来合成一种全新的声音,比如将笛子和琴声按比例进行搭配,创造出新的声音。


在 Yotam 建立的 NSythTH 算法中,先通过生成一个压缩的声音( 用 Z 表示 )。然后,解码器网络将其转换成回声,再对整个系统进行训练,使输出的声音尽可能更接近真实声音。

222.png

为了降低 NSynth 的使用门槛,Magenta 跟 Google Creative Lab 合作创建了 NSynth Super,这是一款开放源代码的音乐合成硬件产品。

111.png

通过预先载入的超 过10 万个声音,NSynth Super 通过算法就已经创造出很多声音,你可以通过拨号盘选择这些声音。当然,你也可以通过触摸屏创造新的声音。


目前,已经有不少专业的音乐制作人在使用这款产品。艺术创作需要灵感,这种全新的声音合成在可玩性、创意性上同样会给创造者提供一些不一样的启发。


如果你对 NSynth Super 源代码、原理图和设计模板等感兴趣,可以在 GitHub 找到 demo。

ghgg.png

qqq.png

这位眼神中透露着深情的小哥哥就是 Yotam Mann ,听说他几乎没有单身过。

相关文章
|
7天前
|
机器学习/深度学习 人工智能 算法
整合海量公共数据,谷歌开源AI统计学专家DataGemma
【10月更文挑战第28天】谷歌近期开源了DataGemma,一款AI统计学专家工具,旨在帮助用户轻松整合和利用海量公共数据。DataGemma不仅提供便捷的数据访问和处理功能,还具备强大的数据分析能力,支持描述性统计、回归分析和聚类分析等。其开源性质和广泛的数据来源使其成为AI研究和应用的重要工具,有助于加速研究进展和推动数据共享。
32 6
|
26天前
|
存储 人工智能 uml
介绍一款好用的开源画图神器-draw.io | AI应用开发
draw.io 是一款基于浏览器的开源绘图工具,无需安装即可使用,支持多种操作系统和设备。其简洁的界面、丰富的形状库、智能对齐功能和强大的云端协作能力,使其成为专业人士和创意爱好者的首选。无论是产品设计、流程图绘制还是思维导图构建,draw.io 都能满足你的多样化需求。【10月更文挑战第7天】
82 0
|
5天前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
7天前
|
存储 人工智能 SEO
全开源免费AI网址导航网站源码
Aigotools 可以帮助用户快速创建和管理导航站点,内置站点管理和自动收录功能,同时提供国际化、SEO、多种图片存储方案。让用户可以快速部署上线自己的导航站。
19 1
|
12天前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
40 6
|
24天前
|
人工智能 Java API
阿里云开源 AI 应用开发框架:Spring AI Alibaba
近期,阿里云重磅发布了首款面向 Java 开发者的开源 AI 应用开发框架:Spring AI Alibaba(项目 Github 仓库地址:alibaba/spring-ai-alibaba),Spring AI Alibaba 项目基于 Spring AI 构建,是阿里云通义系列模型及服务在 Java AI 应用开发领域的最佳实践,提供高层次的 AI API 抽象与云原生基础设施集成方案,帮助开发者快速构建 AI 应用。本文将详细介绍 Spring AI Alibaba 的核心特性,并通过「智能机票助手」的示例直观的展示 Spring AI Alibaba 开发 AI 应用的便利性。示例源
|
29天前
|
人工智能 Java API
阿里云开源 AI 应用开发框架:Spring AI Alibaba
阿里云开源 Spring AI Alibaba,旨在帮助 Java 开发者快速构建 AI 应用,共同构建物理新世界。
|
28天前
|
机器学习/深度学习 人工智能 TensorFlow
解锁AI潜力:让开源模型在私有环境绽放——手把手教你搭建专属智能服务,保障数据安全与性能优化的秘密攻略
【10月更文挑战第8天】本文介绍了如何将开源的机器学习模型(如TensorFlow下的MobileNet)进行私有化部署,包括环境准备、模型获取与转换、启动TensorFlow Serving服务及验证部署效果等步骤,适用于希望保护用户数据并优化服务性能的企业。
48 4
|
30天前
|
机器学习/深度学习 人工智能 自然语言处理
探索未来AI趋势:掌握Function Calling技巧,解锁大模型精度提升的秘密武器,让你的数据科学项目事半功倍!
【10月更文挑战第6天】随着深度学习技术的发展,神经网络模型日益复杂,Function Calling作为一种机制,在提升大模型准确度方面发挥重要作用。本文探讨Function Calling的概念及其在大模型中的应用,通过具体示例展示如何利用其优化模型性能。Function Calling使模型能在运行过程中调用特定函数,提供额外的信息处理或计算服务,增强模型表达能力和泛化能力。例如,在文本生成模型中,根据上下文调用词性标注或实体识别等功能模块,可使生成的文本更自然准确。通过合理设计条件判断逻辑和功能模块权重,Function Calling能显著提升模型整体表现。
35 3
|
1月前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。

热门文章

最新文章

下一篇
无影云桌面