几位 AI 工程师,开源了自己的泡妞项目

简介: 几位 AI 工程师,开源了自己的泡妞项目

如果你们还觉得工程师在撩妹上没有天赋的话,那你就大错特错了。

就在不久前 Facebook 的几个程序员最近也弄出一款音乐神器,可以把一首曲子,用 6 种不同的乐器演奏出来。然后 Google 的技术大拿们也不甘示弱,用 AI 搞出了一个音乐合成器正式加入专业撩妹俱乐部。


代码音乐家速成指南

大家都知道,通过 CNN 可以将图片进行风格重构,比如做点滤镜,让你的自拍照看起来像凡高的作品,业内也把这种卷积神经网络又叫神经网络迁移(Nural)。

受此启发,工程师们尝试把 CNN 运用到音乐上,希望搞点大事情,比如让 AI 像人类一样,用口哨来演奏音乐。

aaaa.png

小哥哥们认真 coding 的状态神似郎朗

实操上,大家也都知道 AI 不可能直接读取音符,所以首先必须将音符转换成机器能够识别的样式,然后通过 CNN 进行解码重构,再生成新的文件。

sssss.png

经过不断调试,他们已经可以将同一首曲子,用 6 种不同风格的乐器演奏出来,包括模仿人类吹口哨。


Google 小哥哥怎么搞 AI 音乐

FaceBook 小哥哥们鼓捣出的这套程序目前只能对音乐进行风格切换,听起来还不够浪漫,Google 的工程师随即放了撩妹大招:


「为妹子创造一个独一无二的声音。」

Magenta 是 Google 内部发起的一个与音乐结合的 AI 项目,专门探索如何将机器学习应用到音乐创作中。他们发布了 NSynth(神经合成器),这个项目是主要作者是 Yotam Mann ,他依靠深度神经网络来学习声音的特征,并根据这些特征生成一个前所未有的声音。


Yotam 认为之所以经典乐器会流行,就是因为无论是钢琴还是吉他,或是二胡,都有自己独特的音色和音域。而自己所写的 NSynth 并不是将声音简单的混合在一起,也不是重构音乐风格。

www.png

而是利用原始声音的声学特征来合成一种全新的声音,比如将笛子和琴声按比例进行搭配,创造出新的声音。


在 Yotam 建立的 NSythTH 算法中,先通过生成一个压缩的声音( 用 Z 表示 )。然后,解码器网络将其转换成回声,再对整个系统进行训练,使输出的声音尽可能更接近真实声音。

222.png

为了降低 NSynth 的使用门槛,Magenta 跟 Google Creative Lab 合作创建了 NSynth Super,这是一款开放源代码的音乐合成硬件产品。

111.png

通过预先载入的超 过10 万个声音,NSynth Super 通过算法就已经创造出很多声音,你可以通过拨号盘选择这些声音。当然,你也可以通过触摸屏创造新的声音。


目前,已经有不少专业的音乐制作人在使用这款产品。艺术创作需要灵感,这种全新的声音合成在可玩性、创意性上同样会给创造者提供一些不一样的启发。


如果你对 NSynth Super 源代码、原理图和设计模板等感兴趣,可以在 GitHub 找到 demo。

ghgg.png

qqq.png

这位眼神中透露着深情的小哥哥就是 Yotam Mann ,听说他几乎没有单身过。

相关文章
|
9天前
|
数据采集 人工智能 安全
AI项目高昂成本与数据问题阻碍进展,2025年前30%的GenAI项目或将搁浅
AI项目高昂成本与数据问题阻碍进展,2025年前30%的GenAI项目或将搁浅
|
12天前
RTX3090可跑,360AI团队开源最新视频模型FancyVideo
【9月更文挑战第23天】近年来,人工智能技术的迅猛发展推动了视频生成领域的进步,但在合成动态、连贯且时长较长的视频方面仍面临挑战。为此,360AI团队提出了FancyVideo模型,通过跨帧文本指导实现更为连贯的视频生成。FancyVideo引入了跨帧文本指导模块(CTGM),包含时间信息注入器(TII)、时间相关性优化器(TAR)和时间特征增强器(TFB)三个组件,分别负责注入帧特定信息、优化相关性和增强时间一致性。这些机制使模型能生成具有连贯动作和丰富运动的视频,适用于动画制作和视频编辑等领域。然而,FancyVideo也存在计算复杂度高和细节真实感提升空间等局限。
26 3
|
2月前
|
人工智能 文字识别 算法
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
X-AnyLabeling是一款强大的辅助标注工具,集成了AI推理引擎和丰富功能,为图像数据工程师提供一站式解决方案。它支持图像和视频文件的自动标注,提供了包括矩形框、多边形在内的七种标注样式,适应多样化的训练场景需求。X-AnyLabeling内置了多种SOTA级AI模型,如YOLO、SAM系列等,并支持GPU加速和多种数据集格式的导入导出,确保高效的数据处理。此外,它还具备良好的跨平台兼容性,可在多种操作系统上运行,并提供详尽的帮助文档和社区支持,帮助用户轻松上手并解决使用过程中遇到的问题。
103 2
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
|
28天前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。
|
2月前
|
人工智能 PyTorch 算法框架/工具
Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI项目落地进程
【8月更文挑战第6天】Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI项目落地进程
Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI项目落地进程
|
2月前
|
人工智能 自然语言处理 Java
Spring AI,Spring团队开发的新组件,Java工程师快来一起体验吧
文章介绍了Spring AI,这是Spring团队开发的新组件,旨在为Java开发者提供易于集成的人工智能API,包括机器学习、自然语言处理和图像识别等功能,并通过实际代码示例展示了如何快速集成和使用这些AI技术。
Spring AI,Spring团队开发的新组件,Java工程师快来一起体验吧
|
8天前
|
人工智能 自然语言处理 Linux
Llama 3.2:开源可定制视觉模型,引领边缘AI革命
Llama 3.2 系列 11B 和 90B 视觉LLM,支持图像理解,例如文档级理解(包括图表和图形)、图像字幕以及视觉基础任务(例如基于自然语言描述在图像中精确定位对象)。
|
2月前
|
人工智能
Meta开源用于数学等复杂推理AI Agent—HUSKY
【8月更文挑战第19天】Meta AI团队开源了HUSKY,一种统一的AI代理,专长解决数学及复杂推理任务。HUSKY通过学习在通用操作空间内推理,涵盖数值、表格和基于知识的任务。它分为生成和执行两阶段,利用专家模型如语言和数值推理模型解决问题。经过14个数据集测试,HUSKY展现出超越同类代理的性能,尤其是在新提出的HUSKYQA评估集中,其7B模型的表现媲美甚至超越GPT-4等大型模型。相关代码和模型已公开,以推动领域内的研究进展。[论文](https://arxiv.org/abs/2406.06469)
29 2
|
2月前
|
数据采集 存储 人工智能
利用AI技术改善数字化转型项目的九种方法
利用AI技术改善数字化转型项目的九种方法

热门文章

最新文章

下一篇
无影云桌面