阿里90后工程师,如何用AI程序写出双11打call歌?

简介:

来自阿里巴巴的90后工程师芦阳,用业余时间开发了一套人工智能作词程序——名字叫做MusicGo,这个程序经过芦阳的“喂养”和设定,可以自己写饶舌歌曲。


芦阳加入菜鸟也才仅仅四个月,这是他第一次参加双11备战。作为一名新员工,用原创嘻哈歌曲庆祝双11的形式可谓独一无二。人工智能和双11也成为MusicGo的第一个主打的主题曲。


今年的双11非常有科技感,芦阳就给MusicGo喂食了不少体现双11科技的文章,比如菜鸟智慧物流、阿里云、天巡机器人、智能客服等关键词,加上修饰韵脚,20分钟后,一首《天猫双11有嘻哈》就出炉了。

大家来感受下:


其实,今年双11里人工智能已经悄然成为了狂欢节的新兴“职业”。不仅50%的后台故障修复由智能机器人负责,超级机器人仓群和一天内350万的客户量都是由智能机器人和“店小蜜”来完成的,可以说今年阿里双11开启了人际协同时代的新篇章。


这款芦阳利用业余时间编写的人工智能程序MusicGo,可以分析Hip-hop的歌词,将歌词进行分词以及拼音解析,从而进一步获取每个词的韵脚,形成庞大的分词词库,扔进去一个词就能出来很多押韵的相关词汇。


今天,阿里妹也邀请到了作者芦阳,请他来聊聊MusicGo的实现原理。其实没有你想象的那么难哦~

芦阳:把AI写歌儿这个事儿抽象起来看,其实是有一个模型,或者更通俗一点讲,是有一个函数。就像Y=WX+B,给一个X,就可以产出一个Y。所以,问题的关键是我如何抽象出这个函数,并使其尽可能的精准。

深度学习可以做到的是抽象模型。举例,我给出一段序列A作为X,给出一段序列B作为Y,它会通过不断的有监督学习从而获得函数Y=WX+B。接着,我又给出一段序列C作为X,给出一段序列D作为Y,它通过调整函数的参数尽力去满足A->B && C->D。当学习的量达到一定阶段的时候,模型也就基本可用了。

因此,我最终想要的效果是,一个比较合理的模型。这个模型可以做到,我给一个序列X,它可以去生成序列Y1,同时生成隐状态H1。接着,用Y1以及H1作为输入,继续生成Y2和H2,以此类推。最终达到所定义序列长度标准。 

步骤为:

1. 收集歌词

2. 对歌词进行预处理,去除标点符号、特殊字符

3. 不断训练seq2seq模型

4. 使用模型产出歌词


收集歌词

我用Python爬取了XX音乐上的Hip-hop歌单,分析rapper如何押韵,收集到了几万首嘻哈歌词。

数据预处理

原始的歌词因为都是网友们上传上去的,所以格式并不完全统一,而且还会有一些非主流符号。因此,需要把所有歌词都进行同样的预处理,过滤了标点符号、特殊字符,写入到文件中,目的是使剩下的文本足够的整洁。

训练模型

首先是建立LSTM模型。


根据传入的引状态initial_state与序列inputs_split,执行rnn的decoder获得输出outputs_split。


把输出用softmax层处理,得到logits,与原本要学习的文本训练targets,计算总损失函数值total_loss。


循环去学习feed的文本,不断调整模型,降低损失函数值。


生成模型过程:


将足够满足目标的结果模型保存下来,后续就可以用该模型去生成序列了。


产出歌词

用上述产生的模型生成嘻哈歌曲,结果不太理想,给人的感觉是有点儿乱。因为嘻哈歌曲本身写的东西都比较杂,并且由于时间原因,我也没训练模型太久,损失函数值不足够低,导致最后生成的歌曲,更杂了。

调整思路 

同时,还有个问题:嘻哈有了,“双11”和“智能”呢?我就是让模型学一辈子嘻哈,它也写不出双11和人工智能的东西,因为市面上并没有同类型歌曲。因此,我决定回到原点,改变想法,目标导向。

用“人工智能”、“双11”、“阿里云”、“阿里小蜜”、“菜鸟机器人”等关键词去爬科技类文章来feed模型,模型学会产出双十一智能等相关的句子。同时,用嘻哈的句式长度去约束它,产出嘻哈歌曲。最后挑一些句子,加一点“韵脚”,就作为词了。

人工修正智能

当然,用程序跑出的词,和人工写成的作品仍有些偏差。因此,我对机器自动生成的歌曲句式进行调整,使其更通顺(手动捂脸)


天猫双11有嘻哈

(歌词节选)

 

又来到一年 双11

让我买买买 花光所有力气

又来到这一年双11

让我把指挥权交给智能机器

 

黑科技改变生活

打破包围我们地域的封锁

智能的技术连接你我

点亮双11 夜里万家灯火

 

Yeah太多无法计算的价值

成千上万订单在指尖飞驰

Yeah太多无法计算的价值

阿里云让所有订单在云端飞驰


阿里小蜜 会语音文字图像识别

学习能力 全部一整年都在线

人海战术 全被科技改变

好用又百变 用户舍不得说再见

 

还有机器人总动员在菜鸟仓库上演

累计足够智能 它们开始掌握主动权

拣选打包 顺利通关

从杭州到东莞

从上海到中原



今年双11,作为工程师的你,在购物车里放了哪些必败单品?是心心念念的机械键盘、降噪耳机、无人机,还是为爱人买的暖心手套、明星同款口红?欢迎在留言区一起分享交流~

截止11月10日24点,点赞数最多的留言童鞋,将获得精品好书《尽在双11:阿里巴巴技术演进与超越》一本。




原文发布时间为:2017-11-9

本文作者:芦阳

本文来自云栖社区合作伙伴“阿里技术”,了解相关信息可以关注“阿里技术”微信公众号


相关文章
|
24天前
|
机器学习/深度学习 人工智能 算法
【AI系统】AI 系统与程序代码关系
本文探讨了AI系统与程序代码之间的关系,通过PyTorch实现LeNet5神经网络模型为例,详细介绍了AI训练流程原理、网络模型构建方法、算子实现的系统问题以及AI系统执行的具体计算过程。文章不仅解释了神经网络的前向传播和反向传播机制,还深入分析了算子在AI框架中的作用及其底层实现,包括卷积层的具体计算和优化问题。此外,文章对比了使用PyTorch与直接使用cuDNN+CUDA编程实现神经网络模型的差异,强调了AI框架在提高开发效率、自动化内存管理和实现自动微分等方面的重要性。
31 1
|
24天前
|
人工智能 自然语言处理 Swift
探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!
阿里国际AI团队发布的新模型Marco-o1,不仅擅长解决具有标准答案的学科问题(如代码、数学等),更强调开放式问题的解决方案。该模型采用超长CoT数据微调、MCTS扩展解空间等技术,提升了模型在翻译任务及复杂问题解决上的表现。研究团队还开源了部分数据和模型,供社区使用和进一步研究。
|
2月前
|
消息中间件 人工智能 Cloud Native
|
2月前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
|
2月前
|
人工智能 Ubuntu Linux
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
|
3月前
|
人工智能 前端开发 Java
Spring Cloud Alibaba AI,阿里AI这不得玩一下
🏀闪亮主角: 大家好,我是JavaDog程序狗。今天分享Spring Cloud Alibaba AI,基于Spring AI并提供阿里云通义大模型的Java AI应用。本狗用SpringBoot+uniapp+uview2对接Spring Cloud Alibaba AI,带你打造聊天小AI。 📘故事背景: 🎁获取源码: 关注公众号“JavaDog程序狗”,发送“alibaba-ai”即可获取源码。 🎯主要目标:
112 0
|
3月前
|
消息中间件 人工智能 运维
|
2月前
|
机器学习/深度学习 人工智能 PyTorch
【AI系统】AI 系统与程序代码关系
在人工智能领域,系统与程序代码间的关系错综复杂。AI系统的设计需高效代码支撑,而代码优化与执行又受制于系统设计。本文剖析二者间的互动及其对AI进步的关键作用,涵盖AI训练流程、经典模型LeNet5实现、底层算子与系统问题,并探讨如何通过高效代码与系统优化推动AI技术革新,提升模型性能。欢迎访问昇腾社区获取更多AI学习资源与实践机会。
49 0
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
50 10
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
转载:【AI系统】AI的领域、场景与行业应用
本文概述了AI的历史、现状及发展趋势,探讨了AI在计算机视觉、自然语言处理、语音识别等领域的应用,以及在金融、医疗、教育、互联网等行业中的实践案例。随着技术进步,AI模型正从单一走向多样化,从小规模到大规模分布式训练,企业级AI系统设计面临更多挑战,同时也带来了新的研究与工程实践机遇。文中强调了AI基础设施的重要性,并鼓励读者深入了解AI系统的设计原则与研究方法,共同推动AI技术的发展。
转载:【AI系统】AI的领域、场景与行业应用
下一篇
DataWorks