备案控制台登录注册

开发者社区大数据文章正文

对谈｜喜马拉雅，为何能快速推进AI in All ？

2024-07-26 294 发布于辽宁

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

简介： 对谈｜喜马拉雅，为何能快速推进AI in All ？

走进位于上海张江的喜马拉雅园区，随处可见“AI in All”的标语。

在喜马拉雅，“AI in All”不是一句简单的口号——从借助大模型提高内容生成效率，到辅助代码编写，BI报表自动生成……这家深受用户喜爱的音频在线平台，正在内部掀起一场全方位的 AI 变革。

变革的发生，不是一蹴而就的。喜马拉雅为大模型的快速落地设计了一套完整的技术架构：从底层算力，到数据层，到模型训练、推理层，再到面向业务的工程化平台，全面以AI为中心进行架构优化。

特别是在去年，喜马拉雅率先完成了大数据上云，让数据集在大模型落地中的价值进一步凸显。

本期 AI 对谈，我们邀请到了喜马拉雅基础架构部负责人胡建华，分享喜马拉雅为快速推进AI in All做了哪些扎实准备。

时间轴

Timeline

00:27

小雅音箱互动中包含哪些大模型技术

01:38

在喜马拉雅，大模型已在多个场景落地应用

03:12

喜马拉雅 AI Infra 大揭秘，围绕AI实现架构全面优化

06:46

大模型技术的几个发展趋势

07:30

喜马拉雅大数据上云的前瞻性

09:28

未来云上技术架构有哪些演进趋势

阿里云：刚刚的演示体验到了小雅音箱非常流畅的对话能力，正好也请教一下您，在跟小雅音箱互动的场景里，包含了大模型方面的哪些能力呢？

喜马拉雅：这个过程中涉及了几个技术。首先会有一个问答过程，基于ASR（自动语音识别技术）识别用户的问题，然后把它TTS（文本转语音）出去。在大模型这一块，我们基于阿里云通义千问的开源模型，结合我们自己的一些数据集，比如说专辑声音相关的信息，做了一些fine tune（微调）。

阿里云：可以说，这是非常典型的“AI+大数据”这样一种新型的范式。

喜马拉雅：对，喜马拉雅是中国头部的音频在线平台，我们拥有海量的声音，音频库、音色库、音调，和演绎的场景数据都是非常丰富的，所以我们训练的效果可能会更专业。

其实我们知道TTS、ASR技术很多年前就有了。但近几年随着大模型技术兴起，情感演绎、多人演绎等效果都比以前好了很多。最近比较火的GPT-4o，看视频演示它的响应时间已经缩短到300毫秒以内，基本上我们感知不到。可见它的工程优化做得非常惊艳。

阿里云：目前，喜马拉雅还有哪些场景在应用大模型方面比较成熟？

喜马拉雅：我们一直在探索将大语言模型应用于业务，过去我们可能讲“All in AI”，现在我们是“AI in all”。内部大概有这么几条线——

第一，因为我们天生是内容的平台，过去内容制作成本是很高的。从版权采买，到找到合适的创作者，之后还有很长的制作周期。实际上，过去我们大部分时间可能都花在制作上了。现在有了大模型，有了AIGC的演绎能力，我们极大降低了内容创作的成本，提升了效率。过去平均生成一本书可能要几十天或者一两个月。现在可能一、两天，甚至十几个小时就能生成。

还有一个板块，就是内部提效，比如AI coding（人工智能编码）。我们现在内部用AI生成的代码，真正用于生产的已经超过一万行了。

再比如BI报表，可以通过自然语言的一段描述来自动生成报表。像“今天我们的DAU是怎么样的”“今天我们的内容上新是多少”等等，这些AI都可以很好地回答。

当然，还有像是亲子类的“AI换声·爸妈分身”。我们打工人可能平时都比较忙，没有时间去陪伴孩子。现在有AI就很方便了。只要我们对着麦克风讲3秒钟，就能提取我们的音色、说话的腔调等等。

阿里云：听起来确实非常合适，也很暖心。其实，从AI in All 到All in AI这个实践也印证了之前行业内一直讨论的一个观点——一个足够好的基础大模型离业务还是有相当大的间隔，这个间隔其实需要结合企业自身的高质量数据来补齐。

从你的观点来看，对比两年前，基础大模型、AI Infra这两个层面发生了哪些比较大的变化呢？

喜马拉雅：我们认为，现在大模型应用不仅仅受限于大模型，其实还有很大的一个原因是算力。比如说“下单”这种实时服务，如果跟大语言模型做一次交互，需要十几秒或者是几十秒，这种体验肯定是不能接受的。

这一年多来，大模型相关技术迭代非常快。过去两三年我们其实也一直在做AI infra的升级。因为我们不可能自己去训那么大参数的大模型，所以一方面我们会用国内优秀的大模型，另外一方面我们可能会聚合一些基座模型去做微调，加一些数据集来训练我们自己的模型，这是我们目前的架构。

具体来说，大概分为这么几层：

首先，数据是模型的养料，是生命线。一个稳定、高效的数据存储，包括取数，是AI最最重要的一个环节。所以，我们在去年和阿里云一起完成了大数据全面上云，于阿里云的存储以及高性能计算引擎的能力，我们搭建了一个喜马拉雅的数据库，这是非常及时，也非常迫切的。这样，各种各样的数据都能比较方便地入库，它的存储、读取速度，包括带宽，都能符合我们的业务和模型的要求。

同时，因为我们训练的时候可能要大量的算力。但是训练完成后，就会释放出算力。所以我们有一朵具备弹性算力的AI云。

接着在大数据层上就是一些基础模型，包括通义千问的开源模型，我们基于这些基模去做微调。

架构的再上面一层就是模型框架。因为进行推理服务的时候，我们经常要对模型进行一些推理加速。大模型的推理非常耗费GPU。早期一张3090显卡，可能只能处理一个并发，所以我们在模型层也会做一些调优。

在模型框架层面，我们也跟阿里云共建，学习了阿里云在AI架构组这方面的能力。我们也运用了一些开源的vLLM、Pytorch这些框架，来做算子的调优和网络的调优。

再往上一层就是解决方案层。因为对于大语言模型来说，一个好的提示词跟一个不好的，输出的效果是不一样的。所以我们针对于提示词，包括结果指标的反馈，也做了一些解决方案的研发。

以上就是我们AI infra的基本架构。

阿里云：这段话的技术密度特别高，基本把一个企业的大模型架构，从底层，到数据层到上面的模型训练、推理层，再到面向业务的一些工程化平台、业务场景，都描述得特别清晰。

我非常认同您刚刚的一些观点。现在基础大模型技术的迭代非常快，基本每星期都会有新版本迭代。除了大模型能力越来越强，我们也能够明显看到一些发展趋势：首先，大模型朝多模态混合大模型发展；其次，混合专家模型MOE的应用场景也越来越多。另外，基础大模型向更大参数量，更大数据量的方向发展，对算力的弹性、可扩展性，包括超大集群运维管理的要求会越来越高。

刚刚您也提到了数据，即使我们有非常优秀的基础大模型，但是对于大模型的微调、推理，数据其实还是非常核心的要素。去年喜马拉雅也完成了大数据的全面上云。现在回头看这个决策，我觉得还是非常有前瞻性的。

喜马拉雅：可以从几个维度来看我们大数据上云这个事。

过去我们上云之前，如果有紧急任务，要加服务器，一加就是上百台。经过提交需求、采买、上架，再进行安装等多个步骤，整体完成可能要一到两个月，极大地制约了业务的发展。

现在上云后我们实现了秒级弹性。过去服务器购买之后，经过一个大促或者一个高峰后，90%的时间都会闲置。现在当业务不需要时，实例就可以自动弹出，所以对我们来说，上云的成本相对来说是最优的。

另外，在存储方面，过去我们遇到冷、热数据处理的问题。我们把冷数据和热数据做同样的处理，这对技术要求非常高，同时投入也划不来。

现在用阿里云OSS存储，冷、热数据可以分开处理。相对来讲，喜马拉雅的热数据并没有那么多，大量的数据是冷数据。这样能极大地降低数据存储成本，同时能提升取出效率。因为热数据越少，提取批量就会更快。

过去我们基于Mapproduce来去搭建整个HDFS体系，如果想升级湖仓一体架构，就会非常受制约，可能需要重构颠覆原本的架构，这样人员投入会非常大，时间周期也会拉的非常长。上云之后，就可以非常方便进行架构升级，极大地提升我们的效率，降低我们的研发成本。

很有意思的一个现象是，我看到很多做数据的同学说，喜马的广告数据提取效率提升了30%。我就问他们，这个任务提升的背后，主要的原因是啥？可能有一些是工程师代码带来的提升，但更多的，还是一些上云后架构升级带来的。

阿里云：这也能很好地解释，为什么喜马拉雅今天在大模型的应用场景上走得这么超前，而且有这么多丰富的场景能够层出不穷地推出来。正是因为喜马拉雅在基础架构层面上非常扎实的改造和大数据升级之后带来的一些技术红利。

最后，想请您分享一下，您认为未来基于大模型的架构会有哪些演进的趋势？

喜马拉雅：我觉得未来模型在参数上可能会收敛。接下来模型在性能等方面上经过调优，反应速度会越来越接近于在线设备，可能时间会缩短到一秒以内。所以，未来模型会在参数大小和效果、性能上会做一个平衡。另外，数据和模型的效果有着直接的关系。未来，数据集的价值也会越来越凸显。

阿里云：确实。我们现在看到，随着基础模型能力的不断提升，基础模型的数量最终肯定是收敛的，要真正影响用户去大规模应用大模型，一定需要推理成本和框架上的优化。非常感谢您的分享，我们也期待未来喜马拉雅在AI、大模型的场景下，能够探索出更多有意思的场景，给用户带来更好的体验。

/ END /

文章标签：

云原生大数据计算服务 MaxCompute

人工智能

大数据

存储

语音技术

BI

关键词：

AI推进

喜马拉雅AI

AI all

相关实践学习

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析，通过分析能得到用户群体年龄分布，性别分布，地理位置分布，以及热门话题的热度。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

阿里云

+关注

683文章 161视频

目录

打赏

0

1

1

0

923

相关文章

科技云报道

|

10月前

|

机器学习/深度学习人工智能自然语言处理

科技云报道：推进工业新质生产力机器人有望成为AI下一个新引擎？

推进工业新质生产力机器人

科技云报道

102 0 0

科技云报道：推进工业新质生产力机器人有望成为AI下一个新引擎？

才云

|

SQL 存储机器学习/深度学习

2023 Databricks Data+AI Summit：All in AI

Databricks Data+AI Summit 7月初在旧金山召开，整个发布会看下来，最大的感受就是All in AI和All in One。

才云

1218 3 3

阿里云大数据Al技术

|

存储人工智能并行计算

喜马拉雅基于DeepRec构建AI平台实践

快速落地大模型训练和推理能力，带来业务指标和后续算法优化空间的显著提升。喜马拉雅AI云，是面向公司人员提供的一套从数据、特征、模型到服务的全流程一站式算法工具平台。

阿里云大数据Al技术

770 0 1

auqbllxiu

|

人工智能大数据

《品友All In人工智能让大数据AI上营销》电子版地址

品友All In人工智能让大数据AI上营销

auqbllxiu

126 0 0

《品友All In人工智能让大数据AI上营销》电子版地址

DrugAI

|

人工智能

News | Atomwise获投1.23亿美元推进AI药物研发

News | Atomwise获投1.23亿美元推进AI药物研发

DrugAI

177 0 0

News | Atomwise获投1.23亿美元推进AI药物研发

-开发达人-

|

机器学习/深度学习人工智能自然语言处理

发布AI芯片昆仑和百度大脑3.0、L4自动驾驶巴士量产下线，这是百度All in AI一年后的最新答卷

去年的 7 月 5 日，百度在北京国际会议中心开办了首届「AI 开发者大会」。在会上，百度首次喊出了「All in AI」的口号。一年的时间过去了，今天在同样地点举行的第二届开发者大会上，李彦宏说道：去年我吹过一个牛，百度的 L4 级别无人驾驶车的量产，会在 2018 年的 7 月份。今天我要说的是，这个牛，马上就要实现了！而百度的最新战略、技术实力、以及生态发展也在这场大会上一一展现在我们的面前。

-开发达人-

255 0 0

发布AI芯片昆仑和百度大脑3.0、L4自动驾驶巴士量产下线，这是百度All in AI一年后的最新答卷

-开发达人-

|

机器学习/深度学习人工智能自动驾驶

两家ALL IN AI巨头的联手：英伟达与百度宣布形成广泛合作关系

英伟达正与百度合力加速人工智能技术的发展。本次两方宣布的合作范围包括云数据中心、自动驾驶和智能家居等领域。

-开发达人-

645 0 0

两家ALL IN AI巨头的联手：英伟达与百度宣布形成广泛合作关系

xxrjl

|

机器学习/深度学习数据采集人工智能

我国加速推进AI医疗器械标准化

今年是新修订《医疗器械监督管理条例》施行的第一年，企业主体责任更加突出，产品的验证与确认活动趋于多元化，业界对标准规范的需求更加强烈。在国家政策与监管科学研究支持下，国内获批上市的医疗器械产品数量持续增加，影响力不断增强，临床转化与推广步伐加快。

xxrjl

268 0 0

我国加速推进AI医疗器械标准化

阿里云头条

|

人工智能

阿里巴巴在澳门推进医疗AI 帮助人类抵御流感疫情

人工智能帮助人类抵御流感疫情？！看似天方夜谭的故事正在被技术实现。

阿里云头条

6268 0 1

云栖号资讯小哥

|

机器学习/深度学习传感器人工智能

AI将如何推进太空探索的商业化进程？

AI技术正努力让太空商业化成为可能，并让太空成为安全的作业环境。

云栖号资讯小哥

897 0 0

热门文章

最新文章

VideoMind：Chain-of-LoRA突破时间盲区让AI真正看懂长视频

Agent TARS：一键让AI托管电脑！字节开源PC端多模态AI助手，无缝集成浏览器与系统操作

一键部署 Dify + MCP Server，高效开发 AI 智能体应用

AI时代创作何为？AI如何重塑IT行业格局

穿透技术域迷雾：如何用AI缝合安全裂痕？

RuoYi AI：1人搞定AI中台！开源全栈式AI开发平台，快速集成大模型+RAG+支付等模块

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

Java版Manus实现来了，Spring AI Alibaba发布开源OpenManus实现

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

科研论文翻译神器！BabelDOC：开源AI工具让PDF论文秒变双语对照，公式图表全保留

剧透：巴黎奥运会用上了AI转播

巴赫：阿里AI技术将巴黎奥运转播带到新高度

For Her！阿里云携手国际奥委会推出AI修复影片《永不失色的她》

剧透！巴黎奥运会用上了AI转播

探索软件测试的未来：AI与自动化的交汇点

云上AI服务，中国最佳

AI技术在医疗健康领域的创新应用

AI基础设施！产品力全球第二

智能化运维：如何利用AI和机器学习优化IT基础设施管理

AI的伦理困境与技术发展

相关课程

更多

AIGC无处不在，把AI应用构建于Serverless之上

【科技少年】AI领航员探索教程（赛前训练）

达摩院视觉AI精品课

AI开发者的Docker实践

趣味视觉AI应用入门与实战

AI数学基础

相关电子书

更多

Serverless+AI 应用开发专场深圳站PPT合集

AI 编程颠覆 IT 生产力

阿里云云原生技术实践营 AI 原生应用架构专场·北京站

相关实验场景

更多

基于ECS部署DeepSeek个人专属AI网站

通过云原生API网关进行AI缓存

通过云原生API网关进行AI应用防护

体育赛事！零代码生成运动风格AI写真。

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

使用容器计算服务 ACS 算力快速搭建生成式 AI 会话应用

下一篇

阿里云oss简介和如何对接使用

你好，我是AI助理

可以解答问题、推荐解决方案等