如何让芸芸众“声”更抓耳?喜马拉雅携手阿里云给出答案

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 以科技赋能文化的喜马拉雅,通过AI、大数据等技术的应用,不断创新产品与服务,推动了以音频为特色的“耳朵经济”。

常言道,无限风光在险峰。世界上海拔超过8000米的独立山峰共有14座,其中10座就诞生在喜马拉雅山脉。著名的登山家乔治·马洛里,在被问及为何想要攀登喜马拉雅山的主峰——珠穆朗玛峰时,回答说:“因为它就在那里。”(Because it's there.

 

喜马拉雅作为国内领先的音频APP,其得名就来源于喜马拉雅山脉。公司创始人认为,人人都是攀登者,登上自己人生的喜马拉雅。喜马拉雅APP为阅读方式,传递有声剧、播客、亲子儿童等多元内容,做用户每一天的精神食粮,浸润人们的心灵和精神世界。

 9xmky1.jpg

得益于收听时间和场景的碎片化,网络音频已成为移动互联网时代大众内容消费的刚性需求,喜马拉雅也在这股浩荡的风潮中发展壮大,看到了山顶的壮阔。根据艾媒咨询报告显示,2022年在线音频用户持续增长,达到6.9亿人,月活跃用户超过3亿,市场规模突破310亿元。而其中,喜马拉雅以2.82亿的全场景月活跃用户数和高使用时长的强劲优势领跑。不难发现,声音的层峦叠嶂,形成了喜马拉雅的“群峰”。

 

以科技赋能文化的喜马拉雅,通过AI、大数据等技术的应用,不断创新产品与服务,推动了以音频为特色的“耳朵经济”。如今,喜马拉雅已经建立了从头部IP到长尾内容全面覆盖的健康、均衡、有活力的生态内容体系,在线音频服务已经涵盖了用户从-1岁到100岁不同年龄阶段所需要的丰富内容。

 

面对仍在不断增长的海量音频数据,实现高效、快速、准确的数据处理和分析能力至关重要,降低数据存储成本也迫在眉睫。此外,由于喜马拉雅的用户使用FM音频的高频时间段在早晚上班高峰期间和睡觉之前,其流量特征有着明显的波峰波谷,需要更灵活的IT架构来支撑线上动态变化的业务,而传统的IDC模式很难实现这一点。因此,在深入的沟通和交流后,喜马拉雅选择携手阿里云,打造云原生大数据平台。

喜马拉雅架构图.png

首先,喜马拉雅累积了包含101个品类的3.4亿条音频内容,光是通过AIGC创作有声书专辑就超过了37000部。喜马拉雅将线下IDC自建的大数据平台整体迁移上云,大数据架构整体升级到阿里云数据湖3.0,让数据在多种生态间高效统一流入、管理、使用,并实现数据的冷热分层。

 

其次,E-MapReduce(简称EMR)基于开源的Apache HadoopApache Spark,并与与阿里云其它产品(如OSSPAISLSTableStore等)进行了深度整合,让喜马拉雅可以方便地使用HadoopSpark生态系统中的其他周边系统分析和处理数据。借助阿里云的E-MapReduceOSS-HDFS,喜马拉雅成功构建了云原生大数据平台。

 

再次,数据湖与云原生计算结合,提供了更高的扩展性,有力地支撑了喜马拉雅动态变化的业务,OSS的高可靠性保障,让喜马拉雅无需采用传统HDFS副本机制,资源扩容更为高效,整体成本更为优化,让用户随时随地流畅收听有声书。

 

登高望远之美,在于一览无余。在喜马拉雅,每个人都可以用声音分享故事、知识和观点。喜马拉雅CTO 姜杰如表示,“借助阿里云的 E-MapReduce OSS-HDFS,我们构建了喜马拉雅云原生大数据平台,并结合喜马拉雅领先的情感语音AI,推动业务创新,为用户提供更优质的内容消费和更智能的语音交互体验。相信在阿里云技术的加持下,会有更多的人在喜马拉雅听众声,见众生。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 大数据 数据处理
PHP 与大数据:构建高效数据处理系统
传统的数据处理系统往往难以应对大规模数据的处理需求,而PHP作为一种常用的服务器端脚本语言,在数据处理方面也有其独特的优势。本文将探讨如何利用PHP构建高效的大数据处理系统,结合实际案例分析其应用场景及优势所在。
15 2
|
2月前
|
人工智能 监控 Cloud Native
iLogtail 2.0 来了;通义灵码下载量破百万丨阿里云云原生 2 月产品月报
iLogtail 2.0 来了;通义灵码下载量破百万丨阿里云云原生 2 月产品月报
|
8天前
|
Cloud Native Serverless 开发者
阿里云助力开发者创新:探索云原生技术的新境界
阿里云开发者社区推动云原生技术发展,提供丰富产品(如容器服务、Serverless、微服务架构、服务网格)与学习平台,助力企业数字化转型。开发者在此探索实践,共享资源,参与技术活动,共同创新,共创云原生技术新篇章。一起加入,开启精彩旅程!
108 2
|
2天前
|
Cloud Native 关系型数据库 OLAP
云原生数据仓库产品使用合集之阿里云云原生数据仓库AnalyticDB PostgreSQL版的重分布时间主要取决的是什么
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
1天前
|
存储 Cloud Native 大数据
国内独家|阿里云瑶池发布ClickHouse企业版:云原生Serverless新体验
全面升级为云原生架构,支持云原生按需弹性Serverless能力,解决了长期困扰用户的集群扩展效率和平滑性问题。
国内独家|阿里云瑶池发布ClickHouse企业版:云原生Serverless新体验
|
20天前
|
SQL 分布式计算 Hadoop
利用Hive与Hadoop构建大数据仓库:从零到一
【4月更文挑战第7天】本文介绍了如何使用Apache Hive与Hadoop构建大数据仓库。Hadoop的HDFS和YARN提供分布式存储和资源管理,而Hive作为基于Hadoop的数据仓库系统,通过HiveQL简化大数据查询。构建过程包括设置Hadoop集群、安装配置Hive、数据导入与管理、查询分析以及ETL与调度。大数据仓库的应用场景包括海量数据存储、离线分析、数据服务化和数据湖构建,为企业决策和创新提供支持。
66 1
|
21天前
|
分布式计算 资源调度 Hadoop
Apache Hadoop入门指南:搭建分布式大数据处理平台
【4月更文挑战第6天】本文介绍了Apache Hadoop在大数据处理中的关键作用,并引导初学者了解Hadoop的基本概念、核心组件(HDFS、YARN、MapReduce)及如何搭建分布式环境。通过配置Hadoop、格式化HDFS、启动服务和验证环境,学习者可掌握基本操作。此外,文章还提及了开发MapReduce程序、学习Hadoop生态系统和性能调优的重要性,旨在为读者提供Hadoop入门指导,助其踏入大数据处理的旅程。
93 0
|
21天前
|
消息中间件 人工智能 监控
|
28天前
|
机器学习/深度学习 分布式计算 数据挖掘
阿里云 MaxCompute MaxFrame 开启免费邀测,统一 Python 开发生态
阿里云 MaxCompute MaxFrame 正式开启邀测,统一 Python 开发生态,打破大数据及 AI 开发使用边界。
379 1
|
29天前
|
消息中间件 NoSQL Kafka
云原生最佳实践系列 5:基于函数计算 FC 实现阿里云 Kafka 消息内容控制 MongoDB DML 操作
该方案描述了一个大数据ETL流程,其中阿里云Kafka消息根据内容触发函数计算(FC)函数,执行针对MongoDB的增、删、改操作。

热门文章

最新文章