专家对谈|AI推动文化传媒行业向“新”发展

简介: 随着“人工智能+”行动的深入推进,文化传媒行业正经历深刻变革。云计算与AI深度融合,重构内容生产、分发全流程,为行业注入新动能。预计到2025年,我国AI核心产业规模将破万亿,文化传媒作为技术应用先锋,以两位数增速迈向智能化。在CCBN活动现场,中央广播电视总台与阿里云探讨了大模型如何驱动行业升级,展望未来新图景。汪莹指出,大模型将重构文化消费形态,助力生产力与传播力倍增,推动中国文化走向世界。同时,解决AI应用“最后一公里”问题需产业链各方协同发力,基于现有大模型能力进行二次开发是切实可行路径。

当下,“人工智能+”行动正在全社会如火如荼地进行,在数字经济与智能技术的双轮驱动下,文化传媒与广电视听行业正在经历一场深刻的范式变革。云计算与人工智能的深度融合,不仅重构了媒体内容生产、分发与运营的全流程,更以新质生产力的姿态,为行业注入了澎湃的新动能。截至2025年,我国AI核心产业规模预计将突破万亿,文化传媒行业作为技术应用的创新先锋阵地,也正以年均两位数的增速迈向智能化新阶段。


在2025 CCBN活动现场的“CMG创新技术访谈”直播访谈栏目中,中央广播总台技术局新闻制播三部应用管理科负责人许卫国与阿里云智能集团文化传媒行业总经理汪莹展开了一场深入的技术访谈,探讨了云计算与人工智能如何驱动行业升级,展望了大模型、算力革新及行业应用的未来新图景。(点击下方图片观看视频)


截图.png


大模型重构文化消费业态


许卫国:我的第一个问题,当下AI作为新质生产力的排头兵,在各行各业都引起了强烈的关注,从您的角度看,目前文化传媒行业有哪些发展趋势?


汪莹:我的体会是,大模型等AI技术的爆发式发展将重构文化消费形态,这里我想引用王坚院士的一句话——大模型AI不是工具的革命,而是革命的工具。


当前中美文化消费市场存在两个「6万亿」:美国每年的文化消费市场GDP约6万亿美元,中国是6万亿人民币,虽然数字是一样的,但这之间就是7倍的汇率差距,而且,美国的文化消费占比全国GDP约20%,中国却不足5%。这种差距主要源于美国在文化、娱乐、影音等领域的数字化起步比较早,消费者习惯培养比较成熟。但大模型是一个新的起点,就像当年互联网时代催生了电商行业的超越式的发展,那些没能及时用互联网改造产业链的企业,十年后多多少少都面临着转型压力。在今天,能用好大模型重构文化消费体验的产业链参与者可能就会有更高更好的发展空间。


最近我在关注中美对比研究,大家都知道,美国在信用卡时代处于领先地位,但在移动支付领域我们实现了反超。目前我们国内拥有30万家文化类企业,美国约10万家,凭借庞大的市场体量、深厚的文化底蕴和企业数量优势,通过大模型等先进技术的应用,我们在文化产业领域完全可能实现局部超越,缩小产业差距。



AI驱动文化传媒行业战略布局


许卫国:面向未来的AI时代,我们需要提前进行技术布局和投入,您在文化传媒行业深耕多年,目前国内在这个领域都做了哪些方面的工作?


汪莹:在阿里云百炼平台中,TOP50的大客户中有很大一部分来自文化传媒行业,而且大模型的推理TPS量非常高。在这样一个AI快速发展的时代,关于如何提前布局,我有四点思考:


第一,需要统一思想,形成行业共识。主动去拥抱技术变革。前段时间中央广播电视总台发布的《人工智能发展白皮书》,就吹响了技术迭代和变革的冲锋号,这对于整个行业是有非常大的推动和引领作用的;


第二,要做好技术基础设施的双层布局。一方面要建设大模型本身,让业务人员能便捷地通过内外部平台调用模型和AI工具,推动内容制作与创新,另一方面要完善大模型管理工具,把大模型转化为可调用的公共AI资源。


第三,在模型的使用层面要保持开放性。文化传媒行业的从业者们应该以开放心态去调用更多优质模型,换句话说,谁好用就选谁,真正的好模型是通过高频调用量体现的。


第四,要选好合作伙伴。人工智能与行业的融合是新兴领域,要产生实际效果需要坚持业务导向。在模型应用过程中,很多伙伴往往会对短期的效果过于乐观,认为大模型可以替代完成所有工作,但是对长期发展又过于悲观。好的合作伙伴懂模型,又要懂行业,能够将模型能力、技术短板与行业痛点很好地结合,最终让业务成果说话。



AI时代智能算力的演进


许卫国:模型的发展本质上依赖算力,过去我们以CPU为核心的通用算力为主,现在逐渐转向以GPU为核心的智能算力。从您的角度看,目前国内算力发展处于什么阶段?阿里云在这方面有没有成熟的技术产品或经验可以分享?


汪莹:阿里云从09年开始做云计算,现在做到了千亿规模,在云计算这条赛道上积累了比较深厚的技术能力和完备的产品体系。随着算力需求的转变,我们也在从传统的CPU通算体系向GPU智能算力体系转型,云计算需要适应这个变化。


在DeepSeek出现之前,行业建构大模型的时候通常是“暴力美学”的逻辑,意思是谁的芯片堆得越多,谁的模型效果就越好,但DeepSeek的出现证明了算力的投入和模型效果不是完全正相关,很多国内外案例也证实了这一点。未来云计算的发展我不能完全预判,但在支持大模型智算方面有几个方向是明确的。


首先,是统一调度平台的建设。我们需要建设支持CPU与GPU融合的"一云多芯"架构,兼容多种异构芯片;在PaaS层,主流分布式训练框架的兼容性至关重要,因为算力是不是被有效利用、能否稳定输出,都和训练框架息息相关。


第二,是自动化运维能力的突破。能不能实现万卡甚至十万级集群的稳定训练,避免因为网络波动或硬件故障导致损失,这种自动运维和抗风险能力是面向智算时代的云计算核心能力之一。


第三,模型的算力利用率(MFU:Model FLOPS Utilization)很关键。大模型很多是跨集群训练的,有时候即使算力资源充足,如果卡间带宽、显存管理等等环节存在瓶颈,实际使用效率也会大打折扣。智算的集群能力行不行,最后就看MFU,所以对于算力这种统一高效的释放也是非常重要的。


第四,是MaaS体系的完善。我们把传统云计算分为IaaS、PaaS、SaaS,现在新增了一个层级MaaS(Model as a Service)。现在很多企业不再需要从零开发底层大模型,可以通过调用开源模型,然后结合专属数据进行训练,形成自己的定制化模型,所以MaaS层需要提供开放的全流程工具和全生命周期管理能力。当前的云计算平台已经具备了丰富模型资源,但对模型工具的系统化管理和全生命周期服务是否完善,将成为衡量智算时代云计算成熟度的重要标准。我们也在根据市场和客户的需求,逐步把MaaS层做得越来越好。



AI应用中的“最后一公里”难题


许卫国:其实我们在AI应用中遇到了一个瓶颈问题,所谓的“最后一公里”,这个问题从您的角度看能用什么方式解决掉?


汪莹:许老师提出的问题非常关键。今天大模型生态虽然繁荣,看上去很热闹,但真正进入生产环节并产生实际效率的案例比较少,多数应用场景还停留在测试阶段,比如生成诗词、八字分析这些。您提到的“最后一公里”,本质上是模型能力与商业可用性之间的鸿沟。以电视台为例,电视台的采、编、播、存、发和数据统计等环节,跟大模型的衔接适配需要一个过程。目前主流的两三家非线性编辑厂家,它们的语料处理和大模型能力调用也是来自几个头部的大模型厂商。


实际结合的过程有两条路可以走:

第一条路,大模型厂商自主搭建一套电视台非线性编辑生产的全流程体系。但大模型厂商通常缺乏对电视台标准化工作流程,比如三审三校、渲染包装等标准化流程的深度理解,需要重新学习,而且投入产出比难以平衡。一般的大模型厂商不太会选择在一个细分领域垂直深入,基本是做基础模型,然后里面分几个能力,比如说语言模型、多模态模型,阿里就是这两个主流。

第二条路,非线性编辑厂商主动学习大模型能力,重构软件系统。但是多模态模型迭代频繁,可能两个月就更新一次,而且学习新版本时需要克服很多技术障碍,这两条路都是需要花一些力气的。


许卫国:您觉得大模型和非编哪个更有优势呢?还是两者是双向发力的?


汪莹:我觉得是各有各的发力点,对于大模型厂家来说,要不要在这个领域发力,取决于这个产业链的规模、体量。回归到广播电视涉及的生产制作,我认为更现实的路径是非线性编辑软件的厂商去主动适配大模型能力,因为大模型的研发投入是巨大的,而且这个产业是非常垂直、细分的,在这些对技术要求高但产业规模有限的垂直领域,更可行的策略是基于现有大模型能力进行二次开发,通过学习大模型能力重构产品体系,这是一条切实可行的路线。



AI赋能文化传媒行业生产力与传播力倍增


许卫国:现在很多媒体都在做大模型,有的是做个视频,有的是写个稿子,在我们看来这些都属于点状尝试,从您的角度讲,将来大模型会给整个行业带来什么实际的价值吗?


汪莹:开篇的时候咱们也提到了,大模型会重构行业。实际的效果我可以举几个例子,第一个是生产力的倍增,大模型可以为每个编辑都配备一个超级助理,能做到文字处理、策划案分析、后期渲染、脚本撰写等多个任务并行,实现媒体生产和文化创意类的效率提升。在传播力层面同样能实现突破和倍增,比如国际传播需要多语种支持,大模型可以高效完成视频的多语种翻译,并同步调整人脸口型。许老师您说中文和英文的口型肯定不同,但只要您说一遍中文,大模型就能自动调整成您说英文的口型,效果会非常流畅丝滑。


许卫国:我们也期待,未来阿里云能为我们提供更优质的云服务、算力支持和AI大模型。


汪莹:谢谢许老师的点赞和鼓励,阿里云长期深耕云计算和AI,我们相信在大模型技术的推动下,文化传媒行业一定能焕发出新的生命力,我们也希望能借助AI的力量,为中国文化走向世界贡献一份力量。

相关实践学习
如何快速创建插件agent
阿里云百炼应用基于Assistant API技术架构,结合大语言模型(LLM)的推理、知识检索增强、插件调度等能力,构建应对各类复杂场景任务的场景应用。通过集成化、直观易用的产品界面,为开发者提供了丰富的应用配置选项,包括大型语言模型(LLM)选择、Pro
相关文章
|
2月前
|
机器学习/深度学习 人工智能 算法
医学AI推理新突破!MedReason:这个AI把医学论文变「会诊专家」,8B模型登顶临床问答基准
MedReason是由多国顶尖学术机构联合开发的医学推理框架,通过知识图谱增强大模型在医疗领域的逻辑推理能力,其8B参数模型在复杂临床场景中达到最先进水平。
222 18
医学AI推理新突破!MedReason:这个AI把医学论文变「会诊专家」,8B模型登顶临床问答基准
|
7月前
|
机器学习/深度学习 人工智能 算法
整合海量公共数据,谷歌开源AI统计学专家DataGemma
【10月更文挑战第28天】谷歌近期开源了DataGemma,一款AI统计学专家工具,旨在帮助用户轻松整合和利用海量公共数据。DataGemma不仅提供便捷的数据访问和处理功能,还具备强大的数据分析能力,支持描述性统计、回归分析和聚类分析等。其开源性质和广泛的数据来源使其成为AI研究和应用的重要工具,有助于加速研究进展和推动数据共享。
192 6
|
4月前
|
人工智能 自然语言处理 数据可视化
YAYI-Ultra:中国企业终于等来『全能大脑』!开源企业级AI『混合专家』横扫金融舆情中医领域,最长生成20万字报告
YAYI-Ultra 是由中科闻歌研发的企业级大语言模型,具备强大的多领域专业能力和多模态内容生成能力,支持数学、代码、金融等多个领域的专家组合,缓解垂直领域迁移中的“跷跷板”现象。
206 10
YAYI-Ultra:中国企业终于等来『全能大脑』!开源企业级AI『混合专家』横扫金融舆情中医领域,最长生成20万字报告
|
4月前
|
人工智能 JSON 自然语言处理
AI 程序员的4个分身 | 代码生成专家+注释精灵+API集成助手+智能调试伙伴
AI 程序员的4个分身 | 代码生成专家+注释精灵+API集成助手+智能调试伙伴
294 35
|
4月前
|
数据采集 人工智能 编解码
算法系统协同优化,vivo与港中文推出BlueLM-V-3B,手机秒变多模态AI专家
BlueLM-V-3B是由vivo与香港中文大学共同研发的多模态大型语言模型,专为移动设备优化。它通过算法和系统协同优化,实现了高效部署和快速生成速度(24.4 token/s),并在OpenCompass基准测试中取得优异成绩(66.1分)。模型小巧,语言部分含27亿参数,视觉编码器含4000万参数,适合移动设备使用。尽管如此,低端设备可能仍面临资源压力,实际应用效果需进一步验证。论文链接:https://arxiv.org/abs/2411.10640。
135 9
|
5月前
|
人工智能 缓存 Ubuntu
AI+树莓派=阿里P8技术专家。模拟面试、学技术真的太香了 | 手把手教学
本课程由阿里P8技术专家分享,介绍如何使用树莓派和阿里云服务构建AI面试助手。通过模拟面试场景,讲解了Java中`==`与`equals`的区别,并演示了从硬件搭建、语音识别、AI Agent配置到代码实现的完整流程。项目利用树莓派作为核心,结合阿里云的实时语音识别、AI Agent和文字转语音服务,实现了一个能够回答面试问题的智能玩偶。课程展示了AI应用的简易构建过程,适合初学者学习和实践。
198 22
|
10月前
|
人工智能 自然语言处理 搜索推荐
如何10分钟获得一位24小时AI专家助手?
进入百炼控制台创建应用,选通义千问-Plus为模型,可设定Prompt引导对话。测试后若发现不足,可进一步优化。获取API-KEY和应用ID以便API调用,实现网页集成。此AI助手能即时解答用户问题,提供个性化服务及推荐,有效提升用户体验与企业效率,同时降低成本并助力策略规划。随着AI技术进步,这类智能助手将成为日常生活的重要组成部分。
|
6月前
|
机器学习/深度学习 人工智能 智能设计
VisionFM:通用眼科 AI 大模型,具备眼科疾病诊断能力,展现出专家级别的准确性
VisionFM 是一个多模态多任务的视觉基础模型,专为通用眼科人工智能设计。通过预训练大量眼科图像,模型能够处理多种眼科成像模态,并在多种眼科任务中展现出专家级别的智能性和准确性。
295 4
VisionFM:通用眼科 AI 大模型,具备眼科疾病诊断能力,展现出专家级别的准确性
|
7月前
|
人工智能 自然语言处理 算法
【AI问爱答-双十一返场周直播】AI产品专家直播解读重点AI应用场景怎么用?
阿里云【AI问爱答】栏目强势回归,11月25日至28日每晚19:00,连续四天直播,涵盖AI营销、企业办公、社交娱乐及大模型推理调优四大主题,助您深入了解AI应用,解决实际问题。欢迎预约观看!
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术性文章移动应用开发之旅:从新手到专家的蜕变之路
【8月更文挑战第30天】本文将介绍人工智能的基本原理和应用,包括机器学习、深度学习和自然语言处理等。我们将通过代码示例来展示如何使用Python和TensorFlow库实现一个简单的神经网络模型。