当下,“人工智能+”行动正在全社会如火如荼地进行,在数字经济与智能技术的双轮驱动下,文化传媒与广电视听行业正在经历一场深刻的范式变革。云计算与人工智能的深度融合,不仅重构了媒体内容生产、分发与运营的全流程,更以新质生产力的姿态,为行业注入了澎湃的新动能。截至2025年,我国AI核心产业规模预计将突破万亿,文化传媒行业作为技术应用的创新先锋阵地,也正以年均两位数的增速迈向智能化新阶段。
在2025 CCBN活动现场的“CMG创新技术访谈”直播访谈栏目中,中央广播总台技术局新闻制播三部应用管理科负责人许卫国与阿里云智能集团文化传媒行业总经理汪莹展开了一场深入的技术访谈,探讨了云计算与人工智能如何驱动行业升级,展望了大模型、算力革新及行业应用的未来新图景。(点击下方图片观看视频)
大模型重构文化消费业态
许卫国:我的第一个问题,当下AI作为新质生产力的排头兵,在各行各业都引起了强烈的关注,从您的角度看,目前文化传媒行业有哪些发展趋势?
汪莹:我的体会是,大模型等AI技术的爆发式发展将重构文化消费形态,这里我想引用王坚院士的一句话——大模型AI不是工具的革命,而是革命的工具。
当前中美文化消费市场存在两个「6万亿」:美国每年的文化消费市场GDP约6万亿美元,中国是6万亿人民币,虽然数字是一样的,但这之间就是7倍的汇率差距,而且,美国的文化消费占比全国GDP约20%,中国却不足5%。这种差距主要源于美国在文化、娱乐、影音等领域的数字化起步比较早,消费者习惯培养比较成熟。但大模型是一个新的起点,就像当年互联网时代催生了电商行业的超越式的发展,那些没能及时用互联网改造产业链的企业,十年后多多少少都面临着转型压力。在今天,能用好大模型重构文化消费体验的产业链参与者可能就会有更高更好的发展空间。
最近我在关注中美对比研究,大家都知道,美国在信用卡时代处于领先地位,但在移动支付领域我们实现了反超。目前我们国内拥有30万家文化类企业,美国约10万家,凭借庞大的市场体量、深厚的文化底蕴和企业数量优势,通过大模型等先进技术的应用,我们在文化产业领域完全可能实现局部超越,缩小产业差距。
AI驱动文化传媒行业战略布局
许卫国:面向未来的AI时代,我们需要提前进行技术布局和投入,您在文化传媒行业深耕多年,目前国内在这个领域都做了哪些方面的工作?
汪莹:在阿里云百炼平台中,TOP50的大客户中有很大一部分来自文化传媒行业,而且大模型的推理TPS量非常高。在这样一个AI快速发展的时代,关于如何提前布局,我有四点思考:
第一,需要统一思想,形成行业共识。主动去拥抱技术变革。前段时间中央广播电视总台发布的《人工智能发展白皮书》,就吹响了技术迭代和变革的冲锋号,这对于整个行业是有非常大的推动和引领作用的;
第二,要做好技术基础设施的双层布局。一方面要建设大模型本身,让业务人员能便捷地通过内外部平台调用模型和AI工具,推动内容制作与创新,另一方面要完善大模型管理工具,把大模型转化为可调用的公共AI资源。
第三,在模型的使用层面要保持开放性。文化传媒行业的从业者们应该以开放心态去调用更多优质模型,换句话说,谁好用就选谁,真正的好模型是通过高频调用量体现的。
第四,要选好合作伙伴。人工智能与行业的融合是新兴领域,要产生实际效果需要坚持业务导向。在模型应用过程中,很多伙伴往往会对短期的效果过于乐观,认为大模型可以替代完成所有工作,但是对长期发展又过于悲观。好的合作伙伴懂模型,又要懂行业,能够将模型能力、技术短板与行业痛点很好地结合,最终让业务成果说话。
AI时代智能算力的演进
许卫国:模型的发展本质上依赖算力,过去我们以CPU为核心的通用算力为主,现在逐渐转向以GPU为核心的智能算力。从您的角度看,目前国内算力发展处于什么阶段?阿里云在这方面有没有成熟的技术产品或经验可以分享?
汪莹:阿里云从09年开始做云计算,现在做到了千亿规模,在云计算这条赛道上积累了比较深厚的技术能力和完备的产品体系。随着算力需求的转变,我们也在从传统的CPU通算体系向GPU智能算力体系转型,云计算需要适应这个变化。
在DeepSeek出现之前,行业建构大模型的时候通常是“暴力美学”的逻辑,意思是谁的芯片堆得越多,谁的模型效果就越好,但DeepSeek的出现证明了算力的投入和模型效果不是完全正相关,很多国内外案例也证实了这一点。未来云计算的发展我不能完全预判,但在支持大模型智算方面有几个方向是明确的。
首先,是统一调度平台的建设。我们需要建设支持CPU与GPU融合的"一云多芯"架构,兼容多种异构芯片;在PaaS层,主流分布式训练框架的兼容性至关重要,因为算力是不是被有效利用、能否稳定输出,都和训练框架息息相关。
第二,是自动化运维能力的突破。能不能实现万卡甚至十万级集群的稳定训练,避免因为网络波动或硬件故障导致损失,这种自动运维和抗风险能力是面向智算时代的云计算核心能力之一。
第三,模型的算力利用率(MFU:Model FLOPS Utilization)很关键。大模型很多是跨集群训练的,有时候即使算力资源充足,如果卡间带宽、显存管理等等环节存在瓶颈,实际使用效率也会大打折扣。智算的集群能力行不行,最后就看MFU,所以对于算力这种统一高效的释放也是非常重要的。
第四,是MaaS体系的完善。我们把传统云计算分为IaaS、PaaS、SaaS,现在新增了一个层级MaaS(Model as a Service)。现在很多企业不再需要从零开发底层大模型,可以通过调用开源模型,然后结合专属数据进行训练,形成自己的定制化模型,所以MaaS层需要提供开放的全流程工具和全生命周期管理能力。当前的云计算平台已经具备了丰富模型资源,但对模型工具的系统化管理和全生命周期服务是否完善,将成为衡量智算时代云计算成熟度的重要标准。我们也在根据市场和客户的需求,逐步把MaaS层做得越来越好。
AI应用中的“最后一公里”难题
许卫国:其实我们在AI应用中遇到了一个瓶颈问题,所谓的“最后一公里”,这个问题从您的角度看能用什么方式解决掉?
汪莹:许老师提出的问题非常关键。今天大模型生态虽然繁荣,看上去很热闹,但真正进入生产环节并产生实际效率的案例比较少,多数应用场景还停留在测试阶段,比如生成诗词、八字分析这些。您提到的“最后一公里”,本质上是模型能力与商业可用性之间的鸿沟。以电视台为例,电视台的采、编、播、存、发和数据统计等环节,跟大模型的衔接适配需要一个过程。目前主流的两三家非线性编辑厂家,它们的语料处理和大模型能力调用也是来自几个头部的大模型厂商。
实际结合的过程有两条路可以走:
第一条路,大模型厂商自主搭建一套电视台非线性编辑生产的全流程体系。但大模型厂商通常缺乏对电视台标准化工作流程,比如三审三校、渲染包装等标准化流程的深度理解,需要重新学习,而且投入产出比难以平衡。一般的大模型厂商不太会选择在一个细分领域垂直深入,基本是做基础模型,然后里面分几个能力,比如说语言模型、多模态模型,阿里就是这两个主流。
第二条路,非线性编辑厂商主动学习大模型能力,重构软件系统。但是多模态模型迭代频繁,可能两个月就更新一次,而且学习新版本时需要克服很多技术障碍,这两条路都是需要花一些力气的。
许卫国:您觉得大模型和非编哪个更有优势呢?还是两者是双向发力的?
汪莹:我觉得是各有各的发力点,对于大模型厂家来说,要不要在这个领域发力,取决于这个产业链的规模、体量。回归到广播电视涉及的生产制作,我认为更现实的路径是非线性编辑软件的厂商去主动适配大模型能力,因为大模型的研发投入是巨大的,而且这个产业是非常垂直、细分的,在这些对技术要求高但产业规模有限的垂直领域,更可行的策略是基于现有大模型能力进行二次开发,通过学习大模型能力重构产品体系,这是一条切实可行的路线。
AI赋能文化传媒行业生产力与传播力倍增
许卫国:现在很多媒体都在做大模型,有的是做个视频,有的是写个稿子,在我们看来这些都属于点状尝试,从您的角度讲,将来大模型会给整个行业带来什么实际的价值吗?
汪莹:开篇的时候咱们也提到了,大模型会重构行业。实际的效果我可以举几个例子,第一个是生产力的倍增,大模型可以为每个编辑都配备一个超级助理,能做到文字处理、策划案分析、后期渲染、脚本撰写等多个任务并行,实现媒体生产和文化创意类的效率提升。在传播力层面同样能实现突破和倍增,比如国际传播需要多语种支持,大模型可以高效完成视频的多语种翻译,并同步调整人脸口型。许老师您说中文和英文的口型肯定不同,但只要您说一遍中文,大模型就能自动调整成您说英文的口型,效果会非常流畅丝滑。
许卫国:我们也期待,未来阿里云能为我们提供更优质的云服务、算力支持和AI大模型。
汪莹:谢谢许老师的点赞和鼓励,阿里云长期深耕云计算和AI,我们相信在大模型技术的推动下,文化传媒行业一定能焕发出新的生命力,我们也希望能借助AI的力量,为中国文化走向世界贡献一份力量。