用行动回应“实体清单”,智谱发布了一系列新模型

简介: 1月15日,美国商务部将25个中国实体列入出口管制实体清单,其中包括智谱及其子公司。面对制裁,智谱迅速回应,表示不会影响业务,并于次日发布全新端到端模型GLM-Realtime、升级GLM-4-Air和GLM-4V-Plus模型,推出免费的Flash系列普惠模型。这些举措展示了智谱在多模态交互、视频理解、语音交互等领域的技术实力,体现了中国AI企业在自主创新和自主可控方面的坚定决心。此举不仅彰显了智谱的技术硬实力,也为中国AI产业的自立自强树立了榜样。

1月15日晚间,美国商务部工业和安全局(BIS)修订了《出口管制条例》(EAR),以安全为由在实体清单中分两批增加了25个中国实体。

其中就包括智谱及其子公司,也是国内首家被美国列入实体清单的大模型初创企业。

当天晚上,智谱官方就作出了公开回应,除了强烈反对美国的恶意打压,还特意写了这样一段话:鉴于智谱掌握全链路大模型核心技术的事实,被列入实体清单不会对公司业务产生实质影响。

到了1月16日下午,智谱正式做出行动:发布了全新的端到端模型GLM-Realtime;同步升级了GLM-4-Air和GLM-4V-Plus模型;特别设立 Flash 系列普惠模型,向全社会免费开放。

前脚刚被美国”制裁“,后脚就上新模型,颇为几分”掀桌子硬刚“的味道。

而坊间也一直流传着这样一种说法——被美国列入“实体清单”,相当于是对一家企业硬实力的认证。

正式被美国“盖章认证”的智谱,这次给出了哪些黑科技?对中国AI产业的自主自强又有哪些启示?

让我们一一揭晓。

1、会唱歌、低延迟、可以Function Call的GLM-Realtime
四个多月前,智谱清言APP上线了“视频通话”功能,成为首个可以通过文本、音频、图像和视频来进行多模态互动和实时推理的AI助手,让很多人养成了和“小智”打视频电话的习惯。

基于对多模态模型的理解与研发积累,智谱发布了全新的端到端模型GLM-Realtime,能力再次进阶。(感兴趣的小伙伴,可以观看智谱官网的视频演示,详细了解GLM-Realtime的“神奇能力”。)

视频理解与语音交互:支持长达2分钟的内容记忆能力,能够实时处理视频和语音输入。

清唱功能:创新性地实现了清唱功能,首次让大模型具备在对话中的歌唱能力,进一步增强了交互的趣味性和实用性。

Function Call 功能:支持调用外部知识和工具,扩展了模型在商业场景中的应用范围。目前Function Call 功能已经加入到GLM-Realtime API,将极大拓展技术在商业场景中的实用性。

目前GLM-Realtime API已经上线智谱开放平台bigmodel.cn,对标GPT-4o的意味十足,而且现阶段可以免费调用。

比如集成到智能眼镜、陪伴娃娃等产品中,相当于有了“嘴巴和眼睛”,将重构智能硬件的用户体验。

2、GLM-4-Air能力全面升级,且价格下降了50%
作为GLM-4 系列的高性价比版本,GLM-4-Air上线以来受到了很多开发者的青睐。

这一次,智谱发布了全面升级的GLM-4-Air-0111,带来了显著提升:通过优化训练数据和流程,在部分维度上接近 GLM-4-Plus 的性能。

与此同时, GLM-4-Air-0111模型价格降价到原来的50%,再次降低大模型应用的门槛。

3、升级版的GLM-4V-Plus,覇榜多个公开榜单
视觉理解模型GLM-4V-Plus也进行了全面升级,新版本在多个公开榜单上均展现出显著的效果提升(对比的对象不乏Gemini-2.0、GPT-4o、Claude 3.5等美国企业最新的标杆模型)。

支持变分辨率功能:适应不同尺寸的图像,显著降低小图场景下的 token 消耗。同时支持4K超清图像和极致长宽比图像的无损识别。
长视频处理能力:具备长达2小时的视频理解能力,适用于长视频分析和复杂场景的精准识别。
Case1:大模型色盲检测

Case2:看图讲故事

4、Flash 系列普惠模型全免费
致力于“大模型普惠”的智谱,为助力所有开发者更便捷地利用大模型进行创新,专门设置了针对全社会免费开放 Flash 系列普惠模型 API,涵盖语言、文生图、文生视频及图像理解等多个场景。

作为行业首个全模态的免费系列模型,开发者可以免费调用语言、多模态理解、多模态生成功能。

近期Flash系列也将全面升级,Flash全模态全家桶成员包括:语言模型 GLM-4-Flash、图像理解模型 GLM-4V-Flash、图像生成模型 CogView-3-Flash和视频生成模型 CogVideoX-Flash。

写在最后
如果是在三年前,被美国列入出口管制实体清单,可能会让不少企业诚惶诚恐,现在则要另当别论。

一方面,华为在内的企业已经证实,所谓的封锁和打压并不能阻碍中国科技的创新进程,反而会助推国内企业走向自立自强之路,构建出自主可控的技术、产品和生态体系。

另一方面,智谱自创立起就选择了自研路线,并未对美国的产品和技术形成深度依赖。被列入“实体清单”后,势必会加速智谱的内生研发进程,不断完善底层能力和产业合作。

何况,智谱的态度非常强硬,第二天就发布了一系列新模型,显然已经做好了用自主创新应对外部压力的准备。同时身体力行地提醒中国科技行业,自主创新能力永远是打破封锁的最佳武器。

2024年是大模型落地应用的元年,2025年大模型的落地进程将愈演愈烈。

美国在这个时候“制裁”智谱,可以说是阻止中国AI产业创新的又一次尝试,预示着大模型行业正在进入新的拐点。

只是就结果来看,一时的打压或封锁,无法削弱中国AI参与全球竞争的决心。智谱已经用行动给出了铿锵有力的回答:放弃幻想,开始战斗,中国AI将在自力更生的路上越走越远。

相关文章
|
缓存 前端开发 Java
nacos常见问题之开启鉴权后客户端报403升级版本如何解决
Nacos是阿里云开源的服务发现和配置管理平台,用于构建动态微服务应用架构;本汇总针对Nacos在实际应用中用户常遇到的问题进行了归纳和解答,旨在帮助开发者和运维人员高效解决使用Nacos时的各类疑难杂症。
2977 0
|
人工智能 编解码 自然语言处理
CogView-3-Flash:智谱首个免费AI图像生成模型,支持多种分辨率,快速生成创意图像
CogView-3-Flash 是智谱推出的首个免费AI图像生成模型,支持多种分辨率,快速生成高质量图像,广泛应用于广告、设计、艺术创作等领域。
914 6
CogView-3-Flash:智谱首个免费AI图像生成模型,支持多种分辨率,快速生成创意图像
|
12月前
|
XML JSON Java
Java 反射:从原理到实战的全面解析与应用指南
本文深度解析Java反射机制,从原理到实战应用全覆盖。首先讲解反射的概念与核心原理,包括类加载过程和`Class`对象的作用;接着详细分析反射的核心API用法,如`Class`、`Constructor`、`Method`和`Field`的操作方法;最后通过动态代理和注解驱动配置解析等实战场景,帮助读者掌握反射技术的实际应用。内容翔实,适合希望深入理解Java反射机制的开发者。
960 13
|
人工智能 数据库
Poetry2Image:专为中文古诗词设计的图像生成校正框架,增强了诗歌内容与模型生成图像之间的一致性
Poetry2Image 是一个专为中文古诗词图像生成设计的迭代校正框架,通过自动化反馈和校正循环,提升诗歌与图像之间的一致性,有效捕捉诗歌的语义和艺术精髓。
621 11
Poetry2Image:专为中文古诗词设计的图像生成校正框架,增强了诗歌内容与模型生成图像之间的一致性
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
1926 4
数据分析的 10 个最佳 Python 库
|
机器学习/深度学习 API
重磅!阿里云百炼上线Qwen百万长文本模型
重磅!阿里云百炼上线Qwen百万长文本模型
1295 11
重磅!阿里云百炼上线Qwen百万长文本模型
|
JavaScript 数据可视化
JS如何优雅的实现模块自动滚动展示
【8月更文挑战第22天】JS如何优雅的实现模块自动滚动展示
502 1
JS如何优雅的实现模块自动滚动展示
|
Windows
win11出现:终止代码:SYSTEM SERVICE EXCEPTION解决方案实列(不懂请私信up主)
终止代码解释:SYSTEM_SERVICE_EXCEPTION,又称为异常处理程序,是一种常见的蓝屏错误码,代表Windows系统检测到内核代码发生错误,无法响应某些系统服务,而且无法继续运行。它特别容易发生在许多设备驱动程序中,如显示驱动程序和音频驱动程序,因为他们成为Windows系统的必要组成部分。
4449 0
|
JSON JavaScript 数据格式
vue导出excel表格vue-json-excel(最新超容易详细教程)
最近写项目有个功能需要将表格数据导出为excel表格,本文使用vue-json-excel插件实现该功能
2794 0
vue导出excel表格vue-json-excel(最新超容易详细教程)
|
机器学习/深度学习 并行计算 PyTorch
如何搭建深度学习的多 GPU 服务器
如何搭建深度学习的多 GPU 服务器
1149 5
如何搭建深度学习的多 GPU 服务器