D1net阅闻|20万张GPU!马斯克旗下xAI公司正式发布新一代大模型Grok 3

简介: D1net阅闻|20万张GPU!马斯克旗下xAI公司正式发布新一代大模型Grok 3

(来源:企业网D1net)


20万张GPU!马斯克旗下xAI公司正式发布新一代大模型Grok 3


2月18日午间,马斯克旗下xAI公司正式发布新一代大模型Grok 3。马斯克在发布会直播中首次披露了Grok 3的训练成本,称Grok 3训练过程累计消耗20万块英伟达GPU,训练在xAI公司的数据中心完成。Grok 3 发布后有人就第一时间指出:它消耗的算力是 DeepSeek V3 的 263 倍。在大模型竞技场 Chatbot Arena(LMSYS)中,早期 Grok-3 版本的得分取得了第一,达到 1402 分,超过了包括 DeepSeek-R1 在内的所有其他模型。与此同时,Grok-3 支持推理能力,解锁了测试时计算(test-time compute)能力。这意味着竞争激烈的推理模型市场又迎来了一个强劲对手。


OpenAI要开源新模型?CEO奥尔特曼公开征求意见


OpenAI 首席执行官萨姆・奥尔特曼于当地时间2月17日在 X 社交平台上发文,就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向:一种是“相当小但仍需在 GPU 上运行的 o3-mini 级模型”,另一种则是“尽可能优化的手机大小模型”。这或许意味着 OpenAI 即将开源新的大模型,也将是 2019 年 OpenAI 开源 GPT-2 之后再次开源某个大模型。


DeepSeek推出NSA,用于超快速的长上下文训练和推理


DeepSeek推出NSA。DeepSeek称,NSA是一种与硬件一致且本机可训练的稀疏注意力机制,用于超快速的长上下文训练和推理。通过针对现代硬件的优化设计,NSA加快了推理速度,同时降低了预训练成本,而不会影响性能。在一般基准测试、长上下文任务和基于指令的推理上,它的表现与完全注意力模型相当甚至更好。


腾讯回应“接入DeepSeek”:不会使用用户朋友圈、聊天记录


2月19日讯,近期,微信宣布接入DeepSeek-R1模型,目前为灰度测试阶段,部分用户在微信搜索框选择AI搜索,可使用DeepSeek-R1的深度思考功能。微信AI搜索功能为什么要接入大模型?腾讯对此表示,大模型可以提升搜索的智能化和精准度,如更好的理解大家的搜索意图,分析和处理复杂的查询内容等。结合大家的需求,微信在搜索场景中接入了包括混元、DeepSeek在内的大模型,进一步丰富用户的搜索体验。对于微信AI搜索是否会用到大家微信内的朋友圈、聊天等个人信息的问题,腾讯表示:不会。


传台积电可能收购英特尔代工部门20%股权


美国科技媒体《wccftech》报导称,台积电可能收购英特尔代工服务部门(IFS)20%股权。反垄断法通常会阻止大企业合并,但20%的持股将让台积电得以与英特尔合作,同时回避监督审查。最新消息暗示,台积电将取得英特尔少数股权,与此同时,美国芯片设计大厂高通与博通可能在该交易扮演重要角色,因为这两家公司可能透过向新实体下单,确保其顺利过渡到营运状态,协助完成该交易。对于高通与博通而言,投资英特尔的IFS将使其更能与台湾的联发科竞争。


月之暗面收缩投放 知情人士称近期自然新增用户量增长


有报道称kimi开发公司月之暗面近期决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。对此,知情人士对记者表示,近期Kimi自然新增用户量猛涨。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
打赏
0
0
0
0
317
分享
相关文章
阿里云ACK One:注册集群云上节点池(CPU/GPU)自动弹性伸缩,助力企业业务高效扩展
在当今数字化时代,企业业务的快速增长对IT基础设施提出了更高要求。然而,传统IDC数据中心却在业务存在扩容慢、缩容难等问题。为此,阿里云推出ACK One注册集群架构,通过云上节点池(CPU/GPU)自动弹性伸缩等特性,为企业带来全新突破。
2025年阿里云GPU服务器租用价格、选型策略与应用场景详解
随着AI与高性能计算需求的增长,阿里云提供了多种GPU实例,如NVIDIA V100、A10、T4等,适配不同场景。2025年重点实例中,V100实例GN6v单月3830元起,适合大规模训练;A10实例GN7i单月3213.99元起,适用于混合负载。计费模式有按量付费和包年包月,后者成本更低。针对AI训练、图形渲染及轻量级推理等场景,推荐不同配置以优化成本和性能。阿里云还提供抢占式实例、ESSD云盘等资源优化策略,支持eRDMA网络加速和倚天ARM架构,助力企业在2025年实现智能计算的效率与成本最优平衡。 (该简介为原文内容的高度概括,符合要求的字符限制。)
部署DeepSeek但IDC GPU不足,阿里云ACK Edge虚拟节点来帮忙
介绍如何使用ACK Edge与虚拟节点满足DeepSeek部署的弹性需求。
阿里云当选UALink联盟董事会成员,推进新一代GPU互连技术!
阿里云当选UALink联盟董事会成员,推进新一代GPU互连技术!
59 2
2025年阿里云GPU服务器的租赁价格与选型指南
随着AI、深度学习等领域的发展,GPU服务器成为企业及科研机构的核心算力选择。阿里云提供多种GPU实例类型(如NVIDIA V100、A100等),涵盖计算型、共享型和弹性裸金属等,满足不同场景需求。本文详解2025年阿里云GPU服务器的核心配置、价格策略及适用场景,帮助用户优化选型与成本控制,实现高效智能计算。
阿里云gpu云服务器租用价格:最新收费标准及活动价格参考
阿里云gpu云服务器多少钱?A10卡GN7i GPU云服务器32核188G3213.99/1个月起,V100卡GN6v GPU云服务器8核32G3830.00/1个月起,阿里云GPU云服务器是基于GPU应用的计算服务,多适用于视频解码,图形渲染,深度学习,科学计算等应用场景,该产品具有超强计算能力、网络性能出色、购买方式灵活、高性能实例存储( GA1和GN5特有)等特点。下面小编来介绍下阿里云gpu云服务器最新的收费标准及活动价格。
部署DeepSeek但IDC GPU不足,阿里云ACK Edge虚拟节点来帮忙
部署DeepSeek但IDC GPU不足,阿里云ACK Edge虚拟节点来帮忙

热门文章

最新文章