(来源:企业网D1net)
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈
DeepSeek放出了开源周首日的重磅炸弹——FlashMLA。这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核,特别针对变长序列进行了优化,目前已正式投产使用。注意,DeepSeek训练成本极低的两大关键,一个是MoE,另一个就是MLA。经实测,FlashMLA在H800 SXM5平台上(CUDA 12.6),在内存受限配置下可达最高3000GB/s,在计算受限配置下可达峰值580 TFLOPS。
苹果计划未来四年在美国投资超过5000亿美元 为其有史以来最大规模的支出承诺
苹果公司宣布了其有史以来最大规模的支出承诺,计划在未来四年内在美国投入和投资超过5000亿美元。这项新承诺建立在Apple投资于美国创新和先进高技能制造的悠久历史之上,并将支持一系列专注于人工智能、芯片工程和全国学生和工人技能发展的计划。这笔5000亿美元的承诺包括Apple与全美50个州的数千家供应商合作、直接就业、AppleIntelligence基础设施和数据中心、企业设施,以及20个州的AppleTV+制作。
消息称英伟达包下台积电今年超70%的先进封装产能
业界消息称,英伟达最新Blackwell构架GPU芯片需求强劲,已包下台积电今年超过70%的CoWoS-L先进封装产能,出货量以每季环比增长20%以上逐季冲高。
消息称AMD拟以40亿美元出售数据中心工厂,部分台企成潜在买家
据彭博社援引知情人士消息称,AMD 正在与几家亚洲企业就出售其去年收购的数据中心制造工厂展开谈判。这些企业包括台湾地区的广达电子、英业达、和硕联合以及纬创资通等。知情人士表示,这些工厂的总价值可能在30-40亿美元之间,包括债务。消息人士表示,交易可能会在今年第二季度宣布。谈判仍在进行中,目前尚不确定 AMD 是否能够达成协议。
多地政务系统接入DeepSeek
“整体上,DeepSeek大模型的接入,对‘智慧政府’有较大的推进作用。”香港科技大学助理教授、香港生成式人工智能研发中心预研部主任韩斯睿告诉澎湃新闻记者,随着人工智能技术的快速发展,“AI+政务”成为推动政府治理现代化的重要路径。各地接入DeepSeek大模型,通过智能问答、政策解读等功能提升服务效率,推动“一网通办”“跨省通办”等模式创新,并赋能智慧城市建设。AI大模型技术快速发展,已成为推动各行各业变革的核心力量之一。近日,DeepSeek的“朋友圈”快速扩容。各级地方政府接入DeepSeek向公民提供政务服务成为热潮。深圳、广州、呼和浩特、赣州、无锡、临沂等地政府均宣布在政务系统中接入DeepSeek模型,将在内容生成和智能交互等方面显著提升政务办公效率。
深圳:大力发展平台经济等各种经济形态 加强人工智能等前沿技术研究应用
深圳市委书记孟凡利2月24日参加市政协七届五次会议联组讨论“推动深圳平台经济与实体经济融合发展”座谈会,与委员们深入交流,听取大家的意见建议。孟凡利指出,深圳要围绕建设具有深圳特点和深圳优势的现代化产业体系的目标,大力发展平台经济等各种经济形态,坚定支持各类平台规范健康持续快速发展。加强人工智能等前沿技术研究应用,加快发展壮大工业互联网,大力培育、引进各种功能的大中小平台,加快提升产品和服务国际竞争力。发挥好平台经济推动新质生产力发展、推动制造业优化升级、促进消费扩大需求、开拓国际市场、稳就业惠民生等方面重要作用,加快平台经济高质量发展,使平台更好为实体经济发展、为经济中心城市建设作更大贡献,充分发挥平台经济在全市高质量发展中的重要作用。
Anthropic发布新模型Claude 3.7 Sonnet!兼备“推理模式”与“传统模式”
Anthropic周一发布名为Claude 3.7 Sonnet的模型,该公司表示,这是其有史以来“最智能”的AI模型,称这种“混合型”模型同时具备“推理模式”(停下来思考复杂答案)与传统模式(实时生成答案)的能力,并表示该模型是市面上唯一的此类“混合”模型。分析认为,这一举措或许能为Anthropic在与对手OpenAI以及那些投入巨资开发AI模型的大型科技公司的竞争中赢得急需的优势。