【通义】AI视界|谷歌Q3财报:Gemini API六个月增长14倍,公司超25%的新代码由AI生成

本文涉及的产品
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 本文内容由通义自动生成,涵盖谷歌Q3财报、马斯克xAI融资、九巨头联盟挑战英伟达、Meta加大AI投入及麻省理工研究LLM与人脑相似性等热点资讯。更多精彩内容,请访问通通知道。

本文内容均由【通义】自动生成,打开通通知道,更多精彩资讯等你获取~

24小时精选 ✦

  1. 谷歌Q3财报:Gemini API六个月增长14倍,公司超25%的新代码由AI生成
  2. 马斯克旗下xAI洽谈新一轮融资:半年估值增超六成,达400亿美元
  3. 九巨头联盟挑战英伟达 AI 数据中心互联领导地位
  4. 扎克伯格透露 Meta 加大 AI 投入,元宇宙再亏44亿美元
  5. 麻省理工最新研究表明,LLM的内部结构和人脑有相似之处

01 谷歌Q3财报:Gemini API六个月增长14倍,公司超25%的新代码由AI生成

在2024年第三季度的财报中,谷歌母公司Alphabet展示了强劲的业绩增长,尤其是其AI相关产品和服务。


谷歌CEO桑德·皮查伊提到,Gemini API的调用量在过去的六个月内增加了近14倍,显示了强大的多模态能力,并推动了客户如Snap的创新。公司超过25%的新代码由AI生成,这不仅提升了生产效率,也促进了收入增长。同时,推出了一系列基于AI的产品,例如基于Gemini的AI聊天机器人"Gems"、Google Meet的自动AI笔记功能,以及帮助YouTube创作者的生成式AI工具。皮查伊还表示,谷歌云业务持续强劲增长,部分原因是由于AI技术的应用,如AI基础设施、企业AI平台Vertex、数据平台BigQuery、AI驱动的网络安全解决方案以及应用程序产品组合等。


人工智能技术在谷歌未来十年发展中处于核心地位,特别是在搜索引擎和智能助手Google Assistant服务上的应用。随着AI的发展,谷歌将有机会不断创新其核心产品,各业务和AI的结合也会更加紧密。

02 马斯克旗下xAI洽谈新一轮融资:半年估值增超六成,达400亿美元

特斯拉CEO埃隆·马斯克旗下的AI初创公司xAI正在进行融资谈判,该轮谈判有望将公司的估值推升至约400亿美元。xAI成立不到16个月,其生成式人工智能聊天机器人Grok还未满一岁,在之前的B轮融资中,主要投资者包括了安德森·霍洛维茨基金(Andreessen Horowitz)和红杉资本(Sequoia Capital)。


为了支持xAI的技术发展,马斯克投入了大量资源建设超级人工智能训练集群“Colossus”,该集群包含了超过10万颗英伟达H100 GPU,并计划在未来几个月内再增加10万颗GPU,其中一半将是更先进的H200型号。马斯克表示,最终目标是拥有一个包含20万颗H100和H200芯片的训练集群,这将进一步提升xAI的算力。目前融资谈判仍处于初期阶段,因此最终的融资金额和条件可能会有所变化,甚至存在谈判破裂的可能性。如谈判顺利,从今年5月的B轮融资后估值240亿美元,到现在估值达到400亿美元,意味着在不到半年的时间里,估值增长了超过60%。


xAI的融资行动正值OpenAI完成66亿美元融资之后,OpenAI投后估值达到1570亿美元。OpenAI在这轮融资中加入了排他性条款,要求投资者不支持其竞争对手,包括xAI。这两家公司的融资活动无疑加剧了硅谷在生成式AI技术领域的竞争。

03 九巨头联盟挑战英伟达 AI 数据中心互联领导地位

由 AMD、亚马逊 AWS、Astera Labs、思科、谷歌、慧与、英特尔、Meta 和微软 9 家企业发起的 Ultra Accelerator Link Consortium正式成立并邀请新成员加入。


联盟成立的主要目标是为AI Pod和集群中的加速器与交换机之间的纵向扩展通信定义一种高速、低延迟的互联规范。这一规范旨在挑战英伟达的NVLink等现有互联技术在该领域的主导地位。该联盟的成立体现了行业巨头们在推动技术标准化方面达成共识,共同致力于解决AI数据中心互联的挑战。UALink联盟主席Kurtis Bowman认为,UALink 1.0规范的发布是一个重要的里程碑,它将有助于展示跨行业合作的好处。


UALink联盟的成立不仅是为了制定新的行业标准,更是为了推动整个AI生态系统的发展,通过降低延迟和提高带宽来支持更大规模的AI模型训练和推理任务。此前中国首席经济学家论坛理事刘煜辉也提出,由于AI所代表的新技术革命到了转换的关键窗口期,AI所带来的巨大利益面临着重新归置和分配。“像英伟达分掉蛋糕的80%、90%,这样的状态一定要重新分配,否则会严重制约AI对经济的进一步渗透,会成为AI渗透得严重障碍”。


04 扎克伯格透露 Meta 加大 AI 投入,元宇宙再亏44亿美元

Meta在今日发布了截至9月30日的2024财年第三季度财报,财报显示了公司在多个方面取得了不错的成绩,但也面临着一些挑战。Meta第三季度营收为405.89亿美元,与去年同期的341.46亿美元相比增长了19%。元宇宙业务(Reality Labs)在第三季度营业亏损44.28亿美元,与去年同期亏损扩大了18%。


扎克伯格在财报中将本季度的良好业绩归功于AI进展,特别是Meta AI、Llama大语言模型的采用以及AI驱动眼镜方面的强劲势头。他提到,AI对广告业务产生了积极的促进作用,已有超过100万广告主使用Meta的生成式AI广告工具。扎克伯格还表示,尽管元宇宙业务仍在亏损,但Meta将继续在该领域进行大量投资,尤其是在AI基础设施方面,预计会继续在该领域进行大量投资。


扎克伯格相信AI将是Meta的一个转折点,同时也是今年股价上涨的原因。在之后的产品布局和发展上,将有更多Meta旗下的产品和AI进行更深的交互和融合。

05 麻省理工最新研究表明,LLM的内部结构和人脑有相似之处

麻省理工学院(MIT)的Max Tegmark团队发表了一项引人注目的研究,揭示了大型语言模型(LLM)内部结构与人脑结构之间惊人的相似性。这项研究聚焦于LLM中稀疏自编码器(Sparse Autoencoders, SAE)的特征向量表示,发现LLM在不同的空间尺度上展现出复杂的结构特征。


研究者在SAE特征的点云中发现了“晶体结构”,这些结构反映了概念之间的语义关系,类似于“男人-女人-国王-王后”的关系,它们形成了近似的平行四边形或梯形。在中等尺度上,SAE特征展示出类似人脑的空间模块化特征,功能相似的SAE特征在几何上也相似,它们在激活空间中形成“脑叶”。在最大的尺度上,特征点云表现出特征值的幂律分布,并且聚类熵在中间层达到峰值。


LLM的学习概念中存在着令人惊讶的几何结构,这为理解LLM的内部表征和处理机制提供了新的视角。研究者们使用了多种统计方法来量化这些发现,并证明了这些结构不仅仅是偶然的,而是具有统计显著性的。这项研究强调了数学和几何原则在理解LLM及潜在的硅基智能体行为中的作用,暗示了自然法则可能并不仅限于碳基生命形式。

相关实践学习
1分钟部署经典小游戏
本场景介绍如何使用Serverless应用引擎SAE 1分钟快速部署经典小游戏。
SAE的功能与使用入门
欢迎来到《SAE的功能与使用入门》,本课程是“云原生Serverless Clouder认证“系列中的第三阶段。课程将向您介绍阿里云Serverless应用引擎(SAE)服务相关的概念、特性与使用方式。通过课程将带您逐步深入探索Serverless世界,借助SAE服务,即使没有丰富的云计算和IT经验,也能够让开发人员在实际业务场景中便捷的掌握如何构建和部署应用程序,快速拥抱Serverless架构,将精力聚焦在应用代码和业务逻辑的实现上。 学习完本课程后,您将能够: 掌握Serverless应用引擎(SAE)的基本概念与核心优势 了解Serverless应用引擎(SAE)的核心功能 掌握使用Serverless应用引擎(SAE)的开发和部署流程 了解Serverless应用引擎(SAE)的适用场景和最佳实践  
相关文章
|
5天前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
79 10
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
|
3天前
|
人工智能 JSON 安全
DeepSeek Engineer:集成 DeepSeek API 的开源 AI 编程助手,支持文件读取、编辑并生成结构化响应
DeepSeek Engineer 是一款开源AI编程助手,通过命令行界面处理用户对话并生成结构化JSON,支持文件操作和代码生成。
73 5
DeepSeek Engineer:集成 DeepSeek API 的开源 AI 编程助手,支持文件读取、编辑并生成结构化响应
|
23天前
|
机器学习/深度学习 人工智能 自然语言处理
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型,以Agent技术为核心,支持多种数据类型的输入与输出,具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。
132 20
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
智谱AI推出的GLM-4V-Flash是一款专注于图像理解的免费开放大模型,提供API接口支持用户上传图片URL或Base64编码图片获取详细的图像描述。该模型通过深度学习和卷积神经网络技术,简化了图像分析流程,提高了开发效率,适用于内容审核、辅助视障人士、社交媒体、教育和电子商务等多个应用场景。
132 14
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
|
1天前
|
人工智能 IDE API
AI驱动的开发者工具:打造沉浸式API集成体验
本文介绍了阿里云在过去十年中为开发者提供的API服务演变。内容分为两大部分:一是从零开始使用API的用户旅程,涵盖API的发现、调试与集成;二是回顾阿里云过去十年为开发者提供的服务及发展历程。文中详细描述了API从最初的手写SDK到自动化生成SDK的变化,以及通过API Explorer、IDE插件和AI助手等工具提升开发者体验的过程。这些工具和服务旨在帮助开发者更高效地使用API,减少配置和调试的复杂性,提供一站式的解决方案。
|
30天前
|
人工智能 编解码 网络架构
GenCast:谷歌DeepMind推出的AI气象预测模型
GenCast是由谷歌DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。该模型在97.2%的预测任务中超越了全球顶尖的中期天气预报系统ENS,尤其在极端天气事件的预测上表现突出。GenCast能在8分钟内生成预报,显著提高预测效率,并且已经开源,包括代码和模型权重,支持更广泛的天气预报社区和研究。
169 14
GenCast:谷歌DeepMind推出的AI气象预测模型
|
7天前
|
人工智能 自然语言处理 API
自学记录HarmonyOS Next的HMS AI API 13:语音合成与语音识别
在完成图像处理项目后,我计划研究HarmonyOS Next API 13中的AI语音技术,包括HMS AI Text-to-Speech和Speech Recognizer。这些API提供了强大的语音合成与识别功能,支持多语言、自定义语速和音调。通过这些API,我将开发一个支持语音输入与输出的“语音助手”原型应用,实现从语音指令解析到语音响应的完整流程。此项目不仅提高了应用的交互性,也为开发者提供了广阔的创新空间。未来,语音技术将在无障碍应用和智慧城市等领域展现巨大潜力。如果你也对语音技术感兴趣,不妨一起探索这个充满无限可能的领域。 (238字符)
67 11
|
22天前
|
人工智能 自然语言处理 API
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
谷歌推出的Multimodal Live API是一个支持多模态交互、低延迟实时互动的AI接口,能够处理文本、音频和视频输入,提供自然流畅的对话体验,适用于多种应用场景。
69 3
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
|
25天前
|
人工智能 搜索推荐 安全
数百名研发人员用通义灵码,33%新增代码由AI生成,信也科技研发模式焕新升级
目前,信也科技数百名研发人员正在使用通义灵码,周活跃用户占比70%,新增代码中有33%由通义灵码编写,整体研发效率提升了11%,真正实现了数百研发人员开发效能的全面提升。
|
1月前
|
人工智能 自然语言处理 安全
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
谷歌发布的Gemini 2.0标志着AI新时代的到来,被誉为“谷歌版贾维斯”。该系统在自然语言处理、图像识别及自主操控电脑等方面取得重大进展,尤其在多模态数据处理上表现出色,能更准确理解用户需求并执行复杂任务。尽管存在对AI自主操控可能带来的负面影响的担忧,谷歌强调Gemini 2.0旨在辅助而非替代人类工作,且已采取多项措施保障其安全性和可靠性。
28 5