Google 发布其开源模型系列最新模型 Gemma 3

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
视觉智能开放平台,分割抠图1万点
简介: Google 发布了其开源模型系列的最新成员 Gemma 3,这是一款轻量级、高性能的 AI 模型,支持多语言和复杂任务。它具备 140+ 语言支持、128K-token 上下文窗口、增强的多模态分析能力以及函数调用功能,适用于聊天 AI、代码生成等多种场景。Gemma 3 在性能上超越 Llama 3-8B 和 Mistral 7B,且仅需单 GPU 即可运行,大幅降低计算成本。提供 1B 至 27B 不同参数规模版本,满足多样化需求,并优化了量化模型以适应边缘计算和移动设备。其多模态设计整合了 SigLIP 图像编码器,扩展上下文窗口至 128k token,显著提升了视觉和文本理解能力。

Google 发布其开源模型系列最新模型 Gemma 3

Gemma 3 是一个高性能、可移植的轻量级 AI 模型,适用于单 GPU 或 TPU 部署,支持多语言和复杂任务。

可用于聊天 AI代码生成文本理解多模态分析等任务。

💡 核心特性

  • 支持 140+ 语言,涵盖全球大部分主要语言。
  • 增强文本和视觉推理能力,可理解文本、图片、短视频,适用于内容审核、视觉分析。
  • 128K-token 上下文窗口,适合处理长文本和复杂上下文任务。
  • 支持函数调用(Function Calling),支持 AI 代理(Agents)开发,自动执行任务。
  • 提供量化(Quantized)版本,提升推理速度,更小、更快,适用于边缘计算 & 移动设备。

Gemma 3 相比其他模型的优势

Gemma 3 在多个 AI 评测榜单上超越了 Llama 3-8BDeepSeek-V3Mistral 7B,并且能够在单 GPU 上运行。

  • ✅ 比 Llama 3 更快,比 Mistral 7B 更强大,适合高效 AI 计算。
  • ✅ 单 GPU 运行,超低成本,适用于本地推理、边缘计算、智能设备。

竞技场排名

  • Gemma-3-27B 综合排名前 10
    • 超越许多仅有 27B 参数的专有模型
    • 是第二佳开源模型,仅次于 DeepSeek-R1

主要特点

Gemma 3 在性能、功能和适用性上带来显著提升,以下是核心亮点:

模型规模与灵活性

  • 参数规模:提供 1B(10 亿)4B(40 亿)12B(120 亿)27B(270 亿) 四种参数版本,开发者可根据硬件和性能需求选择合适的模型。
  • 便携性:专为直接在设备上运行而设计,支持手机、笔记本电脑和工作站等,减少对云端计算的依赖。
  • Gemma 3 27B 仅需 1 张 NVIDIA H100 GPU 即可运行,相比其他模型(如 Llama 3 70B)所需的 32 张 H100,计算成本大幅降低。

多模态与多语言支持

  • 多模态能力:支持文本和图像输入(1B 版本仅支持文本),可处理图像分析、短视频理解等任务,适用于问答、文档总结等场景。可分析图片、短视频、文本,用于内容审核、SEO、视频智能处理。
  • 语言覆盖:开箱支持 35 种语言,预训练覆盖超过 140 种语言,助力开发者构建全球化应用。

扩展上下文窗口

  • 上下文长度:提供高达 128k token 的上下文窗口(1B 版本为 32k),能处理大量信息,适合复杂任务如长文档分析。

功能调用与结构化输出

  • 新功能:支持函数调用和结构化输出,便于自动化任务和构建智能代理(如工作流程助手)。

性能优化

  • 量化模型:提供官方量化版本,减小模型体积和计算需求,同时保持高精度,适合资源受限环境。
  • 高性能:27B 模型在 Chatbot Arena Elo 分数 上名列前茅,仅需单张 NVIDIA H100 GPU 即可运行,相比其他需要多达 32 张 GPU 的模型更高效。

模型架构改进

  • 多模态设计:4B、12B 和 27B 版本整合了 SigLIP 图像编码器,将图像转化为 token,与语言模型无缝结合。文本采用单向注意力(因果注意力),图像采用双向全注意力,提升视觉理解能力。
  • 上下文扩展:通过预训练 32k token 序列,并在后期将 4B 以上版本扩展至 128k token,优化了 RoPE(旋转位置嵌入) 基频(从 10k 提升至 1M)并调整超参数(如局部与全局注意力层比例从 1:1 改为 5:1,窗口大小从 4096 减至 1024),在不牺牲性能的情况下降低内存需求。

多语言优化

  • 数据集升级:预训练数据中的多语言内容翻倍,提升了语言覆盖广度和质量。使用的 tokenizer 与 Gemini 2.0 一致,确保兼容性和一致性。

相关链接


技术博客:DogAPI-人工智能接口商城

我们的服务类型

AI代充服务:我们深知地域限制可能为某些用户带来的不便,因此为在受限区域的企业和个体提供便捷的、稳定的、无障碍的、一站式的AI工具升级服务。

AI接口供应:DogAPI已为多家全球顶级企业和数千家AI企业提供API服务,为大模型训练厂商们提供了最刚需的API接口和Claude接口供应,包括为AI创业者们提供了超数百万美元的中转API供应。我们的API解决方案旨在为企业与创业者们提供高效的、稳定的、便捷的、一站式的API消耗供应,助力AI技术更好地服务于实际应用。

AI芯片中心:致力于为AI大模型训练的企业提供GPU导购和支持服务。我们与谷歌云代理商合作,提供H100、A100等各类AI算力显卡,并为客户提供8折优惠。我们的专业团队拥有丰富经验,旨在帮助AI企业解决算力挑战,推动AI发展,促进人类社会进步。

相关文章
|
10月前
|
人工智能 自然语言处理 API
Google Gemma 模型服务:开放的生成式 AI 模型服务
Google Gemma 模型服务:开放的生成式 AI 模型服务
280 4
|
10月前
|
定位技术 TensorFlow API
Google Earth Engine (GEE)——张量流水灾模型数据集(Sentinel-1)
Google Earth Engine (GEE)——张量流水灾模型数据集(Sentinel-1)
208 0
|
10月前
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
328 0
|
2月前
|
人工智能 前端开发 API
Gemini Coder:基于 Google Gemini API 的开源 Web 应用生成工具,支持实时编辑和预览
Gemini Coder 是一款基于 Google Gemini API 的 AI 应用生成工具,支持通过文本描述快速生成代码,并提供实时代码编辑和预览功能,简化开发流程。
173 38
Gemini Coder:基于 Google Gemini API 的开源 Web 应用生成工具,支持实时编辑和预览
|
9月前
|
机器学习/深度学习 人工智能 TensorFlow
TensorFlow 是一个由 Google 开发的开源深度学习框架
TensorFlow 是一个由 Google 开发的开源深度学习框架
127 3
|
7月前
|
机器学习/深度学习 数据采集 物联网
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
284 0
|
10月前
|
运维 监控 Serverless
一键开启 GPU 闲置模式,基于函数计算低成本部署 Google Gemma 模型服务
本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。
165052 58
|
9月前
|
人工智能 自然语言处理 机器人
[AI Google] 新的生成媒体模型和工具,专为创作者设计和构建
探索谷歌最新的生成媒体模型:用于高分辨率视频生成的 Veo 和用于卓越文本生成图像能力的 Imagen 3。还可以了解使用 Music AI Sandbox 创作的新演示录音。
[AI Google] 新的生成媒体模型和工具,专为创作者设计和构建
|
10月前
|
API 算法框架/工具 异构计算
Python中Keras微调Google Gemma:定制化指令增强大语言模型LLM
Python中Keras微调Google Gemma:定制化指令增强大语言模型LLM
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
再超Transformer!Google提出两个新模型(Griffin、Hawk),强于Mamba,更省资源
【2月更文挑战第15天】再超Transformer!Google提出两个新模型(Griffin、Hawk),强于Mamba,更省资源
302 1
再超Transformer!Google提出两个新模型(Griffin、Hawk),强于Mamba,更省资源