谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑

简介: 【2月更文挑战第24天】谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑

e6246b5df078536acaf715a8a1710da3.jpeg
在人工智能领域,模型的规模和性能一直是推动技术进步的关键因素。随着计算能力的提升和算法的优化,AI模型变得越来越庞大,它们能够处理更复杂的任务,提供更精准的服务。然而,这些大模型往往需要强大的硬件支持,限制了它们在移动设备和个人电脑上的应用。谷歌最新发布的MediaPipe LLM Inference API,正是为了打破这一限制,让28亿参数的大模型也能在本地设备上流畅运行。

这一API的推出,是谷歌在跨设备AI技术领域的又一重要里程碑。它不仅简化了开发者在不同设备上部署AI模型的过程,还通过一系列技术创新,实现了模型在不同平台上的高效运行。这些技术包括新的操作、量化、缓存和权重共享等,它们共同作用,使得AI大模型能够在网页、安卓、iOS等设备上无缝运行。谷歌的这一举措,无疑为AI技术的普及和应用开辟了新的道路。

MediaPipe LLM Inference API目前支持的模型包括Gemma、Phi 2、Falcon和Stable LM,这些模型的参数规模从1B到3B不等。这些模型不仅能够在网页上运行,还能在安卓和iOS设备上提供服务。开发者可以根据需要选择使用基本模型权重,或者利用社区微调版,甚至使用自己的数据进行微调,以适应特定的应用场景。这种灵活性,使得AI模型能够更好地服务于用户,满足多样化的需求。

在iOS设备上,尽管目前只有Gemma 2B(int4)模型能够运行,但谷歌正在积极努力,以期让更多模型能够在iOS平台上启用。这一努力,体现了谷歌对于跨平台兼容性的重视,也预示着未来AI技术将更加普及和便捷。

为了确保模型能够在设备上高效运行,谷歌对MediaPipe LLM Inference API进行了细致的优化。这些优化措施包括权重共享、优化的全连接操作、平衡计算和内存使用、自定义操作符、伪动态性和优化的KV缓存布局等。这些技术的应用,不仅提高了模型的运行效率,还保证了在不同设备上的兼容性和稳定性。

谷歌的这一创新,不仅仅是技术上的突破,更是对AI大模型跨设备运行的一次大胆尝试。它将推动AI技术在更多领域的应用,为用户带来更加智能化的体验。随着谷歌计划将MediaPipe LLM Inference API扩展到更多平台和模型,未来的AI技术将更加强大,更加贴近人们的生活。

目录
相关文章
|
19天前
|
人工智能 自然语言处理 API
零门槛,即刻拥有DeepSeek-R1满血版——调用API及部署各尺寸模型
本文介绍了如何利用阿里云技术快速部署和使用DeepSeek系列模型,涵盖满血版API调用和云端部署两种方案。DeepSeek在数学、代码和自然语言处理等复杂任务中表现出色,支持私有化部署和企业级加密,确保数据安全。通过详细的步骤和代码示例,帮助开发者轻松上手,提升工作效率和模型性能。解决方案链接:[阿里云DeepSeek方案](https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms?utm_content=g_1000401616)。
零门槛,即刻拥有DeepSeek-R1满血版——调用API及部署各尺寸模型
|
12天前
|
人工智能 自然语言处理 前端开发
【2025.3.08更新】Linkreate wordpressAI智能插件|自动生成SEO文章/图片/视频+长尾词优化 内置DeepSeek多模型支持与API扩展
Linkreate WordPress AI插件提供强大的自动化文章生成、SEO优化、关键词管理和内容采集功能。它能根据关键词自动生成高质量文章,支持多语言和批量生成,内置长尾关键词生成工具,并可定时自动发布文章。插件还集成了多种AI服务,支持前端AI客服窗口及媒体生成,帮助用户高效管理网站内容,提升SEO效果。
|
16天前
|
人工智能 自然语言处理 前端开发
Linkreate wordpressAI智能插件|自动生成SEO文章/图片/视频+长尾词优化 内置DeepSeek多模型支持与API扩展
Linkreate WordPress AI插件提供强大的文章生成与优化功能,支持自动化生成高质量文章、批量生成、SEO优化及双标题定制。关键词生成管理方面,可批量生成长尾关键词并自定义参数。内容采集功能支持单篇和批量采集指定网站内容,可视化规则生成器方便使用。定时任务实现全自动文章生成,24小时稳定运行。API集成兼容多种AI服务,如DeepSeek、OpenAI等,并支持前端AI客服窗口。媒体生成功能包括自动为文章生成图片和短视频,提升内容丰富度。官网提供插件演示及下载:[https://idc.xymww.com/](https://idc.xymww.com/)
|
1月前
|
机器学习/深度学习 人工智能 监控
X-R1:3090也能训7B模型!开源框架X-R1把训练成本打下来了:10美元训出企业级LLM
X-R1 是一个基于强化学习的低成本训练框架,能够加速大规模语言模型的后训练开发。仅需4块3090或4090 GPU,1小时内完成训练,成本低于10美元。
122 5
X-R1:3090也能训7B模型!开源框架X-R1把训练成本打下来了:10美元训出企业级LLM
|
7天前
|
SQL 关系型数据库 MySQL
|
16天前
|
数据可视化 JavaScript 前端开发
利用Postman和Apipost进行API测试的实践与优化-动态参数
在API测试中,Postman和Apipost是常用的工具。Postman内置变量功能有限,面对复杂场景时需编写JavaScript脚本,增加了维护成本。而Apipost提供丰富的内置变量、可视化动态值配置和低代码操作,支持生成真实随机数据,如邮箱、手机号等,显著提升测试效率和灵活性。对于复杂测试场景,Apipost是更好的选择,能有效降低开发与维护成本,提高测试工作的便捷性和可维护性。
|
1月前
|
机器学习/深度学习 人工智能 测试技术
仅7B的模型数学推理能力完虐70B?MIT哈佛推出行动思维链COAT让LLM实现自我反思并探索新策略
Satori 是由 MIT 和哈佛大学等机构联合推出的 7B 参数大型语言模型,专注于提升推理能力,具备强大的自回归搜索和自我纠错功能。
105 6
仅7B的模型数学推理能力完虐70B?MIT哈佛推出行动思维链COAT让LLM实现自我反思并探索新策略
|
20天前
|
存储 Kubernetes 测试技术
企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南
企业级LLM推理部署新范式:基于ACK的DeepSeek蒸馏模型生产环境落地指南
53 12
|
19天前
|
人工智能 物联网 API
又又又上新啦!魔搭免费模型推理API支持DeepSeek-R1,Qwen2.5-VL,Flux.1 dev及Lora等
又又又上新啦!魔搭免费模型推理API支持DeepSeek-R1,Qwen2.5-VL,Flux.1 dev及Lora等
|
20天前
|
机器学习/深度学习 搜索推荐 异构计算
LLM模型添加自定义Token代码示例:为Llama 3.2模型添加思考与回答标记
本文将介绍如何为大型语言模型(LLM)添加自定义token并进行训练,使模型能够有效地利用这些新增token。以Llama 3.2模型为基础,实现了类似DeepSeek R1中think和answer标记功能的扩展方法,通过监督微调使模型学习使用这些标记进行推理过程与答案输出的区分
34 0
LLM模型添加自定义Token代码示例:为Llama 3.2模型添加思考与回答标记

热门文章

最新文章