把大模型“塞”进手机分几步？-阿里云开发者社区

把大模型“塞”进手机分几步？

2025-11-13 6072

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 「端侧AI创新挑战赛」教程第二期：教你用PocketPal AI在手机本地部署Qwen3-0.6B模型，无需联网、不写代码，实现离线对话。支持iOS/Android，保障隐私安全，轻松打造口袋里的AI助手。

👀 欢迎来到「端侧AI创新挑战赛」官方教程第二期！

上一期，我们手把手带你在 PC 上本地跑起 Qwen3-0.6B。今天，我们要把这份能力装进口袋——没错，你的手机也能变身离线 AI 助手！

无需联网、无需写代码，只需一个开源 App，几分钟内就能在 iOS 或 Android 设备上部署轻量级 Qwen 模型。

准备好让你的手机也拥有“端侧智能”了吗？

为帮助开发者更便捷地在移动设备上部署和应用小模型（SLMs），我们推荐一款实用的开源工具——PocketPal AI。它专为移动端设计，支持 iOS 和安卓设备本地离线运行，无需联网，保障数据隐私。

💡 开源地址：https://github.com/a-ghorbani/pocketpal-ai

💡 适合赛道：赛道一

🟣 安装方式

iOS 系统用户，打开 App Store，搜索 PocketPal Al，找到应用后点击下载并安装。
Android 用户，可以在 Google Play 商店中搜索 PocketPal AI 进行安装，如果无法访问 Google Play，可以在 GitHub 上下载最新的 Release 版本。（下载地址：https://github.com/a-ghorbani/pocketpal-ai/releases）下载 APK 文件后，需要在手机设置中授权“允许来自此来源的应用安装”，完成安装。

PocketPal Al 安装后，在首次打开时，界面默认为英文，但支持中文切换。只需点击左上角菜单进入 Settings，将 Language 选项设为“中文（ZH）”即可。

🟣 下载 Qwen 模型

PocketPal AI 本身只是一个容器，不预装任何模型，因此你需要手动下载一个 Qwen 轻量模型才能开始使用，软件默认提供了一些开源模型，如 Qwen2.5-1.5B-Instruct、Qwen2.5-3B-Instruct......如果没有找到自己需要的模型，点击页面右下角的＋按钮，可以加载其他模型。

目前支持两种模型导入方式：添加本地模型和从 Hugging Face 下载。

添加本地模型：需要提前将 .gguf 格式文件保存到手机存储中，点击添加本地模型按钮，手机会弹出文件管理器，找到你存放 .gguf 文件的位置，选择并导入到 PocketPal Al。适合在线下载困难、网络不稳定，或已经拥有模型文件的情况。
从 Hugging Face 模型库下载：我们更推荐这种方式——PocketPal AI 自 v1.5 起已内置 Hugging Face Hub 集成，只需在搜索框中输入 “Qwen”，即可快速筛选出所有 Qwen 系列模型。需要注意的是，模型名称中的 “0.6B”“1.5B”“3B” 等表示参数规模（单位为十亿），数字越大，模型能力越强，但对手机内存和算力的要求也越高。考虑到移动端资源有限，建议首次尝试选择 Qwen3-0.6B-GGUF，它在保持基础语言能力的同时，对 6–8GB 内存的主流手机更为友好。

点击模型名称后，我们可以很清楚的了解模型详情，包括参数规模、文件大小、支持的上下文长度以及量化方式（如 Q4_K_M、Q5_K_S 等）。这些信息有助于你判断该模型是否适合自己的设备。确认无误后，点击“下载”按钮，PocketPal AI 会自动将模型文件保存到应用专属存储空间中，无需手动管理路径。

🟣 加载模型

下载完成后，最关键的一步是加载模型到运行内存。

返回模型列表页面，找到刚刚下载的 Qwen3-0.6B 模型，点击卡片上的“加载”按钮。此时，应用会将模型从存储读入内存，为后续推理做准备。首次加载可能需要 1–3 分钟（具体时间取决于手机性能和模型大小），请耐心等待进度条完成。加载成功后，模型状态会显示为“已加载”，并自动设为当前激活模型。