微软发布Phi-3,性能超Llama-3,可手机端运行

简介: 【5月更文挑战第8天】微软新发布的phi-3-mini是一款拥有38亿参数的语言模型,可在手机上运行,性能媲美GPT-3.5。通过扩展版筛选数据集和对齐训练提升效能,phi-3还包括70亿和140亿参数的变体,表现更优。此模型的出现标志了移动设备上部署大型语言模型的可能,但也面临计算资源限制和潜在偏见问题,需更多研究确保可靠性和公平性。[链接](https://arxiv.org/abs/2404.14219)

微软最近发布了一份名为Phi-3的技术报告,介绍了一种名为phi-3-mini的新型语言模型。该模型拥有38亿个参数,训练数据达到3.3万亿个标记,其性能在学术基准测试和内部测试中可与Mixtral 8x7B和GPT-3.5等大型模型相媲美,例如在MMLU测试中获得了69%的成绩,在MT-bench测试中获得了8.38分。然而,令人惊讶的是,phi-3-mini的规模足够小,可以在手机上运行。

Phi-3的创新之处在于其训练数据集,这是phi-2所使用的数据集的扩展版本,由经过严格筛选的网络数据和合成数据组成。此外,该模型还经过了进一步的对齐训练,以提高其鲁棒性、安全性和聊天格式的适应性。微软还提供了使用4.8万亿个标记训练的70亿和140亿参数模型的初步参数缩放结果,分别称为phi-3-small和phi-3-medium。这两个模型在MMLU和MT-bench等测试中的表现都明显优于phi-3-mini,例如在MMLU测试中分别获得了75%和78%的成绩,在MT-bench测试中分别获得了8.7和8.9分。

Phi-3的发布对于语言模型领域来说是一个重要的里程碑。首先,它展示了在保持高性能的同时,可以在移动设备上部署大型语言模型的可能性。这为开发人员提供了新的机会,可以在各种移动应用程序中利用语言模型的功能。其次,Phi-3的训练数据集和对齐方法可能为其他研究人员提供了有用的经验教训,以改进他们自己的语言模型。

然而,Phi-3也存在一些潜在的问题。首先,尽管phi-3-mini可以在手机上运行,但其性能可能受到移动设备的计算能力和内存限制的影响。因此,在实际应用中,phi-3-mini可能无法达到与大型模型相同的性能水平。其次,Phi-3的训练数据集和对齐方法可能存在一些偏见和限制,这可能会影响模型的鲁棒性和公平性。因此,在将Phi-3用于实际应用之前,需要进行更多的研究和测试,以确保其性能和可靠性。

Phi-3 技术报告:https://arxiv.org/abs/2404.14219

目录
相关文章
|
21天前
|
数据采集 自然语言处理 安全
控制电脑手机的智能体人人都能造,微软开源OmniParser
微软研究团队推出OmniParser,旨在提升GPT-4V等多模态模型在用户界面操作方面的性能。通过解析用户界面截图为结构化元素,OmniParser显著增强了模型的交互能力,使其在多种基准测试中表现出色。该技术开源,促进了社区合作与技术创新,但同时也面临数据质量、计算资源及安全隐私等挑战。
49 14
|
3月前
|
移动开发 Android开发 数据安全/隐私保护
移动应用与系统的技术演进:从开发到操作系统的全景解析随着智能手机和平板电脑的普及,移动应用(App)已成为人们日常生活中不可或缺的一部分。无论是社交、娱乐、购物还是办公,移动应用都扮演着重要的角色。而支撑这些应用运行的,正是功能强大且复杂的移动操作系统。本文将深入探讨移动应用的开发过程及其背后的操作系统机制,揭示这一领域的技术演进。
本文旨在提供关于移动应用与系统技术的全面概述,涵盖移动应用的开发生命周期、主要移动操作系统的特点以及它们之间的竞争关系。我们将探讨如何高效地开发移动应用,并分析iOS和Android两大主流操作系统的技术优势与局限。同时,本文还将讨论跨平台解决方案的兴起及其对移动开发领域的影响。通过这篇技术性文章,读者将获得对移动应用开发及操作系统深层理解的钥匙。
107 12
|
7月前
|
缓存 Android开发 开发者
安卓系统优化:提升手机性能的秘诀
【5月更文挑战第31天】本文将探讨如何通过一系列简单的步骤和技巧,对安卓系统进行优化,以提升手机的性能。我们将从清理无用文件、管理后台应用、调整系统设置等方面入手,帮助你的安卓设备运行更加流畅。
|
7月前
|
数据采集 人工智能 自然语言处理
手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据
【5月更文挑战第16天】微软发布 Phi-3 技术报告,介绍了一个拥有3.8B参数的新语言模型,超越GPT-3.5,成为最大模型之一。 Phi-3 在手机上运行的特性开启了大型模型移动应用新纪元。报告强调数据清洗是关键,通过优化设计实现高效运行。实验显示 Phi-3 在多项NLP任务中表现出色,但泛化能力和数据隐私仍是挑战。该模型预示着AI领域的未来突破。[[论文链接](https://arxiv.org/pdf/2404.14219.pdf)]
92 2
|
7月前
|
人工智能 自然语言处理 搜索推荐
通义大模型落地手机芯片!离线环境可流畅运行多轮AI对话
通义大模型落地手机芯片!离线环境可流畅运行多轮AI对话
184 0
华为手机运行崩溃不显示报错信息的解决办法
华为手机运行崩溃不显示报错信息的解决办法
|
机器学习/深度学习 存储 编解码
超轻超快分割模型 | PP-MobileSeg 安卓手机就可以实时运行
超轻超快分割模型 | PP-MobileSeg 安卓手机就可以实时运行
952 0
|
机器学习/深度学习 人工智能 编解码
谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图
谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图
214 0
|
移动开发 JavaScript 网络安全
在手机中运行H5项目
在手机中运行H5项目
203 0
以前256MB的手机存储卡,可以用来安装运行一个完整的电脑操作系统
以前256MB的手机存储卡,可以用来安装运行一个完整的电脑操作系统
以前256MB的手机存储卡,可以用来安装运行一个完整的电脑操作系统

热门文章

最新文章