微软发布Phi-3,性能超Llama-3,可手机端运行

简介: 【5月更文挑战第8天】微软新发布的phi-3-mini是一款拥有38亿参数的语言模型,可在手机上运行,性能媲美GPT-3.5。通过扩展版筛选数据集和对齐训练提升效能,phi-3还包括70亿和140亿参数的变体,表现更优。此模型的出现标志了移动设备上部署大型语言模型的可能,但也面临计算资源限制和潜在偏见问题,需更多研究确保可靠性和公平性。[链接](https://arxiv.org/abs/2404.14219)

微软最近发布了一份名为Phi-3的技术报告,介绍了一种名为phi-3-mini的新型语言模型。该模型拥有38亿个参数,训练数据达到3.3万亿个标记,其性能在学术基准测试和内部测试中可与Mixtral 8x7B和GPT-3.5等大型模型相媲美,例如在MMLU测试中获得了69%的成绩,在MT-bench测试中获得了8.38分。然而,令人惊讶的是,phi-3-mini的规模足够小,可以在手机上运行。

Phi-3的创新之处在于其训练数据集,这是phi-2所使用的数据集的扩展版本,由经过严格筛选的网络数据和合成数据组成。此外,该模型还经过了进一步的对齐训练,以提高其鲁棒性、安全性和聊天格式的适应性。微软还提供了使用4.8万亿个标记训练的70亿和140亿参数模型的初步参数缩放结果,分别称为phi-3-small和phi-3-medium。这两个模型在MMLU和MT-bench等测试中的表现都明显优于phi-3-mini,例如在MMLU测试中分别获得了75%和78%的成绩,在MT-bench测试中分别获得了8.7和8.9分。

Phi-3的发布对于语言模型领域来说是一个重要的里程碑。首先,它展示了在保持高性能的同时,可以在移动设备上部署大型语言模型的可能性。这为开发人员提供了新的机会,可以在各种移动应用程序中利用语言模型的功能。其次,Phi-3的训练数据集和对齐方法可能为其他研究人员提供了有用的经验教训,以改进他们自己的语言模型。

然而,Phi-3也存在一些潜在的问题。首先,尽管phi-3-mini可以在手机上运行,但其性能可能受到移动设备的计算能力和内存限制的影响。因此,在实际应用中,phi-3-mini可能无法达到与大型模型相同的性能水平。其次,Phi-3的训练数据集和对齐方法可能存在一些偏见和限制,这可能会影响模型的鲁棒性和公平性。因此,在将Phi-3用于实际应用之前,需要进行更多的研究和测试,以确保其性能和可靠性。

Phi-3 技术报告:https://arxiv.org/abs/2404.14219

目录
相关文章
|
3天前
|
数据采集 人工智能 自然语言处理
手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据
【5月更文挑战第16天】微软发布 Phi-3 技术报告,介绍了一个拥有3.8B参数的新语言模型,超越GPT-3.5,成为最大模型之一。 Phi-3 在手机上运行的特性开启了大型模型移动应用新纪元。报告强调数据清洗是关键,通过优化设计实现高效运行。实验显示 Phi-3 在多项NLP任务中表现出色,但泛化能力和数据隐私仍是挑战。该模型预示着AI领域的未来突破。[[论文链接](https://arxiv.org/pdf/2404.14219.pdf)]
11 2
|
5天前
|
人工智能 自然语言处理 搜索推荐
通义大模型落地手机芯片!离线环境可流畅运行多轮AI对话
通义大模型落地手机芯片!离线环境可流畅运行多轮AI对话
37 0
|
7月前
|
Web App开发 Android开发 开发者
SAP UI5 应用开发教程之五十一 - 如何使用 Chrome 调试运行在手机上的 SAP UI5 Cordova 混合应用试读版
SAP UI5 应用开发教程之五十一 - 如何使用 Chrome 调试运行在手机上的 SAP UI5 Cordova 混合应用试读版
58 0
SAP UI5 应用开发教程之五十一 - 如何使用 Chrome 调试运行在手机上的 SAP UI5 Cordova 混合应用试读版
|
7月前
|
Android开发 开发者
SAP UI5 应用开发教程之四十九 - 如何在桌面电脑端调试运行在手机上的 SAP UI5 应用试读版
SAP UI5 应用开发教程之四十九 - 如何在桌面电脑端调试运行在手机上的 SAP UI5 应用试读版
38 0
|
11月前
华为手机运行崩溃不显示报错信息的解决办法
华为手机运行崩溃不显示报错信息的解决办法
|
12月前
|
机器学习/深度学习 存储 编解码
超轻超快分割模型 | PP-MobileSeg 安卓手机就可以实时运行
超轻超快分割模型 | PP-MobileSeg 安卓手机就可以实时运行
672 0
|
12月前
|
机器学习/深度学习 人工智能 编解码
谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图
谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图
169 0
|
移动开发 JavaScript 网络安全
在手机中运行H5项目
在手机中运行H5项目
147 0
|
Web App开发 Android开发 开发者
|
5天前
|
监控 安全 Android开发
【新手必读】Airtest测试Android手机常见的设置问题
【新手必读】Airtest测试Android手机常见的设置问题

热门文章

最新文章