前端大模型应用笔记(二):最新llama3.2小参数版本1B的古董机测试 - 支持128K上下文,表现优异,和移动端更配

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: llama3.1支持128K上下文,6万字+输入,适用于多种场景。模型能力超出预期,但处理中文时需加中英翻译。测试显示,其英文支持较好,中文则需改进。llama3.2 1B参数量小,适合移动端和资源受限环境,可在阿里云2vCPU和4G ECS上运行。

llama3.1开始就支持了128K上下文,差不多有5万字的输入,可用于很多场景啦!模型能力比预想会好不少,但处理中文时,切记加上中英翻译!

话不多说,先抛出一个benchMark,对比了下最近比较火的Gemma2 2B和 Phi-3.5。

944664bb1cf747ac99ffe38365d95387.png

测试环境

  • windows 10
  • Intel(R) Core(TM) i5-9500 CPU @ 3.00GHz   3.00 GHz
  • 内存 32.0 GB (31.9 GB 可用)
  • 集成显卡
  • 非stream输出
  • ollama 0.3.12
  • 模型全称 : llama3.2:1b

因为设备比较差,基本上是CPU被榨干,100%的跑,输出时间还可接受,5-30s,设备越好提示词越短响应更快!

文本理解测试

这部分主要是测试模型的上下文长度支持情况

prompt使用了论文Attention is all you need 1706.03762 (arxiv.org) ,整个输入达到40kb,远没达到上下文长度上线,毕竟token长度是会比英文字符少不少。但我怕老古董设备扛不住蓝屏啊

summarize following paper: \n  {{论文内容}}

得到的回复 (....代表省略的部分)

The text appears to be a written representation of a visual attention visualization in the context of natural language processing (NLP) and machine translation. Here's a breakdown of what each section might represent:.......... By highlighting specific examples of attention work at various levels of language processing, these illustrations provide a deeper insight into the capabilities of neural machine translation models.

我特意搜索了关键字,对比了内容,整个回复未出现截断,真的是支持超大的上下文,一开始我还以为看错了嘞,毕竟是一个1B的模型。


中文知识简测 - 中文缺点意思

提示: 西红柿炒鸡蛋的做法

回复:西红柿炒鸡蛋是一道 flavorful 和营养丰富的 breakfast Dish,特别适合 brunch 或早餐。以下是这个recipes 的步骤:\n\n### Ingredients:\n\n- 2 个鸡蛋\n- 1/2 杯西红柿(可以使用半个)\n- 1 tablespoon 高脂奶油或低脂牛乳油\n- 1 问题小的生姜,切碎\n- 1 问题小的蒜汁脆末,切碎\n- 1/4 问题小的黄 hành丝,切碎.... Enjoy your delicious and nutritious Wester Nogarcie Egg!

(...省略了一部分)可以看到中英文混杂,可能修改提示词会有改进,但对于中文的支持应该一般,查看了默认语言八种并没中文,毕竟中文有点复杂,很多模型也是对中文掌握不佳,期待微调版本,但其实也可以外挂一个翻译模型(毕竟翻译模型现在都可以做的很小)

逻辑推理简测

提示:The ratio of the inner angles of the triangle is 2:3:4, so what are the degrees of the inner angles of each corner of the triangle?(三角形内角比例为2:3:4,那么三角形各个角的内角各为多少度?)

回答:To find the degrees of the inner angles of each corner of the triangle, we need to know that the sum of all interior angles in a triangle is 180 degrees.\n\nLet's assume the ratio of the angles is 2x:3x:4x. We can set up an equation based on this:\n\n2x + 3x + 4x = 180\n\nCombine like terms:\n\n9x = 180\n\nDivide by 9:\n\nx = 20\n\nNow that we have x, we can find the degrees of each angle:\n\n* The smallest angle is 2x = 2(20) = 40 degrees\n* The medium-sized angle is 3x = 3(20) = 60 degrees\n* The largest angle is 4x = 4(20) = 80 degrees\n\nSo, the degrees of the inner angles of each corner of the triangle are 40, 60, and 80 degrees.(中文回答错误)

从这里可以看出对于英文的支持确实比较好,我把中文问题翻译成英文,它就回答正确了,但中文提问一开始分析的对,后面就越来越错了...

如何使用

1. 翻译模型 +

可以作为一个更人性的翻译助手

2. 知识库 +

可以用于深度搜索总结

3. 多模态+

让其它模型转化成文字,再本地处理

4. 隐私数据处理

非隐私数据可交由其它大模型处理,尤其是复杂的部分,然后让它结合隐私输出给出最后的结果

总结

llama3.2 1B因为其参数量很小,对于运行需求也不高,所以会很适合在移动端执行部分任务。不要期待它万能,但应该也是有很多场景下可用的,如果在阿里云上运行2vCPU和4G的ECS就可以跑起来啦!

相关文章
|
1月前
|
人工智能 自然语言处理 数据挖掘
云上玩转Qwen3系列之三:PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用
PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用,通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。
|
1月前
|
存储 人工智能 测试技术
HarmonyOS Next~HarmonyOS应用测试全流程解析:从一级类目上架到二级类目专项测试
本文深入解析HarmonyOS应用测试全流程,涵盖从一级类目通用测试到二级类目专项测试的技术方案。针对兼容性、性能、安全测试及分布式能力验证等关键环节,提供详细实践指导与代码示例。同时,结合典型案例分析常见问题及优化策略,帮助开发者满足华为严苛的质量标准,顺利上架应用。文章强调测试在开发中的核心地位,助力打造高品质HarmonyOS应用。
102 2
|
25天前
|
人工智能 测试技术 API
通义灵码 + 魔搭MCP:全流程构建创空间应用
最近,通义灵码上线 MCP(ModelScope Cloud Platform)功能,从之前代码生成及修改的基础功能,到可以使用MCP服务连接更多功能,开发者可以实现从 代码爬取、模型推理到应用部署
426 26
|
17天前
|
测试技术 数据库 Python
解释测试中setup和teardown函数的应用。
总结起来,`setup`和 `teardown`函数就像扔宴会的主人,他们保障了宴会的流畅进行。他们是准备环境和清理现场的重要工作人员,他们的工作直接影响着我们的测试效率和质量。我们可以把 `setup`和 `teardown`想象成隐藏在幕后,默默为我们服务的工作者,他们做着我们需要但是往往忽视的工作。所以,下次当你写测试的时候,别忘了给你的 `setup`和 `teardown`留出足够的位置,因为他们的作用可能是你成功的保证。
49 14
|
28天前
|
安全 测试技术 Linux
Flawnter 5.9.1 (macOS, Linux, Windows) - 应用程序安全测试软件
Flawnter 5.9.1 (macOS, Linux, Windows) - 应用程序安全测试软件
72 2
Flawnter 5.9.1 (macOS, Linux, Windows) - 应用程序安全测试软件
|
11天前
|
人工智能 安全 网络安全
网络安全厂商F5推出AI Gateway,化解大模型应用风险
网络安全厂商F5推出AI Gateway,化解大模型应用风险
22 0
|
1月前
|
人工智能 自然语言处理 数据库
云上玩转Qwen3系列之二:PAI-LangStudio搭建联网搜索和RAG增强问答应用
本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于 RAG 和联网搜索 的 AI 智能问答应用。该应用通过将 RAG、web search 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了额外的联网搜索和特定领域知识库检索的能力,提升了智能回答的效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。
|
19天前
|
存储 5G 测试技术
时钟同步测试校验仪的应用介绍
时间同步测试仪是一种高精度、高可靠性的设备,用于测量和评估时间同步系统的性能。它广泛应用于电力系统(如电网调度、继电保护)、通信网络(如5G基站、光传输网络)、铁路交通(如列车运行控制、信号系统)、工业自动化(如生产线、控制系统)以及科学研究(如天文观测、粒子物理实验)等领域。其功能包括高精度时间测量、多信号接口支持、自动测量与分析、数据存储导出及性能评估输出,确保各领域设备间的时间同步精度与稳定性,保障系统高效运行。
|
8月前
|
存储 人工智能 前端开发
前端大模型应用笔记(三):Vue3+Antdv+transformers+本地模型实现浏览器端侧增强搜索
本文介绍了一个纯前端实现的增强列表搜索应用,通过使用Transformer模型,实现了更智能的搜索功能,如使用“番茄”可以搜索到“西红柿”。项目基于Vue3和Ant Design Vue,使用了Xenova的bge-base-zh-v1.5模型。文章详细介绍了从环境搭建、数据准备到具体实现的全过程,并展示了实际效果和待改进点。
619 14
|
8月前
|
JavaScript 前端开发 程序员
前端学习笔记——node.js
前端学习笔记——node.js
135 0

热门文章

最新文章