备案控制台登录注册

开发者社区物联网文章正文

LLM大模型知识整理大全

2025-01-26 222 发布于北京

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文介绍了多个大模型训练和部署工具及教程。使用unsloth支持llama3，显存占用约8G；GPT4ALL加载训练好的大模型；llama.cpp进行4bit量化后可用CPU运行。MAID手机App和MLC软件可在安卓设备上本地运行大模型或调用API。FASTGPT用于客制化大模型和AI私有化客服。相关教程链接已提供。

参考教程：

https://www.bilibili.com/video/BV1kC411n7hD

使用 unsloth，支持llama3

占用显存大概8G

使用GPT4ALL加载训练好的大模型

https://gpt4all.io/index.html

llama.cpp进行4bit量化，量化后的大模型可以用CPU跑

参考教程：https://www.bilibili.com/video/BV1G7tQehEBE

MAID手机app，可以在安卓上本地跑大模型，或者调用家里台式机的ollama接口api，也可以调用收费的api

MLC这个软件也可以实现，看起来也挺好用的。https://www.bilibili.com/video/BV1QZ421N7Yt/

FASTGPT客制化大模型，AI私有化客服： https://blog.csdn.net/pythonhy/article/details/143480847

大模型的进化过程

1、DeepSeek-R1-Zero不存在顿悟时刻？华人团队揭秘：或只因强化学习。 https://baijiahao.baidu.com/s?id=1823478340863788362&wfr=spider&for=pc

2、思维连CoT ：大模型思维链（Chain-of-Thought）技术原理

https://www.zhihu.com/tardis/bd/art/629087587?source_id=1001

CoT分为几个重要的类型，带有例子的，不带例子的。

3、manus刷屏的背后是真技术还是纯自嗨。提到了manus使用了CoT技术。 https://baijiahao.baidu.com/s?id=1825904190304734799&wfr=spider&for=pc

文章标签：

API

Android开发

人工智能

机器学习/深度学习

蓝色流星1000

+关注

目录

打赏

0

12

12

1

98

相关文章

蚝油菜花

|

3月前

|

数据采集人工智能

LLM2LLM：LLM2LLM：用 LLM 来增强 LLM ！通过教师模型合成数据，增强学生模型的训练数据集

LLM2LLM 是一种创新的迭代数据增强技术，通过教师模型生成合成数据，显著提升大语言模型在数据稀缺任务中的性能。

蚝油菜花

278 90 91

LLM2LLM：LLM2LLM：用 LLM 来增强 LLM ！通过教师模型合成数据，增强学生模型的训练数据集

蚝油菜花

|

1月前

|

人工智能自然语言处理算法

HippoRAG 2：开源RAG框架革新知识检索，多跳推理+持续学习全搞定

HippoRAG 2 是俄亥俄州立大学推出的检索增强生成框架，通过个性化PageRank算法和知识图谱技术，显著提升了RAG系统在复杂问答任务中的表现。

蚝油菜花

261 2 3

HippoRAG 2：开源RAG框架革新知识检索，多跳推理+持续学习全搞定

汀丶人工智能

|

11月前

|

机器学习/深度学习人工智能自然语言处理

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

汀丶人工智能

1882 2 3

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

kaixin321-44007

|

5月前

|

自然语言处理开发者

多模态大模型LLM、MLLM性能评估方法

针对多模态大模型（LLM）和多语言大模型（MLLM）的性能评估，本文介绍了多种关键方法和标准，包括模态融合率（MIR）、多模态大语言模型综合评估基准（MME）、CheckList评估方法、多模态增益（MG）和多模态泄露（ML），以及LLaVA Bench。这些方法为评估模型的多模态和多语言能力提供了全面的框架，有助于研究者和开发者优化和改进模型。

kaixin321-44007

508 5 5

想飞的雪糕

|

6月前

|

机器学习/深度学习弹性计算人工智能

大模型进阶微调篇（三）：微调GPT2大模型实战

本文详细介绍了如何在普通个人电脑上微调GPT2大模型，包括环境配置、代码实现和技术要点。通过合理设置训练参数和优化代码，即使在无独显的设备上也能完成微调，耗时约14小时。文章还涵盖了GPT-2的简介、数据集处理、自定义进度条回调等内容，适合初学者参考。

想飞的雪糕

1077 6 7

汀丶人工智能

|

6月前

|

机器学习/深度学习人工智能自然语言处理

LLMs 入门实战系列大全：LLMs应用、领域大模型介绍、大模型常见面经汇总

LLMs 入门实战系列大全：LLMs应用、领域大模型介绍、大模型常见面经汇总

汀丶人工智能

124 0 0

LLMs 入门实战系列大全：LLMs应用、领域大模型介绍、大模型常见面经汇总

小森ai小小贾

|

10月前

|

存储机器学习/深度学习自然语言处理

大模型Prompt-Tuning技术进阶

近年来，随着Prompt-Tuning技术的崛起，研究者们发现，在拥有超过10亿参数的大规模模型上，采用Prompt-Tuning相较于传统的Fine-tuning方法能带来显著的性能提升。特别是在小样本甚至零样本学习场景下，Prompt-Tuning能够极大地激发模型的潜力。这一成就的取得主要归功于三个关键因素：模型庞大的参数量、训练过程中使用的海量语料，以及精心设计的预训练任务。

小森ai小小贾

349 4 4

楠竹11

|

10月前

|

自然语言处理

斯坦福新研究：RAG能帮助LLM更靠谱吗？

【6月更文挑战第8天】斯坦福大学研究表明，检索增强生成（RAG）技术可提升大型语言模型（LLM）的准确性，但在不正确或矛盾的检索信息下，LLM可能产生误导性答案。研究发现，提供准确检索信息时，LLM准确率可达94%，但错误信息可能导致LLM重复错误。LLM对信息的依赖和内部知识的冲突是关键问题，提示技术的选择也会影响其行为。研究强调使用RAG需谨慎，并指出需要进一步探索LLM在复杂情况下的表现。

楠竹11

129 7 7

爱吃糖的范同学

|

11月前

|

自然语言处理搜索推荐知识图谱

【大模型】描述与 LLM 相关的个人项目或感兴趣的领域

【5月更文挑战第9天】【大模型】描述与 LLM 相关的个人项目或感兴趣的领域

爱吃糖的范同学

148 19 19

是Yu欸

|

存储 Java API

【网安AIGC专题11.7】17ASAP如何更好地改进少样本提示：在LLMs的prompt中添加语义信息，来提高代码摘要生成+代码补全任务的性能。CodeSearchNet数据集（下）

【网安AIGC专题11.7】17ASAP如何更好地改进少样本提示：在LLMs的prompt中添加语义信息，来提高代码摘要生成+代码补全任务的性能。CodeSearchNet数据集（下）

是Yu欸

224 0 0

物联网

+关注

热门文章

最新文章

物联网发展的三大编程语言

阿里云的物联网之路

PostgreSQL "物联网"应用 - 1 实时流式数据处理案例(万亿每天)

阿里云新推出 HiTSDB + IoT套件物联网设备上云步入快车道

塑云科技：性能突破，基于KafKa+OTS+MaxCompute 完成了一次物联网系统技术重构

庆科：从安全设计上突破，云上物联网操作系统进化之路

AliOS Things开发：让你的开发板支持AliOS Studio烧录

高性能时序数据库 HiTSDB 启动公测，为物联网而生的数据库！

旋转门数据压缩算法在PostgreSQL中的实现 - 流式压缩在物联网、监控、传感器等场景的应用

阿里云物联网平台数据转发到表格存储(Table Store)示例参考

停车场导航系统核心技术功能解析，助力造城市便捷项目改造

推荐一款医疗级心电采集处理模块

玄鹿网络 | 中小企业如何借势互联网，打造强势网络品牌？

harmonyOS基础-认识UIAbility

低功耗蓝牙心电采集处理模块

反向寻车系统怎么做？基本原理与系统组成解析

无感化健康监测，日常使用马桶即可获取心脏健康报告，提升生活品质与安全感

单导联心电国产化方案，赋能血压设备实现房颤早筛精准诊断

FreeMQTT Plus: 一个新型 MQTT Broker 集群的实现

Synaptics旗下主流WIFI方案选型参考

相关课程

更多

面向开发者的LLM入门课程

AI情绪鼓励师模型微调实操教学

创空间应用训练个性化模型

大模型入门课-进击的AI:大语言模型技术全景

AI数学基础（上）

AI数学基础

相关电子书

更多

PAI灵骏智算构建全链路LLM服务的最佳实践

AI模型训练解决方案V1.4

展心展力MetaApp：基于DeepRec的稀疏模型训练实践

相关实验场景

更多

基于百炼构建可以划重点、规划学习计划的学习助手

以客服场景意图分类为例写Prompt

如何快速训练大模型

使用PAI+LLaMA Factory微调Qwen2-VL模型，搭建文旅领域知识问答机器人

在SAE控制台极速部署个人LLM效能工具

AI克隆声音，基于函数计算部署GPT-Sovits语音生成模型

下一篇

阿里云免费云服务器:个人用户每月750小时免费

目录

大模型的进化过程

目录

你好，我是AI助理

可以解答问题、推荐解决方案等