文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理文章正文

MajorRAG 概述（1/3）

2025-11-12 400

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。1）第一次做RAG，欢迎带着指导意见评论2）希望指出不足时可以附带替换方法

实现思路

文件管理

1）文件上传
2）内容提取
3）格式化
4）向量化
5）倒排索引
6）保存mysql

聊天问答

1）创建会话
2）保存用户消息到上下文
3）利用LLM做意图分析（知识库检索/多轮对话）
4）向量检索（BGE-M3编码query为1024维向量，在Milvus中做COSINE相似度检索，user_id过滤）
5）BM25全文检索（IK中文分词器，user_id过滤）
6）RPF结果合并
7）Mysql补齐元数据（图片地址，文档标题等)
8）利用LLM生成答案
9）保存AI结果到上下文
10）流式推送结果给前端

文章标签：

自然语言处理

关系型数据库

MySQL

前端开发

人工智能

索引

ZhangCraig

目录

相关文章

dt_2691532407-30455

|

8月前

刚刚参加了一个MCP赛事，奖金还可以，搭友们可以去试试看

社区8月比赛未获奖有点失落，但发现通义灵码×蚂蚁百宝箱MCP赛事正火热进行！参赛即有机会赢取丰厚奖金，激励满满，令人眼前一亮。已跃跃欲试，搭友们快来一起冲榜夺奖吧！https://tianchi.aliyun.com/competition/entrance/532442

dt_2691532407-30455

331 2 2

ZhangCraig

|

8月前

|

存储关系型数据库 MySQL

MajorRAG文件内容提取实现分析（2/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法博客地址：https://zhangcraigxg.github.io

ZhangCraig

381 1 2

modelscope

|

8月前

|

自然语言处理语音技术 Apache

阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

阶跃星辰发布全球首个开源LLM级音频编辑大模型Step-Audio-EditX，支持零样本TTS、多语言方言及情感、风格、副语言特征精准控制，采用统一LLM框架，实现文本驱动音频创作。

modelscope

1106 88 88

ZhangCraig

|

8月前

|

存储 JSON 人工智能

MajorRAG聊天问答系统实现分析（3/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法博客地址：https://zhangcraigxg.github.io

ZhangCraig

438 1 1

游客5ghrq7wwljqxu

|

4月前

|

缓存 JSON API

玩转纳斯达克与纽交所：美股数据 API 对接全指南

本文手把手教你用StockTV API对接美股（NYSE/NASDAQ）实时行情、专业K线及IPO数据，支持WebSocket极速推送、多维技术指标与全交易所覆盖，助你快速构建低延迟量化交易或金融App。（239字）

游客5ghrq7wwljqxu

642 7 7

游客5ghrq7wwljqxu

|

5月前

|

算法 API 网络架构

如何高效对接新加坡股票（SGX）实时数据 API

新加坡股市（SGX）汇聚优质REITs、DBS/UOB银行股及航运企业。本文详解如何用StockTV全球金融API（countryId=15）快速获取实时行情、K线、STI指数等数据，支持REST/WS，低门槛、高时效，助力东南亚金融产品开发。（239字）

游客5ghrq7wwljqxu

574 13 13

蚂蚁百宝箱

|

人工智能搜索推荐 API

蚂蚁百宝箱联手深铁打造全国首个地铁 AI 智能体「深铁宝」：你的全能城市向导来啦~

蚂蚁百宝箱联合深铁集团、深圳通推出全国首个“公共出行+城市服务”AI智能体「深铁宝」，上线于深圳地铁、深圳通及支付宝APP，实现一句话直达、秒级响应的智慧出行体验，涵盖出行规划、乘车码快捷调取、周边生活服务推荐等一站式功能，助力城市交通与服务数字化升级。

蚂蚁百宝箱

857 0 0

蚂蚁百宝箱联手深铁打造全国首个地铁 AI 智能体「深铁宝」：你的全能城市向导来啦~

modelscope

|

9月前

|

传感器人工智能 API

仅100多元，他给视障人群装上AI“眼睛”

上海两名开发者为验证AI助盲实效，亲手打造百元AI眼镜，蒙眼实测过马路、识盲道，并开源项目鼓励更多人参与。技术导航，人心照亮。

modelscope

1850 6 8

仅100多元，他给视障人群装上AI“眼睛”

modelscope

|

8月前

|

人工智能自然语言处理语音技术

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast，已登顶Hugging Face TTS趋势榜！

Soul AI Lab联合西工大、上交大开源SoulX-Podcast，支持中英粤川等多语种方言及副语言生成，可稳定输出超60分钟自然流畅的多人对话音频，已在Huggingface登顶TTS趋势榜。

modelscope

980 0 0

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast，已登顶Hugging Face TTS趋势榜！

modelscope

|

8月前

|

机器学习/深度学习数据可视化 Apache

仅3B激活参数，更强的多模态理解与推理能力，百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源！

11月11日，百度开源文心ERNIE-4.5-VL-28B-A3B-Thinking多模态模型，仅3B激活参数，性能媲美顶级大模型。具备强大视觉语言理解、跨模态推理与“图像思考”等创新功能，支持工具调用与视频分析，适用于复杂图文任务，全面开放商用。

modelscope

1080 17 17

仅3B激活参数，更强的多模态理解与推理能力，百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源！

ModelScope模型即服务

自然语言处理

热门文章

最新文章

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

OpenAI 12天发布会内容全纪录！一文快速回顾获知亮点信息，原文附发布会中文字幕视频

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

RuoYi AI：1人搞定AI中台！开源全栈式AI开发平台，快速集成大模型+RAG+支付等模块

Botgroup.chat：超有趣的开源 AI 聊天室！多个 AI 在线互怼，一键搭建你的专属 AI 社群

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

从零搓一个语言模型，然后把它变成认知体的声带

分层结构化决策对话智能体灵钥 V5.1 全新升级｜具备观点边界、关系感知的深度思辨 Agent，配套线上 Demo 与真实用户数据采集方案

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

保密检查在本项目中的总体链路：从按钮到任务清单：免费开源的文档编审软件WPS AI插件.察元AI 文档助手

语义压缩，才是提示词工程的底层心法

一句话查高铁票并写入文件：揭秘 IntentOrch 的意图驱动编排黑科技

[大模型实战 05] 大模型实战的杀手锏：模型微调

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！