开发者社区数据库文章正文

体验基于 LLM 构建AI知识库问答应用部署

2023-09-06 682

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 基于NAS、RDS PostgreSQL部署AI大语言知识库

写在前面

感谢阿里云提供相关资源，可以参加这次的AI助手应用搭建。

开通相关产品

本次实验需要开通三个产品：函数计算FC，数据库产品，文件存储NAS

RDS数据库

函数计算FC

文件存储NAS

应用部署

开通函数计算FC后，在控制台创建AI大语言模型应用，然后直接部署。

然后根据教程配置数据库，一步步完成即可，最终效果如下：

心得体会

整体操作下来，也就花了15分钟不到，体验非常不错，阿里系的相关产品组合非常棒，可以将复杂的AI模型部署简化，为开发者节省了大量时间，不懂AI也可以独立完成AI应用。

文章标签：

人工智能

关系型数据库

Serverless

数据库

RDS

关键词：

AI部署

构建AI

构建AI部署

AI构建

AI应用

凌云Cloud

聚客AI

10月前

存储机器学习/深度学习算法

LLM推理效率的范式转移：FlashAttention与PagedAttention正在重塑AI部署的未来

本文深度解析FlashAttention与PagedAttention两大LLM推理优化技术：前者通过分块计算提升注意力效率，后者借助分页管理降低KV Cache内存开销。二者分别从计算与内存维度突破性能瓶颈，显著提升大模型推理速度与吞吐量，是当前高效LLM系统的核心基石。建议收藏细读。

聚客AI

1834 125 125

蚂蚁百宝箱

9月前

API 开发者

百宝箱开放平台 ✖️ 查询知识库文件的构建状态

本接口用于查询目标文件在知识库中的构建状态，需提供documentId并配置有效token。支持查看初始化、处理中、成功、失败等状态，并返回详细错误信息以便排查问题。

蚂蚁百宝箱

475 4 4

安全风信子

9月前

存储人工智能数据中心

138_绿色计算：碳排放优化 - 估算部署的碳足迹与LLM环境友好型部署最佳实践

随着大语言模型(LLM)在各个行业的广泛应用，其计算需求和环境影响正日益受到关注。根据最新研究，训练一个大型LLM模型可能产生数百吨二氧化碳当量的排放，这相当于普通家庭几十年的碳足迹。在全球气候变化和可持续发展的背景下，如何优化LLM部署的碳足迹，实现环境友好型AI应用，已成为行业面临的重要挑战。

安全风信子

494 2 2

varin

9月前

存储人工智能 Java

AI 超级智能体全栈项目阶段四：学术分析 AI 项目 RAG 落地指南：基于 Spring AI 的本地与阿里云知识库实践

本文介绍RAG（检索增强生成）技术，结合Spring AI与本地及云知识库实现学术分析AI应用，利用阿里云Qwen-Plus模型提升回答准确性与可信度。

varin

2380 90 103

AI 超级智能体全栈项目阶段四：学术分析 AI 项目 RAG 落地指南：基于 Spring AI 的本地与阿里云知识库实践

安全风信子

9月前

机器学习/深度学习缓存监控

139_剪枝优化：稀疏模型压缩 - 分析结构化剪枝的独特速度提升与LLM部署加速实践

随着大语言模型(LLM)规模的不断增长，模型参数量已从最初的数亿扩展到数千亿甚至万亿级别。这种规模的模型在推理过程中面临着巨大的计算和内存挑战，即使在最先进的硬件上也难以高效部署。剪枝优化作为一种有效的模型压缩技术，通过移除冗余或不重要的参数，在保持模型性能的同时显著减少计算资源需求。

安全风信子

1291 139 139

安全风信子

9月前

人工智能自然语言处理 TensorFlow

134_边缘推理：TensorFlow Lite - 优化移动端LLM部署技术详解与实战指南

在人工智能与移动计算深度融合的今天，将大语言模型(LLM)部署到移动端和边缘设备已成为行业发展的重要趋势。TensorFlow Lite作为专为移动和嵌入式设备优化的轻量级推理框架，为开发者提供了将复杂AI模型转换为高效、低功耗边缘计算解决方案的强大工具。随着移动设备硬件性能的不断提升和模型压缩技术的快速发展，2025年的移动端LLM部署已不再是遥远的愿景，而是正在成为现实的技术实践。

安全风信子

1677 39 40

PHP小志

9月前

机器学习/深度学习人工智能 JSON

PHP从0到1实现 AI 智能体系统并且训练知识库资料

本文详解如何用PHP从0到1构建AI智能体，涵盖提示词设计、记忆管理、知识库集成与反馈优化四大核心训练维度，结合实战案例与系统架构，助你打造懂业务、会进化的专属AI助手。

PHP小志

1331 6 6

霍格沃兹测试开发学社

9月前

Web App开发人工智能自然语言处理

利用Playwright MCP与LLM构建复杂的工作流与AI智能体

本文介绍如何通过Playwright MCP与大语言模型（LLM）结合，构建智能AI代理与自动化工作流。Playwright MCP基于Model Context Protocol，打通LLM与浏览器自动化的能力，实现自然语言驱动的网页操作。涵盖环境配置、核心组件、智能任务规划、自适应执行及电商采集、自动化测试等实战应用，助力高效构建鲁棒性强、可扩展的AI自动化系统。

霍格沃兹测试开发学社

1428 5 5

杖雍皓

9月前

缓存边缘计算运维

基于 Cloudflare Workers 构建高性能知识库镜像服务：反向代理与 HTML 动态重写实践

基于Cloudflare Workers构建的边缘计算镜像服务，通过反向代理、HTML动态重写与智能缓存，优化维基百科等知识平台的访问性能。支持路径映射、安全头清理与容错回退，实现免运维、低延迟、高可用的Web加速方案，适用于教育、科研等合规场景。

杖雍皓

1391 8 8

安全风信子

9月前

存储监控安全

132_API部署：FastAPI与现代安全架构深度解析与LLM服务化最佳实践

在大语言模型(LLM)部署的最后一公里，API接口的设计与安全性直接决定了模型服务的可用性、稳定性与用户信任度。随着2025年LLM应用的爆炸式增长，如何构建高性能、高安全性的REST API成为开发者面临的核心挑战。FastAPI作为Python生态中最受青睐的Web框架之一，凭借其卓越的性能、强大的类型安全支持和完善的文档生成能力，已成为LLM服务化部署的首选方案。

安全风信子

1367 3 4

体验基于 LLM 构建AI知识库问答应用部署

写在前面

开通相关产品

应用部署

心得体会

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

体验基于 LLM 构建AI知识库问答应用部署

写在前面

开通相关产品

应用部署

心得体会

热门文章

最新文章

相关课程

相关电子书

相关实验场景