官方博客-第20页-阿里云开发者社区

德灵

2024-05-15

118024

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,024

探索云世界

2024-05-15

2874

阿里云大降价后，再谈“降本增效”

2024年2月29日，阿里云宣布史上最大力度降价，引发行业对用云成本的热议。

探索云世界

2,874

阿里云大数据Al技术

2024-05-15

78197

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,197

ModelScope

2024-05-15

1913

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,913

ModelScope

2024-05-15

1104

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,104

才胜南也

2024-09-05

954

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

954

阿里云云原生

2024-09-14

653

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云云原生 8 月产品月报。

阿里云云原生

653

城危

2025-01-23

380

过年啦，做一个春节贺卡生成器

本文介绍了如何获取和利用现有的大模型资源，结合魔笔低代码，低成本、高效率地打造一个 AI 春节贺卡生成器。

城危

380

亦达

2025-02-20

687

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

687

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

阿里云大降价后，再谈“降本增效”

【AAAI 2024】MuLTI：高效视频与语言理解

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

RAG效果优化：高质量文档解析详解

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

过年啦，做一个春节贺卡生成器

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

阿里云大降价后，再谈“降本增效”

【AAAI 2024】MuLTI：高效视频与语言理解

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

RAG效果优化：高质量文档解析详解

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

过年啦，做一个春节贺卡生成器

破解 vLLM + DeepSeek 规模化部署的“不可能三角”