官方博客-第30页-阿里云开发者社区

德灵

2024-05-15

118022

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,022

雅纯

2024-05-15

121877

云效AppStack+阿里云MSE实现应用服务全链路灰度

在应用开发测试验证通过后、进行生产发布前，为了降低新版本发布带来的风险，期望能够先部署到灰度环境，用小部分业务流量进行全链路灰度验证，验证通过后再全量发布生产。本文主要介绍如何通过阿里云MSE 微服务引擎和云效应用交付平台AppStack 实现灰度发布。

雅纯

121,877

阿里云大数据Al技术

2024-05-15

78195

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,195

ModelScope

2024-05-15

475

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

475

阿里云瑶池数据库

2024-05-15

125864

PolarDB闪电助攻，《香肠派对》百亿好友关系实现毫秒级查询

PolarDB分布式版助力《香肠派对》实现百亿好友关系20万QPS的毫秒级查询。

阿里云瑶池数据库

125,864

ModelScope

2024-05-15

1103

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,103

花三

2024-05-29

51900

小而美：两步完成从源码到应用的极简交付

本文将主要介绍，如何通过 SAE 快速实现项目从源码到应用的交付与上线。

花三

51,900

阿里云瑶池数据库

2024-06-18

692

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性，解决了云数据仓库的性能瓶颈，同时支持了资源按需预留。Flux优于传统的方法，查询响应时间 (RT) 最多可减少75%，资源利用率提高19.0%，成本开销降低77.8%。

阿里云瑶池数据库

692

阿里云大数据Al技术

2024-07-31

7467

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,467

官方博客-第30页-阿里云开发者社区

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

云效AppStack+阿里云MSE实现应用服务全链路灰度

【AAAI 2024】MuLTI：高效视频与语言理解

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

PolarDB闪电助攻，《香肠派对》百亿好友关系实现毫秒级查询

LISA微调技术解析：比LoRA更低的显存更快的速度

小而美：两步完成从源码到应用的极简交付

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

OSS数据源一站式RAG最佳实践

官方博客-第30页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

云效AppStack+阿里云MSE实现应用服务全链路灰度

【AAAI 2024】MuLTI：高效视频与语言理解

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

PolarDB闪电助攻，《香肠派对》百亿好友关系实现毫秒级查询

LISA微调技术解析：比LoRA更低的显存更快的速度

小而美：两步完成从源码到应用的极简交付

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

OSS数据源一站式RAG最佳实践