官方博客-第36页-阿里云开发者社区

德灵

2024-05-15

118022

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,022

隆基

2024-05-15

91441

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

本文来学习一个典型的物联网技术架构，以及在这个技术架构里面，消息队列所发挥的作用。在物联网的场景里面，对消息技术的要求和面向服务端应用的消息技术有什么区别？学习 RocketMQ 5.0 的子产品 MQTT，是如何解决这些物联网技术难题的。

隆基

91,441

阿里云大数据Al技术

2024-05-15

78195

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,195

十眠

2024-05-15

61814

适应多样化需求：WASM 插件在全链路灰度发布中的应用

MSE（微服务引擎）在微服务全链路灰度场景下提供了一套成熟的功能，支持内容规则和百分比规则的灰度路由策略。

十眠

61,814

荆磊

2024-05-15

56108

更优性能与性价比，从自建 ELK 迁移到 SLS 开始

本文介绍了 SLS 基本能力，并和开源自建 ELK 做了对比，可以看到 SLS 相比开源 ELK 有较大优势。

荆磊

56,108

阿里云瑶池数据库

2024-05-15

125864

PolarDB闪电助攻，《香肠派对》百亿好友关系实现毫秒级查询

PolarDB分布式版助力《香肠派对》实现百亿好友关系20万QPS的毫秒级查询。

阿里云瑶池数据库

125,864

ModelScope

2024-05-15

1103

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,103

花三

2024-05-29

51900

小而美：两步完成从源码到应用的极简交付

本文将主要介绍，如何通过 SAE 快速实现项目从源码到应用的交付与上线。

花三

51,900

阿里云瑶池数据库

2024-06-18

692

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性，解决了云数据仓库的性能瓶颈，同时支持了资源按需预留。Flux优于传统的方法，查询响应时间 (RT) 最多可减少75%，资源利用率提高19.0%，成本开销降低77.8%。

阿里云瑶池数据库

692

官方博客-第36页-阿里云开发者社区

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

【AAAI 2024】MuLTI：高效视频与语言理解

适应多样化需求：WASM 插件在全链路灰度发布中的应用

更优性能与性价比，从自建 ELK 迁移到 SLS 开始

PolarDB闪电助攻，《香肠派对》百亿好友关系实现毫秒级查询

LISA微调技术解析：比LoRA更低的显存更快的速度

小而美：两步完成从源码到应用的极简交付

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

官方博客-第36页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

【AAAI 2024】MuLTI：高效视频与语言理解

适应多样化需求：WASM 插件在全链路灰度发布中的应用

更优性能与性价比，从自建 ELK 迁移到 SLS 开始

PolarDB闪电助攻，《香肠派对》百亿好友关系实现毫秒级查询

LISA微调技术解析：比LoRA更低的显存更快的速度

小而美：两步完成从源码到应用的极简交付

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载