官方博客-第10页-阿里云开发者社区

子白

2024-05-15

102502

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,502

阿里云实时数仓Hologres

2024-06-07

130402

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

130,402

赵世振

2024-08-22

1273

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,273

恭常

2024-09-04

2428

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,428

阿里云开发者

2024-11-29

1198

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,198

赵世振

2025-01-09

2107

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

本文章旨在帮助读者了解并掌握大模型多模态技术的实际应用，特别是如何构建基于多模态的实用场景。文档通过几个具体的多模态应用场景，如拍立淘、探一下和诗歌相机，展示了这些技术在日常生活中的应用潜力。

赵世振

2,107

阿里云大数据Al技术

2025-07-18

915

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力，支持监督微调（SFT）、偏好对齐（DPO）、强化学习微调（GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级，分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

阿里云大数据Al技术

915

阿里云云原生

2025-08-05

1108

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

Nacos社区推出MCP Router与MCP Registry开源解决方案，助力AI Agent高效调用外部工具。Router可智能筛选匹配的MCP Server，减少Token消耗，提升安全性与部署效率。结合Nacos Registry实现服务自动发现与管理，简化AI Agent集成复杂度。支持协议转换与容器化部署，保障服务隔离与数据安全。提供智能路由与代理模式，优化工具调用性能，助力MCP生态普及。

阿里云云原生

1,108

寒亭

2023-09-18

47959

一次访问Redis延时高问题排查与总结（2）

本文是一次访问Redis延时高问题排查与总结的续篇，主要讲述了当时没有发现的一些问题和解决方案。

寒亭

47,959

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

一次访问Redis延时高问题排查与总结（2）

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

一次访问Redis延时高问题排查与总结（2）