子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,234

任庆盛

2023-02-22

22052

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

22,052

阿里云实时数仓Hologres

2024-06-27

1692

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎，解决复杂OLAP难题。

阿里云实时数仓Hologres

1,692

阿里云百炼

2024-07-03

487

阿里云百炼模型入门篇-大语言模型

本文主要介绍如何快速的通过阿里云百炼，带你如何快速入门通义千问系列大语言模型。

阿里云百炼

487

望宸彦林

2024-06-24

50725

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

50,725

坤硕

2024-07-29

17730

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

17,730

计缘

2024-09-02

88

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

本文带大家了解一下如何使用阿里云Serverless计算产品函数计算构建生产级别的LLM Chat应用。该最佳实践会指导大家基于开源WebChat组件LobeChat和阿里云函数计算（FC）构建企业生产级别LLM Chat应用。实现同一个WebChat中既可以支持自定义的Agent，也支持基于Ollama部署的开源模型场景。

计缘

88

ModelScope

2024-05-15

1038

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

1,038

阿里云实时数仓Hologres

2024-06-07

128839

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

128,839

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Flink CDC+Kafka 加速业务实时化

实时数仓Hologres OLAP场景核心能力介绍

阿里云百炼模型入门篇-大语言模型

从云原生视角看 AI 原生应用架构的实践

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01