官方博客-第5页-阿里云开发者社区

子白

2024-05-15

102409

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,409

阿里云云原生

2024-05-24

47928

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

使用阿里云函数计算FC，快速部署AI绘画工具ComfyUI，体验高质量图像生成。新用户可享180元试用额度，包括GPU、vCPU、内存和调用次数。开通FC和文件存储NAS，通过应用中心选择ComfyUI模板创建应用。

阿里云云原生

47,928

阿里云瑶池数据库

2024-11-29

889

拥抱Data+AI｜B站引入阿里云DMS+X，利用AI赋能运营效率10倍提升

本篇文章针对B站在运营场景中的痛点，深入探讨如何利用阿里云Data+AI解决方案实现智能问数服务，赋能平台用户和运营人员提升自助取数和分析能力，提高价值交付效率的同时为数据平台减负。

阿里云瑶池数据库

889

承慕

2025-01-02

1201

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

在过去半年，ALB Ingress Controller推出了多项高级特性，包括支持AScript自定义脚本、慢启动、连接优雅中断等功能，增强了产品的灵活性和用户体验。此外，还推出了ingress2Albconfig工具，方便用户从Nginx Ingress迁移到ALB Ingress，以及通过Webhook服务实现更智能的配置校验，减少错误配置带来的影响。在容灾部署方面，支持了多集群网关，提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。

承慕

1,201

丕天

2025-03-21

1080

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,080

阿里云基础设施.

2025-05-01

354

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

354

清都

2023-10-12

131595

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

本文以构建AIGC落地应用ChatBot和构建AI Agent为例，从代码级别详细分享AI框架LangChain、阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践，给大家快速落地AIGC应用提供参考。

清都

131,595

阿里云瑶池数据库

2024-06-25

24737

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

24,737

阿里云云原生

2024-11-01

953

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

953

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

拥抱Data+AI｜B站引入阿里云DMS+X，利用AI赋能运营效率10倍提升

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

AI 推理场景的痛点和解决方案

ACK AI Profiling：从黑箱到透明的问题剖析

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

Serverless GPU：助力 AI 推理加速

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

拥抱Data+AI｜B站引入阿里云DMS+X，利用AI赋能运营效率10倍提升

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

AI 推理场景的痛点和解决方案

ACK AI Profiling：从黑箱到透明的问题剖析

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

Serverless GPU：助力 AI 推理加速