官方博客-第6页-阿里云开发者社区

子白

2024-05-15

102409

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,409

乐忱

2024-06-14

39857

AI时代：云存储加速多模态数据存储与管理创新

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

39,857

丕天

2025-03-21

1081

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,081

赫曦

2024-05-15

93150

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,150

阿里云云原生

2024-05-24

47928

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

使用阿里云函数计算FC，快速部署AI绘画工具ComfyUI，体验高质量图像生成。新用户可享180元试用额度，包括GPU、vCPU、内存和调用次数。开通FC和文件存储NAS，通过应用中心选择ComfyUI模板创建应用。

阿里云云原生

47,928

阿里云瑶池数据库

2024-06-25

24738

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

24,738

寒斜

2024-10-11

997

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

今天分享一下，基于阿里云函数计算 FC 以及 CAP（云应用开发平台），极速托管专属的 CosyVoice 应用。并且我们提供了 API 调用方案以及镜像构建源码方便您根据自己的业务任意 DIY。

寒斜

997

阿里云瑶池数据库

2024-11-29

889

拥抱Data+AI｜B站引入阿里云DMS+X，利用AI赋能运营效率10倍提升

本篇文章针对B站在运营场景中的痛点，深入探讨如何利用阿里云Data+AI解决方案实现智能问数服务，赋能平台用户和运营人员提升自助取数和分析能力，提高价值交付效率的同时为数据平台减负。

阿里云瑶池数据库

889

承慕

2025-01-02

1201

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

在过去半年，ALB Ingress Controller推出了多项高级特性，包括支持AScript自定义脚本、慢启动、连接优雅中断等功能，增强了产品的灵活性和用户体验。此外，还推出了ingress2Albconfig工具，方便用户从Nginx Ingress迁移到ALB Ingress，以及通过Webhook服务实现更智能的配置校验，减少错误配置带来的影响。在容灾部署方面，支持了多集群网关，提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。

承慕

1,201

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

AI时代：云存储加速多模态数据存储与管理创新

AI 推理场景的痛点和解决方案

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

拥抱Data+AI｜B站引入阿里云DMS+X，利用AI赋能运营效率10倍提升

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

AI时代：云存储加速多模态数据存储与管理创新

AI 推理场景的痛点和解决方案

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

拥抱Data+AI｜B站引入阿里云DMS+X，利用AI赋能运营效率10倍提升

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强