官方博客-第8页-阿里云开发者社区

子白

2024-05-15

102416

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,416

陈浩章颖强

2024-08-23

276

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

数据库领域顶会 ICDE 2024于5月13-17日在荷兰乌特勒支（Utrecht, Netherlands）举办。ICDE (The International Conference on Data Engineering) 与VLDB、SIGMOD被公认为是国际数据管理领域三大顶级学术会议，此次在荷兰召开的ICDE 2024大会，共吸引北京大学、清华大学、浙江大学、MIT、斯坦福等机构，以及谷歌、微软、阿里云、华为、字节等公司的近1000名人员参会，共同探讨AI、数据库、数据处理领域的前沿技术问题。

陈浩章颖强

276

浅奕

2024-09-05

376

通过实验深入了解 TCP 连接的建立和关闭

TCP/IP 这个主题很多文章比较陈旧，且以讹传讹的东西太多，所以本文作者结合了理论和实践去写，旨在通过一系列实验帮助读者深入理解 TCP 连接的建立过程。

浅奕

376

烨陌

2024-09-05

371

软件测试之道 -- 做一个有匠心的程序员

作者一年前围绕设计模式与代码重构写了一篇《代码整洁之道 -- 告别码农，做一个有思想的程序员！》的文章。本文作为续篇，从测试角度谈程序员对软件质量的追求。

烨陌

371

丛霄章进十眠

2024-11-06

1692

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

SAE 会继续致力于为用户提供极简易用、成本低廉、功能强大的 Serverless 应用全托管平台：“我们希望让用户做的更少而收获更多，通过 Serverless 化，深度用云就像用水电煤一样简单”。

丛霄章进十眠等

1,692

探索云世界

2024-12-20

479

RDS通用云盘核心能力

本次实验主要体验RDS通用云盘的三项核心能力：IO加速、IO突发和数据归档。首先创建实验资源，包括RDS MySQL实例和ECS实例，耗时约5分钟。接着通过sysbench导入数据并配置安全设置。在体验阶段，我们对比了开启和关闭IO加速及IO突发功能对RDS性能的影响，观察到QPS有显著差异。最后，通过将数据从云盘迁移到OSS中，展示了冷存层的数据归档功能，并进行RDS硬盘缩容，验证了其成本优势。整个实验过程详细记录了每一步操作，确保用户能直观感受到RDS通用云盘带来的性能提升和成本优化。

探索云世界

479

丕天

2025-03-21

1090

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,090

阿里云云原生

2025-05-14

650

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS)，解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent（iLogtail/LoongCollector）在海外场景的应用，推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案，包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等，并提供了成本优化策略和多目标发送配置指导，帮助企业构建稳定、低成本、高可用的全球日志系统。

阿里云云原生

650

资源编排ROS

2023-12-01

669

从零开始使用 ROS CDK 搭建云上解决方案

本文介绍了如何使用阿里云ROS资源编排服务快速部署和管理云资源。主要内容包括：1. 工具准备：安装ROSCDK,选择合适的代码编辑器和IDE,安装AI代码生成插件等。2. 环境准备：创建工程目录，进入虚拟环境，配置阿里云凭证信息，配置ROSCDK。3. 代码编写：根据文档描述，编写ROS代码来创建VPC、VSwitch、ECS等资源。4. 运行代码：执行ROS代码，创建ECS实例并部署FTP服务。总体来说，本文通过简单的步骤，让小白也能快速上手使用ROS资源编排服务，实现自动化部署和管理阿里云资源。

资源编排ROS

669

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

通过实验深入了解 TCP 连接的建立和关闭

软件测试之道 -- 做一个有匠心的程序员

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

RDS通用云盘核心能力

AI 推理场景的痛点和解决方案

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

从零开始使用 ROS CDK 搭建云上解决方案

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

通过实验深入了解 TCP 连接的建立和关闭

软件测试之道 -- 做一个有匠心的程序员

Serverless 微服务治理神器： 阿里云 SAE 全链路灰度揭秘

RDS通用云盘核心能力

AI 推理场景的痛点和解决方案

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

从零开始使用 ROS CDK 搭建云上解决方案

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘