官方博客-第4页-阿里云开发者社区

子白

2024-05-15

102472

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,472

阿里云瑶池数据库

2024-11-06

1742

大咖说｜Data+AI：企业智能化转型的核心驱动力

阿里云DMS+X：一站式Data+AI平台

阿里云瑶池数据库

1,742

李鹏

2024-05-15

608

Serverless Kubernetes 开发实践：异构资源，按需使用

Kubernetes 作为当今云原生业界标准，具备良好的生态以及跨云厂商能力。Kubernetes 很好的抽象了 IaaS 资源交付标准，使得云资源交付变的越来越简单，与此同时用户期望更多的聚焦于业务自身，做到面向应用交付，Serverless 理念也因此而生。那么如何通过原生 k8s 提供Serverless 能力？如何实现GPU等异构资源按需使用？这里给大家介绍一下我们在Serverless Kubernetes 开发实践：异构资源，按需使用。

李鹏

608

勉成

2024-12-12

599

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

勉成

599

竹兴

2024-05-15

130503

详解MySQL字符集和Collation

MySQL支持了很多Charset与Collation，并且允许用户在连接、Server、库、表、列、字面量多个层次上进行精细化配置，这有时会让用户眼花缭乱。本文对相关概念、语法、系统变量、影响范围都进行了详细介绍，并且列举了有可能让字符串发生字符集转换的情况，以及来自不同字符集的字符串进行比较等操作时遵循的规则。对于最常用的基于Unicode的字符集，本文介绍了Unicode标准与MySQL中各个字符集的关系，尤其详细介绍了当前版本(8.0.34)默认字符集utf8mb4。

竹兴

130,503

涯海

2025-01-23

974

快速定位并优化CPU 与 JVM 内存性能瓶颈

本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路。

涯海

974

雅纯

2024-05-15

103643

一文搞懂需求流程规范的制定方法和落地技巧

随着业务和产品的发展、团队的不断扩大，很多团队都不可避免的会遇到需求流程混乱的问题。虽然有的团队也编写了一些“需求流程规范”的文档，但最终却流于纸面，难以在团队真正落地。如何科学制定并有效落实需求管理规范呢？对此，云效产品经理陈逊进行了非常详细的直播分享，本文是他经验的文字总结。

雅纯

103,643

言澈

2025-02-28

1199

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,199

阿里云云原生

2025-05-14

696

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS)，解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent（iLogtail/LoongCollector）在海外场景的应用，推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案，包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等，并提供了成本优化策略和多目标发送配置指导，帮助企业构建稳定、低成本、高可用的全球日志系统。

阿里云云原生

696

官方博客-第4页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大咖说｜Data+AI：企业智能化转型的核心驱动力

Serverless Kubernetes 开发实践：异构资源，按需使用

如何找出Java进程占用CPU高的元凶

详解MySQL字符集和Collation

快速定位并优化CPU 与 JVM 内存性能瓶颈

一文搞懂需求流程规范的制定方法和落地技巧

进行GPU算力管理

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

官方博客-第4页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大咖说｜Data+AI：企业智能化转型的核心驱动力

Serverless Kubernetes 开发实践：异构资源，按需使用

如何找出Java进程占用CPU高的元凶

详解MySQL字符集和Collation

快速定位并优化CPU 与 JVM 内存性能瓶颈

一文搞懂需求流程规范的制定方法和落地技巧

进行GPU算力管理

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化