官方博客-第23页-阿里云开发者社区

阿里云云原生

2024-10-18

970

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

970

李泽政

2024-11-01

797

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

本文中，阿里云智能集团开发工程师李泽政以 Alinux 为操作环境，讲解模块相比传统头文件有哪些优势，并通过若干个例子，学习如何组织一个 C++ 模块工程并使用模块封装第三方库或是改造现有的项目。

李泽政

797

勉成

2024-12-12

572

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

勉成

572

叶枫

2025-02-06

473

详解智能编码在前端研发的创新应用

接下来，人与智能体的交互将变得更为紧密，比如 N 年以后是否可以逐渐过渡。这个逐渐过渡的过程实际上是温和的，从依赖人类到依赖超大规模算力的转变，可能会取代我们的一些职责。这不仅仅是简单的叠加关系。对于AI和超大规模算力，这是否意味着我们可以大幅度提升软件质量，是否可以缩短研发周期并提高效率，还有创造出更优质的软件并持续发展，这无疑是肯定的。

叶枫

473

言澈

2025-02-28

1167

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,167

阿里云云原生

2025-06-30

417

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

417

阿里云云原生

2025-08-06

388

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

JSON 日志因灵活易扩展而广泛应用，但其海量数据也带来分析挑战。本文系统介绍阿里云日志服务（SLS）中处理 JSON 日志的最佳实践，涵盖数据预处理、索引配置、JSON 函数使用及 SQL 智能生成，助你高效挖掘日志价值。

阿里云云原生

388

屈岳

2023-12-01

62649

SLS支持高精度时间戳和全局排序

日志内容本身是一种重要信息，日志之间的相对顺序也是因果关系的一种反映，某些场景下如果日志内容完全相同，但是日志间的顺序错乱了反映出来的结果可能和真实世界里面的事件完全相反。

屈岳

62,649

非有

2024-05-15

1482

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,482

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

如何找出Java进程占用CPU高的元凶

详解智能编码在前端研发的创新应用

进行GPU算力管理

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

SLS支持高精度时间戳和全局排序

一文详解 Java 限流接口实现

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

如何找出Java进程占用CPU高的元凶

详解智能编码在前端研发的创新应用

进行GPU算力管理

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

SLS支持高精度时间戳和全局排序

一文详解 Java 限流接口实现