官方博客-第27页-阿里云开发者社区

郑嘉扬何杉

2024-05-15

59018

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

享道出行利用阿里云容器服务ACK，结合AHPA智能弹性与ECS、ECI混合部署，解决了业务潮汐效应带来的弹性滞后和成本问题。

郑嘉扬何杉

59,018

ModelScope

2024-05-15

1131

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,131

阿里云瑶池数据库

2024-05-15

1157

数据库索引回表困难，揭秘PolarDB存储引擎优化技术

PolarDB分布式版存储引擎采用CSM方案均衡资源开销与可用性。

阿里云瑶池数据库

1,157

阿里云瑶池数据库

2024-06-12

60872

突破大表瓶颈｜小鹏汽车使用PolarDB实现百亿级表高频更新和实时分析

PolarDB已经成为小鹏汽车应对TB级别大表标注、分析查询的"利器"。

阿里云瑶池数据库

60,872

阿里云云原生

2024-08-12

471

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

471

阿里云瑶池数据库

2024-08-13

756

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AnalyticDB Spark如何通过向量化引擎提升性能？

阿里云瑶池数据库

756

穿杨

2024-08-21

393

谈谈优雅的钩子--bpftrace

bpftrace是一个内核跟踪工具，简单来说就是在函数上挂个钩子，挂上钩子后就可以将函数的入参和返回值取出来再放入程序进行二次编程，最终能让程序按照我们的意图来对函数进行观测。

穿杨

393

阿里云云原生

2024-08-22

19644

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生

上海经证科技有限公司为有效推进软件项目管理和开发工作，选择了阿里云云效作为 DevOps 解决方案。通过云效，实现了从 0 开始，到现在近百个微服务、数百条流水线与应用交付的全面覆盖，有效支撑了敏捷开发流程。

阿里云云原生

19,644

阿里云云原生

2024-11-01

965

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

965

官方博客-第27页-阿里云开发者社区

类目筛选

内容类型

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

vLLM部署Yuan2.0：高吞吐、更便捷

数据库索引回表困难，揭秘PolarDB存储引擎优化技术

突破大表瓶颈｜小鹏汽车使用PolarDB实现百亿级表高频更新和实时分析

5 大场景上手通义灵码企业知识库 RAG

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

谈谈优雅的钩子--bpftrace

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生

Serverless GPU：助力 AI 推理加速

官方博客-第27页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

vLLM部署Yuan2.0：高吞吐、更便捷

数据库索引回表困难，揭秘PolarDB存储引擎优化技术

突破大表瓶颈｜小鹏汽车使用PolarDB实现百亿级表高频更新和实时分析

5 大场景上手通义灵码企业知识库 RAG

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

谈谈优雅的钩子--bpftrace

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生

Serverless GPU：助力 AI 推理加速