官方博客-第27页-阿里云开发者社区

亦达

2025-02-20

800

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

800

偏左

2023-08-28

21439

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

21,439

石樵

2023-12-01

3076

分布式锁实现原理与最佳实践

在单体的应用开发场景中涉及并发同步时，大家往往采用Synchronized（同步）或同一个JVM内Lock机制来解决多线程间的同步问题。而在分布式集群工作的开发场景中，就需要一种更加高级的锁机制来处理跨机器的进程之间的数据同步问题，这种跨机器的锁就是分布式锁。接下来本文将为大家分享分布式锁的最佳实践。

石樵

3,076

凡玺

2024-05-15

121986

Ganos实时热力聚合查询能力解析与最佳实践

本文主要介绍Ganos实时热力聚合查询并动态输出热力瓦片能力，依托阿里云PolarDB PostgreSQL产品、ADB PostgreSQL和RDS PostgreSQL 三款数据库建设输出。

凡玺

121,986

探索云世界

2024-05-15

162757

充分发挥 SQL 能力

MaxCompute（ODPS）SQL 发展到今天已经颇为成熟，作为一种 SQL 方言，可以高效地应用在各种数据处理场景。本文尝试独辟蹊径，强调通过灵活的、发散性的数据处理思维，就可以用最基础的语法，解决复杂的数据场景。

探索云世界

162,757

刘军

2024-06-18

17062

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

本文展示了 Dubbo3 triple 协议是如何简化从协议规范与实现上简化开发测试、入口流量接入成本的，同时提供高性能通信、面向接口的易用性编码。

刘军

17,062

自扬

2024-08-16

8860

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

本文从“空间”这一维度，聊一聊PolarDB-X在跨空间部署能力上的不断发展和延伸，以及在不同空间范围下的高可用和容灾能力，并着重介绍一下最新的产品能力——GDN(Global Database Network)。

自扬

8,860

阿里云云原生

2024-08-21

1097

用好通义灵码，让这款 AI 编码助手帮你做更多工作

通义灵码提供了一系列快捷键和配置选项以增强开发体验。

阿里云云原生

1,097

陈浩章颖强

2024-08-23

318

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

数据库领域顶会 ICDE 2024于5月13-17日在荷兰乌特勒支（Utrecht, Netherlands）举办。ICDE (The International Conference on Data Engineering) 与VLDB、SIGMOD被公认为是国际数据管理领域三大顶级学术会议，此次在荷兰召开的ICDE 2024大会，共吸引北京大学、清华大学、浙江大学、MIT、斯坦福等机构，以及谷歌、微软、阿里云、华为、字节等公司的近1000名人员参会，共同探讨AI、数据库、数据处理领域的前沿技术问题。

陈浩章颖强

318

官方博客-第27页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

分布式锁实现原理与最佳实践

Ganos实时热力聚合查询能力解析与最佳实践

充分发挥 SQL 能力

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

用好通义灵码，让这款 AI 编码助手帮你做更多工作

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

官方博客-第27页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

分布式锁实现原理与最佳实践

Ganos实时热力聚合查询能力解析与最佳实践

充分发挥 SQL 能力

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

用好通义灵码，让这款 AI 编码助手帮你做更多工作

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移