官方博客-第26页-阿里云开发者社区

阿里云云原生

2024-10-18

1046

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

1,046

勉成

2024-12-12

669

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

勉成

669

亦达

2025-02-20

800

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

800

屈岳

2023-12-01

62693

SLS支持高精度时间戳和全局排序

日志内容本身是一种重要信息，日志之间的相对顺序也是因果关系的一种反映，某些场景下如果日志内容完全相同，但是日志间的顺序错乱了反映出来的结果可能和真实世界里面的事件完全相反。

屈岳

62,693

林以琳

2024-05-15

1018

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

1,018

非有

2024-05-15

1576

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,576

云服务器ECS

2024-05-15

125189

倚天使用|YODA倚天应用迁移神器，让跨架构应用迁移变得简单高效

YODA(Yitian Optimal Development Assistant，倚天应用迁移工具)旨在帮助用户更加高效、便捷地实现跨平台、跨结构下的应用迁移，大幅度缩短客户在新平台上端到端性能验证所需的人力和时间，使得客户更加专注于应用本身算法的优化，协同客户实现降本增效。

云服务器ECS

125,189

奶司

2024-05-15

1171

人人都是AI大师 - Prompt工程

prompt工程不需要复杂的编程知识，人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程，不涉及模型训练等内容。只讨论文本生成，不涉及图像等领域。

奶司

1,171

阿里云云原生

2024-08-21

1097

用好通义灵码，让这款 AI 编码助手帮你做更多工作

通义灵码提供了一系列快捷键和配置选项以增强开发体验。

阿里云云原生

1,097

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

如何找出Java进程占用CPU高的元凶

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

SLS支持高精度时间戳和全局排序

基于PAI-DSW快速启动Stable Diffusion WebUI

一文详解 Java 限流接口实现

倚天使用|YODA倚天应用迁移神器，让跨架构应用迁移变得简单高效

人人都是AI大师 - Prompt工程

用好通义灵码，让这款 AI 编码助手帮你做更多工作

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

如何找出Java进程占用CPU高的元凶

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

SLS支持高精度时间戳和全局排序

基于PAI-DSW快速启动Stable Diffusion WebUI

一文详解 Java 限流接口实现

倚天使用|YODA倚天应用迁移神器，让跨架构应用迁移变得简单高效

人人都是AI大师 - Prompt工程

用好通义灵码，让这款 AI 编码助手帮你做更多工作