官方博客-第19页-阿里云开发者社区

阿里云云原生

2024-10-18

973

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

973

张浩然郭小兵

2024-11-25

517

智能调度、秒级弹性｜一文带你探索Compaction Service的进化之路

ADB MySQL的Compaction Service功能通过将Compaction任务从存储节点解耦至独立的弹性资源池执行，解决了资源隔离性弱、并发度低等问题，实现了资源消耗降低50%，任务执行时间平均减少40%，并支持按量付费，提升了系统的稳定性和成本效益。

张浩然郭小兵

517

易定

2024-12-06

1031

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,031

阿里云网络

2025-01-16

689

NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关洛神云网关

NSDI‘24于4月16-18日在美国圣塔克拉拉市举办，阿里云飞天洛神云网络首次中稿NSDI，两篇论文入选。其中《LuoShen: A Hyper-Converged Programmable Gateway for Multi-Tenant Multi-Service Edge Clouds》提出超融合网关LuoShen，基于Tofino、FPGA和CPU的新型硬件形态，将公有云VPC设施部署到边缘机柜中，实现小型化、低成本和高性能。该方案使成本降低75%，空间占用减少87%，并提供1.2Tbps吞吐量，展示了强大的技术竞争力。

阿里云网络

689

望宸

2025-02-20

644

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

644

亦达

2025-02-20

706

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

706

致问

2023-09-15

120024

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,024

雅纯

2024-05-15

103621

一文搞懂需求流程规范的制定方法和落地技巧

随着业务和产品的发展、团队的不断扩大，很多团队都不可避免的会遇到需求流程混乱的问题。虽然有的团队也编写了一些“需求流程规范”的文档，但最终却流于纸面，难以在团队真正落地。如何科学制定并有效落实需求管理规范呢？对此，云效产品经理陈逊进行了非常详细的直播分享，本文是他经验的文字总结。

雅纯

103,621

探索云世界

2024-05-15

40612

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

幻兽帕鲁最近非常火。有些小伙伴可能不喜欢跟陌生人一起玩，那么你可以搭建一个专有服务器和朋友一起联机游戏。自己搭建服务器不仅更私密，还能自定义游戏里的一些选项，比如调整工作速度倍率、经验获取倍率等。这篇教程将引导你在几分钟内快速完成幻兽帕鲁服务器的搭建。

探索云世界

40,612

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

智能调度、秒级弹性｜一文带你探索Compaction Service的进化之路

【实战干货】AI大模型工程应用于车联网场景的实战总结

NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关洛神云网关

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

一文搞懂需求流程规范的制定方法和落地技巧

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

智能调度、秒级弹性｜一文带你探索Compaction Service的进化之路

【实战干货】AI大模型工程应用于车联网场景的实战总结

NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关 洛神云网关

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

一文搞懂需求流程规范的制定方法和落地技巧

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关洛神云网关