官方博客-第30页-阿里云开发者社区

亦达

2025-02-20

687

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

687

阿里云开发者

2025-02-20

608

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

阿里云开发者

608

橙唯

2025-02-21

877

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

877

查斌

2023-04-14

572

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间，提升集群间的镜像分发效率。

查斌

572

张佐玮

2023-12-01

1515

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,515

阿里云云原生

2024-05-15

401

从内核的视角观测容器——SysOM 容器监控

阿里云云原生

401

杨永

2024-05-15

757

利用 KMS 对文本信息进行签名验签实践

通过阿里云的KMS产品针对文件或者证书文件进行签名验签，可以有效解决攻击者针对敏感文件、重要文件在传输过程中被篡改，其次可以实现证书双向认证过程中的证书合法性校验，真正做到传输链路安全。

杨永

757

ModelScope

2024-05-15

915

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

915

隆基

2024-05-15

91441

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

本文来学习一个典型的物联网技术架构，以及在这个技术架构里面，消息队列所发挥的作用。在物联网的场景里面，对消息技术的要求和面向服务端应用的消息技术有什么区别？学习 RocketMQ 5.0 的子产品 MQTT，是如何解决这些物联网技术难题的。

隆基

91,441

官方博客-第30页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

基于LLM打造沉浸式3D世界

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Koordinator 助力云原生应用性能提升，小红书混部技术实践

从内核的视角观测容器——SysOM 容器监控

利用 KMS 对文本信息进行签名验签实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

官方博客-第30页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

基于LLM打造沉浸式3D世界

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Koordinator 助力云原生应用性能提升，小红书混部技术实践

从内核的视角观测容器——SysOM 容器监控

利用 KMS 对文本信息进行签名验签实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？