官方博客-第18页-阿里云开发者社区

丛霄章进十眠

2024-11-06

1711

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

SAE 会继续致力于为用户提供极简易用、成本低廉、功能强大的 Serverless 应用全托管平台：“我们希望让用户做的更少而收获更多，通过 Serverless 化，深度用云就像用水电煤一样简单”。

丛霄章进十眠等

1,711

易定

2024-12-06

1036

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,036

正己

2025-01-06

328

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

328

亦达

2025-02-20

713

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

713

ModelScope

2024-05-15

941

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

941

ModelScope

2024-05-15

1851

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,851

ModelScope

2024-05-15

1145

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,145

赵世振

2025-01-09

2059

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

本文章旨在帮助读者了解并掌握大模型多模态技术的实际应用，特别是如何构建基于多模态的实用场景。文档通过几个具体的多模态应用场景，如拍立淘、探一下和诗歌相机，展示了这些技术在日常生活中的应用潜力。

赵世振

2,059

望宸

2025-02-20

655

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

655

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

【实战干货】AI大模型工程应用于车联网场景的实战总结

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

大模型推理服务全景图

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless 微服务治理神器： 阿里云 SAE 全链路灰度揭秘

【实战干货】AI大模型工程应用于车联网场景的实战总结

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

大模型推理服务全景图

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘