ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

阿里云大数据Al技术

2024-07-31

7057

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,057

资源编排ROS

2019-12-24

1904

资源编排ROS之自定制资源（基础篇）

本文介绍资源编排ROS的基础知识配置。

资源编排ROS

1,904

偏左

2023-08-28

20806

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

20,806

安正

2023-08-31

1120

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

在多维度的优化加持下，Alibaba Cloud Linux 3 解决了 AI 开发人员的痛点问题，让 AI 开发体验更容易更高效。

安正

1,120

张佐玮

2023-12-01

926

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

926

CloudImagine

2024-05-15

123

AIGC下一步：用AI再度重构或优化媒体处理

LiveVideoStackCon2023深圳站，阿里云视频云演讲分享

CloudImagine

123

ModelScope

2024-05-15

428

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

428

太业

2024-06-03

41509

iLogtail 2.0 重大升级，端上支持 SPL

日志数据格式可能是多样且复杂的，iLogtail 插件配置模式已经可以很好的支持复杂数据的处理。iLogtail2.0 又带来了 SPL 语法的重大支持，在日志处理场景下，可以通过多级管道对数据进行交互式、递进式的探索和处理，从配置交互和性能上，都有比较大的提升和优化。iLogtail2.0 已经在逐步灰度中，欢迎大家体验和使用。

太业

41,509

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

OSS数据源一站式RAG最佳实践

资源编排ROS之自定制资源（基础篇）

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

Koordinator 助力云原生应用性能提升，小红书混部技术实践

AIGC下一步：用AI再度重构或优化媒体处理

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

iLogtail 2.0 重大升级，端上支持 SPL