ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

360

涯海

2024-05-15

164

链路追踪（Tracing）其实很简单——链路成本进阶指南

广义上的链路成本，既包含使用链路追踪产生的数据生成、采集、计算、存储、查询等额外资源开销，也包含链路系统接入、变更、维护、协作等人力运维成本。为了便于理解，本小节将聚焦在狭义上的链路追踪机器资源成本，人力成本将在下一小节（效率）进行介绍。

涯海

164

阿里云云原生

2024-05-22

60069

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

超算快速弹性伸缩场景下，如何构建一套准确、快速、可靠的监控体系成为关键点。阿里云在超算场景的主机监控落地实践，解决超算场景面临的挑战，交付一套可靠和全面的主机监控体系。

阿里云云原生

60,069

恶来

2023-05-15

6986

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

6,986

ModelScope

2024-05-15

103441

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

103,441

资源编排ROS

2019-12-24

1880

资源编排ROS之自定制资源（基础篇）

本文介绍资源编排ROS的基础知识配置。

资源编排ROS

1,880

继儒

2023-03-21

2237

Hologres技术揭秘，JSON半结构化数据的极致分析性能

本文将会揭秘Hologres JSONB半结构化数据的技术原理，实现JSON半结构数据的极致分析性能。

继儒

2,237

探索云世界

2024-05-15

175526

阿里云 Serverless 异步任务处理系统在数据分析领域的应用

本文主要介绍异步任务处理系统中的数据分析，函数计算异步任务最佳实践-Kafka ETL，函数计算异步任务最佳实践-音视频处理等。

探索云世界

175,526

阿里云大数据Al技术

2024-05-15

77684

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

77,684

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

链路追踪（Tracing）其实很简单——链路成本进阶指南

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

消息队列之 MetaQ 和 Kafka 区别和优势详解

手把手教你捏一个自己的Agent

资源编排ROS之自定制资源（基础篇）

Hologres技术揭秘，JSON半结构化数据的极致分析性能

阿里云 Serverless 异步任务处理系统在数据分析领域的应用

【AAAI 2024】MuLTI：高效视频与语言理解