ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

367

王奇

2023-06-26

8568

Hologres弹性计算在OLAP分析上的实践和探索

本文介绍了OLAP分析在大数据分析中的位置，分析并介绍目前大数据OLAP遇到的分析性能、资源隔离、高可用、弹性扩缩容等核心问题，解析阿里云Hologres是如何解决极致性能、弹性、业务永续、性价比等核心刚需的最佳实践，介绍阿里云Hologres弹性计算组在弹性计算、资源隔离上的探索和创新。

王奇

8,568

里戈

2023-10-26

158089

如何充分发挥 SQL 能力？

如何充分发挥 SQL 能力，是本篇文章的主题。本文尝试独辟蹊径，强调通过灵活的、发散性的数据处理思维，就可以用最基础的语法，解决复杂的数据场景。

里戈

158,089

ModelScope

2024-05-15

324

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

324

周宇睿

2023-09-08

470

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

470

山泽

2024-05-15

308

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

308

林以琳

2024-05-15

747

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

747

阿里云大数据Al技术

2024-05-15

77686

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

77,686

ModelScope

2024-05-15

165

用消费级显卡微调属于自己的Agent

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

ModelScope

165

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

Hologres弹性计算在OLAP分析上的实践和探索

如何充分发挥 SQL 能力？

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

MaxCompute半结构化数据思考与创新

从零构建现代深度学习框架(TinyDL-0.01)

基于PAI-DSW快速启动Stable Diffusion WebUI

【AAAI 2024】MuLTI：高效视频与语言理解

用消费级显卡微调属于自己的Agent