官方博客-第20页-阿里云开发者社区

非有

2024-05-15

1501

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,501

田双坤禹杨杨孙健翔

2024-05-15

101797

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,797

阿里云大数据Al技术

2024-05-15

78239

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,239

ModelScope

2024-05-15

520

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

520

骐迹

2024-05-15

524

企业SaaS应用加速网络场景最佳实践

企业分支通过SAG接入阿里云SDWAN网络，企业本地员工能够通过阿里云SDWAN应用加速线路实现加速访问SaaS服务，目前方案只支持office365、salesforce、ZOOM，后续会考虑加速逐步增加其他三方应用。

骐迹

524

ModelScope

2024-05-15

1139

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,139

阿里云瑶池数据库

2024-08-13

782

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AnalyticDB Spark如何通过向量化引擎提升性能？

阿里云瑶池数据库

782

殳玄

2025-01-16

1030

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,030

亦达

2025-02-20

726

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

726

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

一文详解 Java 限流接口实现

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

【AAAI 2024】MuLTI：高效视频与语言理解

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

企业SaaS应用加速网络场景最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

现身说法，AI小白的大模型学习路径

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

一文详解 Java 限流接口实现

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

【AAAI 2024】MuLTI：高效视频与语言理解

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

企业SaaS应用加速网络场景最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

现身说法，AI小白的大模型学习路径

破解 vLLM + DeepSeek 规模化部署的“不可能三角”