官方博客-第21页-阿里云开发者社区

亦达

2025-02-20

799

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

799

ModelScope

2024-05-15

660

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

660

林以琳

2024-05-15

1015

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

1,015

杨永

2024-05-15

809

利用 KMS 对文本信息进行签名验签实践

通过阿里云的KMS产品针对文件或者证书文件进行签名验签，可以有效解决攻击者针对敏感文件、重要文件在传输过程中被篡改，其次可以实现证书双向认证过程中的证书合法性校验，真正做到传输链路安全。

杨永

809

ModelScope

2024-05-15

425

用消费级显卡微调属于自己的Agent

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

ModelScope

425

别象

2024-08-06

7501

通义灵码代码搜索功能的前沿性研究论文被软件工程国际顶会 FSE 录用

阿里云通义灵码团队与重庆大学合作的研究论文被 FSE Industry 2024 (CCF A) 录用，该论文通过对阿里云开发的智能编码插件进行实证调查，主要探讨了在智能编码助手中的代码搜索问题，点击本文查看论文详解。

别象

7,501

阿里云云原生

2024-09-14

556

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

本⽂对敏感信息拦截插件的使用方式和实现原理进行了简单介绍，它能够自动检测并处理请求和响应中的敏感词，有效防止敏感信息泄露。通过对不同数据范围的支持和灵活的配置选项，该插件能够适应各种应用场景，确保数据的安全性和合规性。

阿里云云原生

556

耘越

2024-10-29

503

运用通义灵码有效管理遗留代码：提升代码质量与可维护性

本文首先介绍了遗留代码的概念，并对遗留代码进行了分类。针对不同类型的遗留代码，提供了相应的处理策略。此外，本文重点介绍了通义灵码在维护遗留代码过程中能提供哪些支持。

耘越

503

阿里云大数据Al技术

2024-05-15

78284

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,284

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

基于PAI-DSW快速启动Stable Diffusion WebUI

利用 KMS 对文本信息进行签名验签实践

用消费级显卡微调属于自己的Agent

通义灵码代码搜索功能的前沿性研究论文被软件工程国际顶会 FSE 录用

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

运用通义灵码有效管理遗留代码：提升代码质量与可维护性

【AAAI 2024】MuLTI：高效视频与语言理解

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

基于PAI-DSW快速启动Stable Diffusion WebUI

利用 KMS 对文本信息进行签名验签实践

用消费级显卡微调属于自己的Agent

通义灵码代码搜索功能的前沿性研究论文被软件工程国际顶会 FSE 录用

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

运用通义灵码有效管理遗留代码：提升代码质量与可维护性

【AAAI 2024】MuLTI：高效视频与语言理解