官方博客-第19页-阿里云开发者社区

ModelScope

2024-05-15

1143

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,143

ModelScope

2024-05-15

1124

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,124

百潼

2024-08-12

8145

敦煌智旅：Serverless 初探，运维提效 60%

SAE 提供了一个开箱即用的 Serverless PaaS 平台，提供了微服务、监控等能力，帮助敦煌智旅很好地解决了发版困难、运维困难、弹性能力不足和资源利用率低等痛点问题。成功实现轻松应对 10 倍突增流量洪峰，运维效率大幅提升。

百潼

8,145

李德

2024-12-06

1335

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,335

阿里云云原生

2025-01-06

1833

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

想象一下，只需简单几步操作，就能生成逼真的语音效果，无论是为客户服务还是为游戏角色配音，都能轻松实现。GPT-Sovits 模型，其高效的语音生成能力为实现自然、流畅的语音交互提供了强有力的技术支持。本文将详细介绍如何利用函数计算平台部署 GPT-Sovits 模型，以构建一个高效、可扩展的 AI 语音交互系统。通过这一部署方案，开发者和企业能够快速集成语音合成功能，实现从文本到语音的无缝转换，进而推动智能语音应用的创新和发展。

阿里云云原生

1,833

阿里云云原生

2025-02-25

1118

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,118

阿里云云原生

2025-06-20

602

Function AI 工作流发布：以 AI 重塑企业流程自动化

本文介绍了基于函数计算 FC 打造的全新 Function AI 工作流服务，该服务结合 AI 技术与流程自动化，实现从传统流程自动化到智能流程自动化的跨越。文章通过内容营销素材生成、内容安全审核和泛企业 VOC 挖掘三个具体场景，展示了 Function AI 工作流的设计、配置及调试过程，并对比了其与传统流程的优势。Function AI 工作流具备可视化、智能性和可扩展性，成为企业智能化转型的重要基础设施，助力企业提升效率、降低成本并增强敏捷响应能力。

阿里云云原生

602

资源编排ROS

2023-12-01

683

从零开始使用 ROS CDK 搭建云上解决方案

本文介绍了如何使用阿里云ROS资源编排服务快速部署和管理云资源。主要内容包括：1. 工具准备：安装ROSCDK,选择合适的代码编辑器和IDE,安装AI代码生成插件等。2. 环境准备：创建工程目录，进入虚拟环境，配置阿里云凭证信息，配置ROSCDK。3. 代码编写：根据文档描述，编写ROS代码来创建VPC、VSwitch、ECS等资源。4. 运行代码：执行ROS代码，创建ECS实例并部署FTP服务。总体来说，本文通过简单的步骤，让小白也能快速上手使用ROS资源编排服务，实现自动化部署和管理阿里云资源。

资源编排ROS

683

非有

2024-05-15

1488

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,488

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

敦煌智旅：Serverless 初探，运维提效 60%

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

解锁 DeepSeek 安全接入、稳定运行新路径

Function AI 工作流发布：以 AI 重塑企业流程自动化

从零开始使用 ROS CDK 搭建云上解决方案

一文详解 Java 限流接口实现

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

敦煌智旅：Serverless 初探，运维提效 60%

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

解锁 DeepSeek 安全接入、稳定运行新路径

Function AI 工作流发布：以 AI 重塑企业流程自动化

从零开始使用 ROS CDK 搭建云上解决方案

一文详解 Java 限流接口实现