官方博客-第24页-阿里云开发者社区

ModelScope

2024-05-15

1143

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,143

ModelScope

2024-05-15

1124

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,124

百潼

2024-08-12

8145

敦煌智旅：Serverless 初探，运维提效 60%

SAE 提供了一个开箱即用的 Serverless PaaS 平台，提供了微服务、监控等能力，帮助敦煌智旅很好地解决了发版困难、运维困难、弹性能力不足和资源利用率低等痛点问题。成功实现轻松应对 10 倍突增流量洪峰，运维效率大幅提升。

百潼

8,145

钰诚

2024-08-12

550

使用 Higress 快速构建 AI 应用

Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能，推出了 AI 原生的 API 网关形态并且全部开源。

钰诚

550

问思望宸

2024-08-12

8710

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

8,710

赵源筱

2024-08-19

20108

不改一行代码轻松玩转 Go 应用微服务治理

为了更好的进行 Go 应用微服务治理，提高研发效率和系统稳定性，本文将介绍 MSE 微服务治理方案，无需修改业务代码，实现治理能力。

赵源筱

20,108

青风义泊牧思

2024-09-03

839

面向OpenTelemetry的Golang应用无侵入插桩技术

文章主要讲述了阿里云 ARMS 团队与程序语言与编译器团队合作研发的面向OpenTelemetry的Golang应用无侵入插桩技术解决方案，旨在解决Golang应用监控的挑战。

青风义泊牧思等

839

明巍临城水德

2024-11-14

527

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

527

李德

2024-12-06

1335

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,335

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

敦煌智旅：Serverless 初探，运维提效 60%

使用 Higress 快速构建 AI 应用

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

不改一行代码轻松玩转 Go 应用微服务治理

面向OpenTelemetry的Golang应用无侵入插桩技术

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

敦煌智旅：Serverless 初探，运维提效 60%

使用 Higress 快速构建 AI 应用

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

不改一行代码轻松玩转 Go 应用微服务治理

面向OpenTelemetry的Golang应用无侵入插桩技术

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理