官方博客-第20页-阿里云开发者社区

阿里云云原生

2024-05-15

55710

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,710

ModelScope

2024-05-15

1122

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,122

问思望宸

2024-08-12

8709

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

8,709

耘越

2024-10-29

1437

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,437

如葑

2024-11-11

754

应用网关的演进历程和分类

唯一不变的是变化，在现代复杂的商业环境中，企业的业务形态与规模往往处于不断变化和扩大之中。这种动态发展对企业的信息系统提出了更高的要求，特别是在软件架构方面。为了应对不断变化的市场需求和业务扩展，软件架构必须进行相应的演进和优化。网关作为互联网流量的入口，其形态也在跟随软件架构持续演进迭代中。我们下面就聊一聊网关的演进历程以及在时下火热的 AI 浪潮下，网关又会迸发怎样新的形态。

如葑

754

俞嵩白玙

2025-01-26

420

面对全球化的泼天流量，出海企业观测多地域网络质量

网络监控与分析在保证网络可靠性、优化用户体验和提升运营效率方面发挥着不可或缺的作用，对于出海企业应对复杂的网络环境和满足用户需求具有重要意义，为出海企业顺利承接泼天流量保驾护航。

俞嵩白玙

420

望宸

2025-02-20

648

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

648

亦达

2025-02-20

710

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

710

阿里云云原生

2025-02-25

1117

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,117

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

Higress 全新 Wasm 运行时，性能大幅提升

LISA微调技术解析：比LoRA更低的显存更快的速度

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

AI 辅助编程的效果衡量

应用网关的演进历程和分类

面对全球化的泼天流量，出海企业观测多地域网络质量

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解锁 DeepSeek 安全接入、稳定运行新路径

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Higress 全新 Wasm 运行时，性能大幅提升

LISA微调技术解析：比LoRA更低的显存更快的速度

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

AI 辅助编程的效果衡量

应用网关的演进历程和分类

面对全球化的泼天流量，出海企业观测多地域网络质量

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解锁 DeepSeek 安全接入、稳定运行新路径