官方博客-第22页-阿里云开发者社区

阿里云云原生

2024-05-15

55710

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,710

言澈

2024-05-15

1453

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

本文是[全景剖析容器网络数据链路]第三部分，主要介绍Kubernetes Terway ENIIP模式下，数据面链路的转转发链路。

言澈

1,453

ModelScope

2024-05-15

1122

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,122

钰诚

2024-08-12

550

使用 Higress 快速构建 AI 应用

Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能，推出了 AI 原生的 API 网关形态并且全部开源。

钰诚

550

问思望宸

2024-08-12

8709

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

8,709

俞嵩白玙

2025-01-26

420

面对全球化的泼天流量，出海企业观测多地域网络质量

网络监控与分析在保证网络可靠性、优化用户体验和提升运营效率方面发挥着不可或缺的作用，对于出海企业应对复杂的网络环境和满足用户需求具有重要意义，为出海企业顺利承接泼天流量保驾护航。

俞嵩白玙

420

望宸

2025-02-20

648

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

648

亦达

2025-02-20

710

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

710

阿里云云原生

2025-02-25

1117

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,117

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

Higress 全新 Wasm 运行时，性能大幅提升

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

LISA微调技术解析：比LoRA更低的显存更快的速度

使用 Higress 快速构建 AI 应用

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

面对全球化的泼天流量，出海企业观测多地域网络质量

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解锁 DeepSeek 安全接入、稳定运行新路径

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Higress 全新 Wasm 运行时，性能大幅提升

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

LISA微调技术解析：比LoRA更低的显存更快的速度

使用 Higress 快速构建 AI 应用

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

面对全球化的泼天流量，出海企业观测多地域网络质量

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解锁 DeepSeek 安全接入、稳定运行新路径