官方博客-第24页-阿里云开发者社区

ModelScope

2024-05-15

505

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

505

阿里云云原生

2024-05-15

55711

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,711

ModelScope

2024-05-15

1143

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,143

执少

2024-05-15

2057

阿里云千亿规模实时日志分析的架构设计和实践

本文为阿里云SLS 执少在《DataFunTalk技术交流会：阿里云实时查询分析专场》分享时的议题内容（文字版本）。首先，阿里云日志服务SLS是一个什么样的产品和服务呢？我们用一句话来概括的话，那就是我们是一个云上的、一站式的、可观测日志服务平台。首先呢，我们提供了强大的日志数据采集能力，支持...

执少

2,057

ModelScope

2024-05-15

1124

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,124

百潼

2024-08-12

8145

敦煌智旅：Serverless 初探，运维提效 60%

SAE 提供了一个开箱即用的 Serverless PaaS 平台，提供了微服务、监控等能力，帮助敦煌智旅很好地解决了发版困难、运维困难、弹性能力不足和资源利用率低等痛点问题。成功实现轻松应对 10 倍突增流量洪峰，运维效率大幅提升。

百潼

8,145

钰诚

2024-08-12

550

使用 Higress 快速构建 AI 应用

Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能，推出了 AI 原生的 API 网关形态并且全部开源。

钰诚

550

问思望宸

2024-08-12

8710

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

8,710

赵源筱

2024-08-19

20108

不改一行代码轻松玩转 Go 应用微服务治理

为了更好的进行 Go 应用微服务治理，提高研发效率和系统稳定性，本文将介绍 MSE 微服务治理方案，无需修改业务代码，实现治理能力。

赵源筱

20,108

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Higress 全新 Wasm 运行时，性能大幅提升

vLLM部署Yuan2.0：高吞吐、更便捷

阿里云千亿规模实时日志分析的架构设计和实践

LISA微调技术解析：比LoRA更低的显存更快的速度

敦煌智旅：Serverless 初探，运维提效 60%

使用 Higress 快速构建 AI 应用

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

不改一行代码轻松玩转 Go 应用微服务治理

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Higress 全新 Wasm 运行时，性能大幅提升

vLLM部署Yuan2.0：高吞吐、更便捷

阿里云千亿规模实时日志分析的架构设计和实践

LISA微调技术解析：比LoRA更低的显存更快的速度

敦煌智旅：Serverless 初探，运维提效 60%

使用 Higress 快速构建 AI 应用

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

不改一行代码轻松玩转 Go 应用微服务治理