官方博客-第21页-阿里云开发者社区

ModelScope

2024-05-15

505

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

505

ModelScope

2024-05-15

1143

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,143

ModelScope

2024-05-15

1124

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,124

阿里云瑶池数据库

2024-11-08

1372

拥抱Data+AI｜破解电商7大挑战，DMS+AnalyticDB助力企业智能决策

本文为数据库「拥抱Data+AI」系列连载第1篇，该系列是阿里云瑶池数据库面向各行业Data+AI应用场景，基于真实客户案例&最佳实践，展示Data+AI行业解决方案的连载文章。本篇内容针对电商行业痛点，将深入探讨如何利用数据与AI技术以及数据分析方法论，为电商行业注入新的活力与效能。

阿里云瑶池数据库

1,372

李德

2024-12-06

1335

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,335

阿里云云原生

2025-02-25

1118

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,118

阿里云MaxCompute

2023-09-27

1422

深入MaxCompute，人力家借助Information Schema合理治理费用

本文将为大家带来MaxCompute与人力家客户案例深度解读。

阿里云MaxCompute

1,422

星铱

2023-10-19

54128

PolarDB-X 企业级特性之行级访问权限控制

本文介绍PolarDB-X数据库实现了基于标签的访问控制功能，可以在行、列级别对数据访问进行控制，精细化的限制用户对数据的访问和操作，保证了读写数据的安全。下文根据实际应用场景，介绍PolarDB-X的LBAC功能设计以及使用方法。

星铱

54,128

孟威

2024-05-15

105531

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,531

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

拥抱Data+AI｜破解电商7大挑战，DMS+AnalyticDB助力企业智能决策

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

解锁 DeepSeek 安全接入、稳定运行新路径

深入MaxCompute，人力家借助Information Schema合理治理费用

PolarDB-X 企业级特性之行级访问权限控制

SLS 大模型可观测&安全推理审计标准解决方案

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

拥抱Data+AI｜破解电商7大挑战，DMS+AnalyticDB助力企业智能决策

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

解锁 DeepSeek 安全接入、稳定运行新路径

深入MaxCompute，人力家借助Information Schema合理治理费用

PolarDB-X 企业级特性之行级访问权限控制

SLS 大模型可观测&安全推理审计标准解决方案