官方博客-第16页-阿里云开发者社区

ModelScope

2024-05-15

505

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

505

ModelScope

2024-05-15

1942

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,942

ModelScope

2024-05-15

1124

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,124

一默

2024-08-26

305

打破传统叙事逻辑，构建基于原子化任务的人机交互

在复杂中后台设计中，为解决配置变更影响多场景问题，提出结合正向和逆向信息架构，采用原子化任务，动态组合任务，降低用户和开发成本，优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

一默

305

阿里云瑶池数据库

2024-11-08

1372

拥抱Data+AI｜破解电商7大挑战，DMS+AnalyticDB助力企业智能决策

本文为数据库「拥抱Data+AI」系列连载第1篇，该系列是阿里云瑶池数据库面向各行业Data+AI应用场景，基于真实客户案例&最佳实践，展示Data+AI行业解决方案的连载文章。本篇内容针对电商行业痛点，将深入探讨如何利用数据与AI技术以及数据分析方法论，为电商行业注入新的活力与效能。

阿里云瑶池数据库

1,372

明巍临城水德

2024-11-14

527

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

527

阿里云云原生

2025-02-25

1118

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,118

阿里云开发者

2025-04-24

1145

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,145

茏久

2023-07-21

138763

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

本文从阿里云用户使用云原生数据仓库AnalyticDB PostgreSQL版（以下简称ADB PG）的实际体验出发，介绍ADB PG如何实现“一站式全文检索”业务，并详细阐述ADB PG使用的优势技术，最后提供对应业务案例分析。

茏久

138,763

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

打破传统叙事逻辑，构建基于原子化任务的人机交互

拥抱Data+AI｜破解电商7大挑战，DMS+AnalyticDB助力企业智能决策

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

解锁 DeepSeek 安全接入、稳定运行新路径

为什么一定要做Agent智能体？

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

打破传统叙事逻辑，构建基于原子化任务的人机交互

拥抱Data+AI｜破解电商7大挑战，DMS+AnalyticDB助力企业智能决策

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

解锁 DeepSeek 安全接入、稳定运行新路径

为什么一定要做Agent智能体？

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理