DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列，包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。DistilQwen2.5-DS3-0324 系列模型是基于 DeepSeek-V3-0324 通过知识蒸馏技术并引入快思考策略构建，显著提升推理速度，使得在资源受限的设备和边缘计算场景中，模型能够高效执行复杂任务。实验显示，DistilQwen2.5-DS3-0324 系列中的模型在多个基准测试中表现突出，其32B模型效果接近参数量接近其10倍的闭源大模型。

中小企业基于 Data+AI，如何快速构建 AI 应用

AI 时代飞速发展，大模型和 AI 的应用创新不断涌现，面对百花齐放的 AI 模型，阿里云计算平台大数据 AI 解决方案总监魏博文分享如何通过阿里云提供的大数据 AI 一体化平台，解决企业开发难、部署繁、成本高等一系列问题，让中小企业快速搭建 AI 应用。

先锋集结 | Elastic Pioneer 先锋者计划启动，快来加入！

搜索技术江湖的隐藏“扫地僧”，是时候出山了！Elasticsearch 为开发者们搭建了Elastic Pioneer 先锋者计划舞台，在全球开源社区上传你的 Elasticsearch 相关操作，包括演讲 | 文章 | 代码 | 解决方案等贡献，月度榜单可赢取礼品卡+云资源代金券，年度 Top3可直通新加坡 ElasticON 大会，官方打造个人技术 IP，与 AI 搜索一起碰撞更多可能！

2025 AI 势能大会，阿里云大数据 AI 产品升级发布！

2025 AI 势能大会上，阿里云大数据 AI 平台持续创新，贴合 MoE 架构、Reasoning Model 、 Agentic RAG、MCP 等新趋势，带来计算范式变革。多款大数据及 AI 产品重磅升级，助力企业客户高效地构建 AI 模型并落地 AI 应用。

阿里云 AI 搜索开放平台增加 QwQ 模型，为企业和开发者带来更强大的搜索解决方案

阿里云 AI 搜索开放平台的 QwQ 模型功能的加入，将为企业和开发者提供了更强大、更智能的搜索解决方案。通过深度结合大语言模型和联网搜索技术，为用户提供更优质的技术支持和服务，助力您的业务迈向新的高度。

阿里云 AI 搜索开放平台新功能发布：大模型联网能力上线

阿里云 AI 搜索开放平台新增大模型联网能力，通过集成大语言模型（LLM）和联网搜索技术，为用户提供更智能、更全面的搜索体验。提供联网搜索 API，支持 Normal（向量化过滤）、Fast（极速无过滤）、Full（大模型评判过滤）三种策略。

阿里云 AI 搜索开放平台新功能发布：新增 GTE 自部署模型

阿里云 AI 搜索开放平台正式推出 GTE 多语言通用文本向量模型（iic/gte_sentence-embedding_multilingual-base），旨在满足企业全球化业务中的多语言数据处理需求。该模型来源于 ModelScope 模型库，并开放自部署能力，助力企业构建更高并发、更低延迟的多语言搜索与分析系统。

四、最佳实践

云上玩转 DeepSeek 系列之六：阿里云 PAI 上线优化版 DeepSeek，再创模型性能新高

作为国内首个千亿级开源 MoE 模型，DeepSeek-R1 凭借其卓越的代码生成与复杂推理能力，已成为开发者构建智能应用的首选。然而，原始模型在产业落地中面临严峻挑战，部署 671B 满血版模型不仅硬件门槛要求很高，同时吞吐效率和响应延迟也受到了制约。PAI 正式推出了优化版 DeepSeek-R1 模型 DeepSeek-R1-PAI-optimized，将大模型推理效率推向了 Next Level。通过 PAI Model Gallery 可以实现一键部署 DeepSeek-R1-PAI-optimized 模型。

DistilQwen2.5-R1 蒸馏小模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践

DistilQwen 2.5 是人工智能平台 PAI 推出的全新蒸馏大语言模型系列。通过黑盒化和白盒化蒸馏结合的自研蒸馏链路，DistilQwen 2.5各个尺寸的模型在多个基准测试数据集上比原始 Qwen2.5 模型有明显效果提升。这一系列模型在移动设备、边缘计算等资源受限的环境中具有更高的性能，在较小参数规模下，显著降低了所需的计算资源和推理时长。阿里云的人工智能平台 PAI，作为一站式的机器学习和深度学习平台，对 DistilQwen2.5 模型系列提供了全面的技术支持。

PAI-Model Gallery 云上一键部署阶跃星辰新模型 Step1X-Edit

Step1X-Edit模型实现 MLLM 与 DiT 的深度融合，在编辑精度与图像保真度上实现大幅提升，在最新发布的图像编辑基准 GEdit-Bench 中，Step1X-Edit 在语义一致性、图像质量与综合得分三项指标上全面领先现有开源模型，比肩 GPT-4o 与 Gemin。PAI-ModelGallery 支持 Step1X-Edit一键部署方案。

用友畅捷通基于阿里云 MaxCompute 搭建智能数仓的落地实践

畅捷通基于阿里云 MaxCompute 构建智能数仓，解决数据孤岛、大规模复杂数据处理及云原生需求等痛点。通过离线链路实现数据整合与加工，支持指标计算和数据分析场景，构建灵活、高效且可扩展的数据存储与计算体系。

DataWorks 数据集成同步至 Hologres 能力介绍

DataWorks 数据集成是一个稳定高效、弹性伸缩的数据同步平台，致力于提供在复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力，提供低成本、高效率、全场景覆盖的数据同步方案。当我们面向数据库级别，向 Hologres 进行同步时，能够实现简单且快速的同步设置。目前仅需配置一个任务，就能迅速地将一个数据库实例内的所有库表一并传输到 Hologres 中。

DataWorks x Qwen3：数据开发与分析效率再升级！

阿里云一站式智能大数据开发治理平台 DataWorks 正式接入 Qwen3 模型，可支持235B 最大尺寸。用户通过 DataWorks Copilot 智能助手即可调用该模型，通过自然语言交互完成多种代码操作，实现数据开发、数据分析的快速实现。

Hologres x Qwen3 x 函数计算：对接 MCP 构建企业级数据分析 Agent

阿里云实时数仓 Hologres，联合函数计算FC 推出「Hologres + 函数计算 FunctionAI + Qwen3 构建企业级数据分析 Agent」方案，帮助用户快速对接 MCP，高效跨越企业级数据分析 Agent 构建困境。

百观科技基于阿里云 EMR 的数据湖实践分享

百观科技为应对海量复杂数据处理的算力与成本挑战，基于阿里云 EMR 构建数据湖。EMR 依托高可用的 OSS 存储、开箱即用的 Hadoop/Spark/Iceberg 等开源技术生态及弹性调度，实现数据接入、清洗、聚合与分析全流程。通过 DLF 与 Iceberg 的优化、阶梯式弹性调度（资源利用率提升至70%）及倚天 ARM 机型搭配 EMR Trino 方案，兼顾性能与成本，支撑数据分析需求，降低算力成本。

EMR Serverless Spark 在《明日方舟》游戏业务的应用

鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求，采用阿里云 EMR Serverless Spark 替代原有架构。EMR Serverless Spark 是一款兼容开源 Spark 的高性能 Lakehouse 产品，提供丰富的功能支持、优秀的引擎性能以及完善的服务保障，完美匹配鹰角网络大数据架构选型需求。迁移后实现研发效率提升，支持业务快速发展、计算效率提升，增强 SLA 保障，稳定性提升，降低运维成本，并支撑全球化数据架构部署。

碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构，解决了海量数据处理中的资源利用率低、并发能力不足等问题，显著降低了硬件和运维成本。实时查询性能提升8倍，查询出错率减少30倍，集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验，还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。

基于 AI 搜索开放平台用大模型+RAG 给宠物做一个 AI 健康助手

AI 搜索开放平台基于 LLM+RAG 的系统框架，构建“宠物医院 AI 助手”的实践。方案具备多模态 AI 技术，可以实现精准搜索与推荐；PB 级数据实时处理，弹性资源灵活扩展；内置开箱即用模板，支持多行业定制化方案等能力。

大模型落地的关键：如何用 RAG 打造更智能的 AI 搜索

RAG 技术是大模型落地成败的关键：它通过实时检索外部知识，有效解决“幻觉”和知识陈旧问题。阿里云AI搜索开放平台将 RAG 全链路拆解为“即插即用”的组件。开发者无需懂算法就可以像拼乐高一样调用文档解析、多模态理解、QwQ 模型等服务来快速构建专业的基于 RAG 的 AI 系统。从技术探索到价值创造，阿里云正重新定义企业拥抱 AI 的“最优路径”。

AI 搜索开放平台 x Qwen3：智能搜索全栈解决方案新升级

阿里云 AI 搜索开放平台与 Qwen3 模型的深度融合，为企业和开发者提供了从基础能力到复杂场景的全栈解决方案，让智能搜索的落地门槛更低、效率更高、体验更佳。

立马耀：通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统，驱动个性化推荐业务

蝉妈妈旗下蝉选通过迁移到阿里云 Serverless Spark 及 Milvus，解决传统架构性能瓶颈与运维复杂性问题。新方案实现离线任务耗时减少40%、失败率降80%，Milvus 向量检索成本降低75%，支持更大规模数据处理，查询响应提速。

通过阿里云 Milvus 与通义千问 VL 大模型，快速实现多模态搜索

阿里云向量检索服务 Milvus 版是一款云原生、全托管的向量检索引擎，确保与开源 Milvus 的完全兼容，支持自建集群无缝迁移上云。本文主要演示了如何使用阿里云向量检索服务 Milvus 版与通义千问 VL 大模型，提取图片特征，并使用多模态 Embedding 模型，快速实现多模态搜索。基于灵积（Dashscope）模型服务上的通义千问 API以及 Embedding API 来接入图片、文本等非结构化数据 Embedding 为向量的能力。

大数据& AI 产品月刊【2025年4月】

一、产品功能发布

二、最新活动

三、产品快讯

四、最佳实践

大数据与机器学习

热门文章

最新文章

相关产品

相关课程

相关电子书