ModelScope模型即服务-文章-第3页-阿里云开发者社区

阿尔的代码屋

|

4月前

|

监控前端开发 API

|

博文

[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent

本节我们将理论付诸实践，利用 LlamaIndex 的 ReAct 框架和 Qwen3 模型，手搓一个全自动的博客监控 Agent。通过为大模型接入 RSS 读取、邮件与微信发送等外部工具，让它从‘聊天机器人’进化为‘能干活的数字员工’。

476 10 12

1447793971480370

|

4月前

|

博文

双 Transformer + 双神经符号 + 突触耦合 + DeepSeek 插件极简验证

双 Transformer + 双神经符号做核心，用类脑突触耦合中间层做动态配对，嵌入 DeepSeek 的 Engram 和 MHC 补长程和记忆短板，也不知道行不行。

202 6 6

游客5ghrq7wwljqxu

|

4月前

|

算法 API 网络架构

|

博文

如何高效对接新加坡股票（SGX）实时数据 API

新加坡股市（SGX）汇聚优质REITs、DBS/UOB银行股及航运企业。本文详解如何用StockTV全球金融API（countryId=15）快速获取实时行情、K线、STI指数等数据，支持REST/WS，低门槛、高时效，助力东南亚金融产品开发。（239字）

501 12 12

大米1003

|

4月前

|

人工智能算法 Cloud Native

|

博文

【深度思考】当代码无法解决增长焦虑：一场关于“组织操作系统”的重构与意识进化

本文提出“意识进化模型”与“三账户核算体系”，以大型企业转型实践为基，超越KPI，将组织视为生命体：通过意识光谱诊断、七力雷达评估、85/15杠铃预算、良知效能比（CER）等机制，重写组织“操作系统”，推动从创伤防御态迈向使命驱动态，实现技术与人性的协同进化。（239字）

205 1 2

modelscope

|

4月前

|

JSON 人工智能 Shell

|

博文

用 4B 小模型做Code Agent的SubAgent？这个开源项目做到了

LocoOperator-4B 是 LocoreMind 推出的 4B 开源蒸馏模型，专为代码库探索优化：本地运行、零 API 成本，结构化工具调用（Read/Grep/Glob/Bash 等）准确率达 100%。它替代 Code Agent 中的子智能体，显著降本增效。（239 字）

896 18 18

modelscope

|

4月前

|

机器学习/深度学习测试技术 API

|

博文

Qwen3.5 中等规模模型系列正式开源：更强智能，更低算力

通义千问Qwen3.5发布四款中等规模多模态模型，支持256K原生上下文（可扩至1M）、201种语言及统一视觉语言训练。凭借Gated Delta+MoE混合架构与百万Agent强化学习，35B-A3B仅激活3B参数即超越旧旗舰，性能、效率与部署成本兼具。（239字）

8884 23 28

游客ul4n4qhqvhsfe

|

4月前

|

人工智能自然语言处理 JavaScript

|

博文

Deepseek百万 Token 窗口的极限实践：一位非专业人员使用实录

摘要：此文非技术评测，而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业，从事生物医学与心理学工作，人文爱好者。利用十天时间，通过浏览器deepseek云端模型百万token对话窗口，实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。时间：2026 年 2 月

760 3 4

modelscope

|

4月前

|

机器学习/深度学习人工智能编解码

|

博文

春节前，DeepSeek、智谱、百度、腾讯四大团队密集开源新一代OCR小模型，全面采用视觉语言模型（VLM）架构，摒弃传统流水线，迈向“语义结构化”新纪元。DeepSeek-OCR2首创“视觉因果流”，GLM-OCR以0.9B参数登顶OmniDocBench榜首，PaddleOCR-VL-1.5攻克真实退化场景，Youtu-Parsing实现22倍推理加速——国产OCR正以架构创新实现垂直领域“换道超车”。

1053 4 5

modelscope

|

4月前

|

自然语言处理前端开发测试技术

|

博文

魔搭社区+OpenVINO™ 加速部署 Qwen3-ASR 实战

通义千问新推Qwen3-ASR语音识别模型（1.7B/0.6B），支持52种语言及方言，具备高鲁棒性与流式长音频转写能力。联合魔搭社区与Intel® OpenVINO™，实现Intel平台极致加速部署，提供完整开源教程、Notebook示例及Gradio交互Demo。（239字）

2981 6 6

modelscope

|

4月前

|

编解码自然语言处理语音技术

|

博文

魔搭社区+OpenVINO™ 加速部署 Qwen3-TTS 实战

通义千问推出Qwen3-TTS系列开源语音模型，支持中英日韩等10种语言，具备声音克隆、情感适配与高保真端到端合成能力；结合Intel OpenVINO™可在CPU上高效推理，无需GPU，轻松部署于边缘设备。（239字）

1822 7 7

modelscope

|

4月前

|

机器学习/深度学习 JSON 文字识别

|

博文

0.9B 小模型，OCR 大能力——GLM-OCR 模型实战教程

智谱开源多模态OCR模型GLM-OCR，基于GLM-V架构，融合CogViT视觉编码器与GLM-0.5B语言解码器，支持公式、表格、代码等复杂文档识别，性能达OmniDocBench榜首（94.62分），仅0.9B参数，轻量高效，开箱即用。

3237 3 3

modelscope

|

4月前

|

人工智能语音技术芯片

|

博文

MiniCPM-o 4.5 CookBook：9B 参数玩转多模态全双工交互

MiniCPM-o 4.5是9B参数多模态大模型，支持图像、视频、音频、文本输入与高质量文/语音输出。具备领先视觉理解（OpenCompass平均77.6分）、实时中英双语语音对话、全双工流式交互、高精度OCR及30+语言能力，适配CPU/GPU/国产芯片，支持本地部署与微调。（239字）

1213 5 6

modelscope

|

4月前

|

机器学习/深度学习人工智能算法

|

博文

自进化≠自我刷题，Agent 真正的突破口是「自己造环境」？——6 位领域学者 · 7 大议题 · 2 万字圆桌观点实录

AI AMA首期聚焦“Agent自进化”，由魔搭等联合发起，邀请翟云鹏主持及5位顶会作者深度对谈。围绕定义、泛化能力、反馈信号、评估体系等7大议题，探讨Agent如何突破“从零开始”瓶颈，实现类人经验积累与策略优化。（239字）

491 6 6

modelscope

|

4月前

|

人工智能算法测试技术

|

博文

Boss直聘开源Nanbeige4.1-3B：小模型全能新标杆

Boss直聘南北阁实验室发布Nanbeige4.1-3B：一款仅3B参数的“小而全”统一模型，首次在同规模中系统整合强推理、人类偏好对齐与深度搜索Agent能力，性能超越Qwen3-32B等大模型，已开源权重、技术报告及合成数据。

1446 5 6

modelscope

|

4月前

|

机器学习/深度学习存储自然语言处理

|

博文

蚂蚁集团 Ling-2.5-1T 开源：万亿参数，重新定义"又快又强"

Ling-2.5-1T是蚂蚁集团inclusionAI推出的开源即时大模型（MIT协议），以“效率×效果”为核心：万亿参数、63B激活，首创混合线性注意力架构，支持百万token上下文；推理吞吐大幅提升，AIME任务仅需1/3 token即达前沿思考模型水平。ModelScope可下载。

941 4 5

modelscope

|

4月前

|

机器学习/深度学习自然语言处理 API

|

博文

Qwen3.5：迈向原生多模态智能体

除夕夜，通义千问发布Qwen3.5-397B-A17B：全球首个原生多模态MoE大模型，总参3970亿、仅激活170亿参数，性能媲美万亿模型；支持201种语言、超强视觉理解与GUI智能体能力，已开源至GitHub与ModelScope。

4930 4 7

modelscope

|

4月前

|

自然语言处理测试技术 Python

|

博文

小红书开源发布 FireRed-Image-Edit 1.0：高质量训练数据，性能屠榜三项核心评测

2月14日，小红书FireRedTeam开源FireRed-Image-Edit-1.0图像编辑模型。该模型在ImgEdit、GEdit等基准测试中全面超越现有开源方案，风格迁移（4.97分）等维度甚至优于Nano-Banana、Seedream4.0等闭源模型，支持文本保留、老照片修复、多图虚拟试衣等能力。

1477 6 6

modelscope

|

4月前

|

缓存架构师前端开发

|

博文

MiniMax M2.5 开源，低成本Agent时代来了！社区Day0部署、工具调用、推理&提示词参数实战来啦！

2月13日，MiniMax发布M2.5大模型，108天内三连更！编程（SWE-Bench 80.2%）、搜索（BrowseComp 76.3%）、办公场景全面领先，开源权重已上线ModelScope，支持API调用、本地部署及工具调用。

4054 7 9

modelscope

|

4月前

|

机器学习/深度学习编解码 JSON

|

博文

FantasyWorld 正式开源！一次前向传播，同时生成视频与 3D 几何——视频世界模型的新范

高德地图发布「FantasyWorld」——新一代几何一致世界模型，单次前向即可生成高质量视频与3D场景（深度图、点云、相机轨迹），无需后处理或逐场景优化。ICLR 2026录用，WorldScore榜首，已开源代码与模型。

1019 6 6

modelscope

|

4月前

|

机器学习/深度学习人工智能资源调度

|

博文

万亿参数、混合线性架构、开源免费——Ring-2.5-1T 来了，思考模型卷到新高度

蚂蚁inclusionAI发布开源万亿参数思考模型Ring-2.5-1T，首创混合线性注意力架构，实现“快、深、长”三大突破：推理吞吐提升3倍+，IMO/CMO达金牌水平，可在Claude Code中连续2小时开发可运行的迷你操作系统。MIT协议完全开源。

662 21 21

modelscope

|

4月前

|

数据采集机器学习/深度学习人工智能

|

博文

全球Top下载中文开源数据集更新｜OpenCSG持续打造中文高质量数据集开源底座

OpenCSG正式发布Fineweb-Edu-Chinese V2.2数据集：覆盖预训练（1.5T tokens，质量分层）与SFT微调（143.7万条DeepSeek V3.2蒸馏问答对）全流程，严格事实锚定、支持溯源，是当前少有的高质量中文教育全栈数据解决方案。

414 13 14

modelscope

|

4月前

|

机器学习/深度学习人工智能算法

|

博文

GLM-5开源：迈向Agentic Engineering新范式，社区Day0 部署、推理实战来了！

智谱发布GLM-5：开源SOTA大模型，Coding与Agent能力双强，真实编程体验媲美Claude Opus 4.5；全球AI榜单排名第四、开源第一；MIT协议开源，支持复杂系统工程与长程Agent任务。

3210 5 5

游客2ybt27odjah3k

|

4月前

|

存储自然语言处理 Java

|

博文

OoderAgent 能力中心与能力库技术白皮书(V0.7.3)

OoderAgent平台核心由能力中心（SkillCenter）与能力库（ooder-skills）构成：前者统一管理技能生命周期、市场运营与P2P调度；后者提供40+模块化、场景驱动的多语言（Java/Node/Python）技能包，支持GitHub/Gitee一键发现安装。

267 4 4

1233720155854565

|

4月前

|

人工智能语音技术云计算

|

博文

书尖 AI 功能实测｜阿里云 AI 技术加持，与喜马拉雅听书体验深度对比

在阿里云AI赋能下，书尖AI实测展现三大优势：1.2亿册全品类书库、双人互动式AI播客、2分钟极速提炼书籍精华，并依托阿里云TTS实现自然听书体验。相较喜马拉雅，其AI深度解读与定制化能力更胜一筹。（239字）

781 9 9

1233720155854565

|

4月前

|

人工智能语音技术云计算

|

博文

书尖 AI 功能实测｜基于阿里云 AI 技术，与微信读书阅读体验对比

本文深度实测阿里云赋能的智能阅读工具“书尖AI”，对比微信读书，客观呈现其1.2亿册书库、双人AI播客听书、2分钟极速解读等核心优势，展现高效轻松的智能阅读新体验。（239字）

941 8 8

小刘的大模型笔记

|

4月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

PPO 应用 —— 大模型偏好优化的核心场景与落地思路

本文详解PPO算法在大模型RLHF落地中的核心应用：聚焦对话风格、客服话术、内容生成、安全合规、垂直领域及多模态六大场景，强调“偏好定制化”价值。全程无代码，提供4步落地法与3大实操要点，助力企业高效实现大模型优化。（239字）

412 11 11

modelscope

|

4月前

|

机器学习/深度学习自然语言处理搜索推荐

|

博文

蚂蚁百灵全模态 Ming-flash-omni-2.0 开源！视觉百科+可控语音生成+全能型图像编辑，打破全模态“博而不精”

2月11日，蚂蚁百灵团队开源全模态大模型Ming-flash-omni-2.0（基于Ling-2.0 MoE架构），在视觉理解、语音交互与图像编辑三大领域实现代际跃迁，达开源领先水平。支持多模态统一生成与深度编辑，模型权重与代码已开放。

957 4 4

深语人工智能DeepNLP

|

4月前

|

人工智能 JSON 监控

|

博文

基于 AgentScope x AI Agent A2Z部署平台的生产级别Agent上线Live实战分享

本文分享如何用AgentScope框架+AI Agent A2Z平台，一键完成AI Agent生产级部署：解决“开发易、上线难”痛点，快速生成标准/chat接口（如https://agentscope.aiagenta2z.com/deep_research_agent/chat），支持高并发、实时监控与冷启动。

608 5 5

modelscope

|

4月前

|

机器学习/深度学习并行计算算法

|

博文

LLaDA2.1 正式开源，可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限

蚂蚁研究院发布LLaDA2.1，首创“可纠错编辑（ECE）”机制，突破扩散语言模型（dLLM）速度与质量瓶颈：推理达892 TPS，支持极速/质量双模式，并集成业界首个dLLM强化学习框架EBPO。开源即用，迈向真正可用的下一代大模型。

570 6 6

modelscope

|

4月前

|

人工智能文字识别物联网

|

博文

ModelScope魔搭社区发布月报 -- 26年2月

临近年关，ModelScope迎来春节模型发布潮：Qwen3、GLM-4.7、MiniMax M2.1等大模型密集上新；AIGC生图、语音合成、具身智能全面突破；OpenAPI、OAuth、Gallery等生态基建同步升级，加速AI开源普惠。（239字）

835 7 7

小刘的大模型笔记

|

4月前

|

存储自然语言处理搜索推荐

|

博文

RAG 应用 —— 解锁大模型在各行业的落地场景与价值

RAG（检索增强生成）技术通过实时接入行业知识库，有效解决大模型知识过时、易幻觉、难适配等痛点，已在金融、医疗、教育、法律、电商五大领域规模化落地，显著提升准确性、合规性与响应效率，成为大模型行业应用的首选路径。（239字）

861 4 4

游客if6rcjwos67cg

|

4月前

|

人工智能 API 对象存储

|

博文

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

本文深度解析Sora、Kling、Runway Gen-3、Seedance等主流文生视频模型的底层原理、性能差异与生产适配性，直击开发者选型难、API碎片化、成本失控三大痛点，提供统一接入方案、智能路由策略与高并发部署实战指南。（239字）

4240 1 3

游客2ybt27odjah3k

|

4月前

|

人工智能数据可视化数据安全/隐私保护

|

博文

深度评论：《ooder-Nexus 2.0.0 预览版 —— 以“轻量化”破局，构建用户主权的边缘 AI 网络》

ooder-Nexus 2.0.0预览版聚焦轻量、本地、可控，专为路由器、树莓派等边缘设备设计。支持P2P自组网、Web可视化控制台、技能插件市场与AES-256加密通信，128MB内存即可运行，MIT开源，致力让AI真正属于每个用户。

276 4 4

modelscope

|

4月前

|

数据采集人工智能达摩院

|

博文

达摩院开源RynnBrain：首个支持移动操作的具身大脑基础模型

达摩院发布首个可移动操作的具身基础模型RynnBrain，首创时空记忆与物理空间推理能力，支持视频/图像/文本多模态输入及区域、轨迹等具身输出。开源MOE架构RynnBrain-30B-A3B（仅3B激活参数），在16项基准全面SOTA，并推出全新评测集RynnBrain-Bench。

798 9 11

阿尔的代码屋

|

4月前

|

JSON 人工智能自然语言处理

|

博文

[大模型实战 05] 大模型实战的杀手锏：模型微调

本文通过Kaggle实操对比Base与Instruct模型，图解大模型预训练→指令微调→人类对齐三阶段演进，并厘清Prompt工程、RAG（注知识）与微调（塑性格）的技术边界与选型策略，助你科学决策模型优化路径。

611 5 6

来自：自然语言处理版块

阿尔的代码屋

|

4月前

|

人工智能缓存 Java

|

博文

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

本文教你用免费Google Colab（Tesla T4 GPU）解决本地显存不足、无法运行7B+大模型的痛点；通过挂载Google Drive持久化保存模型，避免运行时重置丢失；手把手配置云端环境，为后续RAG实战打下坚实基础。（239字）

1168 6 6

来自：自然语言处理版块

阿尔的代码屋

|

4月前

|

人工智能数据可视化物联网

|

博文

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

本文介绍如何用Unsloth+QLoRA高效微调Qwen3-4B模型，仅需Kaggle免费T4显卡，速度提升2–5倍、显存节省60%；三步实现“灵魂认主”，让模型自认“AlgiebaLLM AI”，全程代码简洁，零基础可上手。

1182 7 8

来自：自然语言处理版块

阿尔的代码屋

|

4月前

|

机器学习/深度学习存储人工智能

|

博文

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

本文图解Transformer核心原理（注意力机制+位置编码），在Kaggle双T4 GPU环境下实战拆解Hugging Face“铁三角”（Config/Tokenizer/Model），并详解Temperature与Top_p两大生成调控参数，助你真正理解并掌控大模型推理。

1320 12 12

来自：自然语言处理版块

阿尔的代码屋

|

4月前

|

安全 API Docker

|

博文

[大模型实战 02] 图形化的大模型交互: Open WebUI部署指南

本文教你用 Docker 一键部署 Open WebUI，为本地 Ollama 模型打造媲美 ChatGPT 的图形化界面：支持流畅对话、本地知识库（RAG）检索增强、自定义角色（Agent），全程私有化、零数据上传，10分钟即可启用！

2767 3 5

小刘的大模型笔记

|

4月前

|

人工智能运维数据库

|

博文

一文读懂向量数据库：从核心概念到实际应用

本文精析向量数据库核心能力、优势（毫秒级相似检索、原生支持非结构化数据）与痛点（精度/效率难兼得、成本高、运维复杂），对比Milvus/Chroma/FAISS等开源方案及Pinecone/Zilliz商业产品，提供AI开发者高效选型指南。（239字）

392 0 0

小刘的大模型笔记

|

4月前

|

存储数据采集人工智能

|

博文

大模型微调常见术语解析：新手也能看懂的入门指南

本文通俗解析大模型微调核心术语：涵盖预训练模型、LoRA/QLoRA等轻量方法、学习率/批次大小等训练参数，以及过拟合、数据投毒等效果与安全要点，助新手快速入门并安全实践。（239字）

373 1 1

小刘的大模型笔记

|

4月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

微调与推理：解锁大模型定制化能力的核心密钥

本文深入浅出讲解大模型微调与推理的核心原理与实践：微调（如LoRA）让通用模型适配垂直场景，推理则实现价值落地。以LLaMA为例，手把手演示数据准备、平台微调、在线测试与效果评估，零代码门槛，助初学者快速打造专属AI模型。（239字）

326 1 1

游客if6rcjwos67cg

|

4月前

|

人工智能 JSON 自然语言处理

|

博文

Agent Skills 究竟是什么？从玩具到工程化的必经之路

AI应用开发正从“Prompt驱动”迈向“技能驱动”。本文详解Agent Skills标准化实践：以Claude Code Skills为范本，用SKILL.md实现自描述技能；借MCP协议统一多源工具调用，解决兼容与安全难题；结合DeepSeek+OpenAI实战，展现可插拔、可审计、可演进的工业级Agent构建路径。

1321 0 2

modelscope

|

4月前

|

人工智能 JSON API

|

博文

开源开放被集成：魔搭OpenAPI上新，广泛链接社区生态

ModelScope正式推出OpenAPI与OAuth 2.0开放服务，覆盖模型、数据集、MCP及用户信息四大核心板块，支持自动化发现、集成与管理AI资源。接口遵循OpenAPI规范，提供标准REST能力与安全授权机制，助力开发者低门槛构建AI应用、CI/CD流水线及Agentic智能体系统，践行“AI基础设施即代码”理念。（239字）

695 6 6

狸奴算君

|

4月前

|

人工智能测试技术 API

|

博文

让大模型真正为你工作：一文读懂RAG与微调的选择逻辑

本文深入解析RAG（开卷考试）与微调（封闭特训）两大私有知识注入技术：RAG实时更新、可追溯但依赖检索质量；微调风格统一、响应快但成本高、难迭代。结合实践案例与评估方法，重点推荐2024主流“混合架构”——RAG管“说什么”，微调管“怎么说”，兼顾准确性与规范性。

816 8 10

modelscope

|

4月前

|

缓存自然语言处理 API

|

博文

美团开源 LongCat-Flash-Lite：实现轻量化 MoE 高效推理

美团LongCat团队开源68.5B MoE大模型LongCat-Flash-Lite，创新采用N-gram Embedding架构，推理仅激活2.9B–4.5B参数，却在Agent工具调用、代码生成等任务上大幅领先；支持256K长上下文，API生成速度达500–700 token/s，MIT协议开源。

1021 6 6

modelscope

|

4月前

|

边缘计算人工智能物联网

|

博文

Ultralytics YOLO26来啦！5种尺寸全家桶，速度与精度兼顾

Ultralytics发布YOLO26，系列迄今最先进、易部署的模型，支持分类、检测、分割、姿态估计等多任务。五种尺寸灵活适配边缘设备，CPU推理提速43%，首创无NMS端到端推理，移除DFL提升兼容性，已上架魔搭社区。（239字）

1494 14 15

modelscope

|

4月前

|

存储 API 数据库

|

博文

投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库

Zvec 是一款开源（Apache 2.0）轻量级嵌入式向量数据库，专为终端侧设计，具备开箱即用、资源可控、极致性能与完整向量能力四大优势，支持标量-向量混合查询、CRUD、崩溃恢复等生产级特性，让端侧RAG如SQLite般简单可靠。（239字）

1000 7 7

Jack哈哈哈

|

4月前

|

机器学习/深度学习缓存前端开发

|

博文

讨论下llm的prefix caching机制

本文探讨LLM推理中Prefix Caching机制的原理与实践：解释为何将动态内容（如React循环中的tool call结果）放在system prompt会破坏缓存命中，导致成本激增；强调应将变量部分置于user prompt末尾，以最大化复用system+固定user前缀的KV缓存，显著降本提效

798 7 7

huizhudev

|

4月前

|

人工智能自然语言处理前端开发

|

博文

写了10万行代码，却毁在配色上？这套指令让后端直男秒变设计总监

这是一篇专为后端及全栈开发者定制的实用指南，旨在解决开发者“代码强但审美弱”的痛点。文章提供了一套核心AI指令，能将DeepSeek等AI变成专业UI设计顾问，快速生成符合大厂规范（Design Token）的配色体系。通过一个后台管理系统的实战案例，演示了如何用AI将“土味”界面瞬间升级为专业级UI，让开发者无需学习设计理论也能搞定高颜值配色。

586 4 5

最新

文章

视频

问答

推荐

[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent

双 Transformer + 双神经符号 + 突触耦合 + DeepSeek 插件 极简验证

如何高效对接新加坡股票（SGX）实时数据 API

【深度思考】当代码无法解决增长焦虑：一场关于“组织操作系统”的重构与意识进化

用 4B 小模型做Code Agent的SubAgent？这个开源项目做到了

Qwen3.5 中等规模模型系列正式开源：更强智能，更低算力

Deepseek百万 Token 窗口的极限实践：一位非专业人员使用实录

四款国产VLM OCR模型横评

魔搭社区+OpenVINO™ 加速部署 Qwen3-ASR 实战

魔搭社区+OpenVINO™ 加速部署 Qwen3-TTS 实战

0.9B 小模型，OCR 大能力——GLM-OCR 模型实战教程

MiniCPM-o 4.5 CookBook：9B 参数玩转多模态全双工交互

自进化≠自我刷题，Agent 真正的突破口是「自己造环境」？——6 位领域学者 · 7 大议题 · 2 万字圆桌观点实录

Boss直聘开源Nanbeige4.1-3B：小模型全能新标杆

蚂蚁集团 Ling-2.5-1T 开源：万亿参数，重新定义"又快又强"

Qwen3.5：迈向原生多模态智能体

小红书开源发布 FireRed-Image-Edit 1.0：高质量训练数据，性能屠榜三项核心评测

MiniMax M2.5 开源，低成本Agent时代来了！社区Day0部署、工具调用、推理&提示词参数实战来啦！

FantasyWorld 正式开源！一次前向传播，同时生成视频与 3D 几何——视频世界模型的新范

万亿参数、混合线性架构、开源免费——Ring-2.5-1T 来了，思考模型卷到新高度

全球Top下载中文开源数据集更新｜OpenCSG持续打造中文高质量数据集开源底座

GLM-5开源：迈向Agentic Engineering新范式，社区Day0 部署、推理实战来了！

OoderAgent 能力中心与能力库 技术白皮书(V0.7.3)

书尖 AI 功能实测｜阿里云 AI 技术加持，与喜马拉雅听书体验深度对比

书尖 AI 功能实测｜基于阿里云 AI 技术，与微信读书阅读体验对比

PPO 应用 —— 大模型偏好优化的核心场景与落地思路

蚂蚁百灵全模态 Ming-flash-omni-2.0 开源！视觉百科+可控语音生成+全能型图像编辑，打破全模态“博而不精”

基于 AgentScope x AI Agent A2Z部署平台的生产级别Agent上线Live实战分享

LLaDA2.1 正式开源，可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限

ModelScope魔搭社区发布月报 -- 26年2月

RAG 应用 —— 解锁大模型在各行业的落地场景与价值

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

深度评论：《ooder-Nexus 2.0.0 预览版 —— 以“轻量化”破局，构建用户主权的边缘 AI 网络》

达摩院开源RynnBrain：首个支持移动操作的具身大脑基础模型

[大模型实战 05] 大模型实战的杀手锏： 模型微调

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

[大模型实战 02] 图形化的大模型交互: Open WebUI部署指南

一文读懂向量数据库：从核心概念到实际应用

大模型微调常见术语解析：新手也能看懂的入门指南

微调与推理：解锁大模型定制化能力的核心密钥

Agent Skills 究竟是什么？从玩具到工程化的必经之路

开源开放被集成：魔搭OpenAPI上新，广泛链接社区生态

让大模型真正为你工作：一文读懂RAG与微调的选择逻辑

美团开源 LongCat-Flash-Lite：实现轻量化 MoE 高效推理

Ultralytics YOLO26来啦！5种尺寸全家桶，速度与精度兼顾

投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库

讨论下llm的prefix caching机制

写了10万行代码，却毁在配色上？这套指令让后端直男秒变设计总监

ModelScope模型即服务

活跃用户

相关产品

双 Transformer + 双神经符号 + 突触耦合 + DeepSeek 插件极简验证

OoderAgent 能力中心与能力库技术白皮书(V0.7.3)

[大模型实战 05] 大模型实战的杀手锏：模型微调