|
15小时前
|
自然语言处理 前端开发 测试技术
|

魔搭社区+OpenVINO™ 加速部署 Qwen3-ASR 实战

通义千问新推Qwen3-ASR语音识别模型(1.7B/0.6B),支持52种语言及方言,具备高鲁棒性与流式长音频转写能力。联合魔搭社区与Intel® OpenVINO™,实现Intel平台极致加速部署,提供完整开源教程、Notebook示例及Gradio交互Demo。(239字)

64 2
|
16小时前
|
编解码 自然语言处理 语音技术
|

魔搭社区+OpenVINO™ 加速部署 Qwen3-TTS 实战

通义千问推出Qwen3-TTS系列开源语音模型,支持中英日韩等10种语言,具备声音克隆、情感适配与高保真端到端合成能力;结合Intel OpenVINO™可在CPU上高效推理,无需GPU,轻松部署于边缘设备。(239字)

32 3
|
16小时前
|
机器学习/深度学习 JSON 文字识别
|

0.9B 小模型,OCR 大能力——GLM-OCR 模型实战教程

智谱开源多模态OCR模型GLM-OCR,基于GLM-V架构,融合CogViT视觉编码器与GLM-0.5B语言解码器,支持公式、表格、代码等复杂文档识别,性能达OmniDocBench榜首(94.62分),仅0.9B参数,轻量高效,开箱即用。

43 3
|
18小时前
|
人工智能 语音技术 芯片
|

MiniCPM-o 4.5 CookBook:9B 参数玩转多模态全双工交互

MiniCPM-o 4.5是9B参数多模态大模型,支持图像、视频、音频、文本输入与高质量文/语音输出。具备领先视觉理解(OpenCompass平均77.6分)、实时中英双语语音对话、全双工流式交互、高精度OCR及30+语言能力,适配CPU/GPU/国产芯片,支持本地部署与微调。(239字)

56 4
|
18小时前
|
机器学习/深度学习 人工智能 算法
|

自进化≠自我刷题,Agent 真正的突破口是「自己造环境」?——6 位领域学者 · 7 大议题 · 2 万字圆桌观点实录

AI AMA首期聚焦“Agent自进化”,由魔搭等联合发起,邀请翟云鹏主持及5位顶会作者深度对谈。围绕定义、泛化能力、反馈信号、评估体系等7大议题,探讨Agent如何突破“从零开始”瓶颈,实现类人经验积累与策略优化。(239字)

37 5
|
18小时前
|
人工智能 算法 测试技术
|

Boss直聘开源Nanbeige4.1-3B:小模型全能新标杆

Boss直聘南北阁实验室发布Nanbeige4.1-3B:一款仅3B参数的“小而全”统一模型,首次在同规模中系统整合强推理、人类偏好对齐与深度搜索Agent能力,性能超越Qwen3-32B等大模型,已开源权重、技术报告及合成数据。

66 4
|
18小时前
|
机器学习/深度学习 存储 自然语言处理
|

蚂蚁集团 Ling-2.5-1T 开源:万亿参数,重新定义"又快又强"

Ling-2.5-1T是蚂蚁集团inclusionAI推出的开源即时大模型(MIT协议),以“效率×效果”为核心:万亿参数、63B激活,首创混合线性注意力架构,支持百万token上下文;推理吞吐大幅提升,AIME任务仅需1/3 token即达前沿思考模型水平。ModelScope可下载。

67 4
|
18小时前
|
机器学习/深度学习 自然语言处理 API
|

Qwen3.5:迈向原生多模态智能体

除夕夜,通义千问发布Qwen3.5-397B-A17B:全球首个原生多模态MoE大模型,总参3970亿、仅激活170亿参数,性能媲美万亿模型;支持201种语言、超强视觉理解与GUI智能体能力,已开源至GitHub与ModelScope。

105 3
|
18小时前
|
自然语言处理 测试技术 Python
|

小红书开源发布 FireRed-Image-Edit 1.0:高质量训练数据,性能屠榜三项核心评测

2月14日,小红书FireRedTeam开源FireRed-Image-Edit-1.0图像编辑模型。该模型在ImgEdit、GEdit等基准测试中全面超越现有开源方案,风格迁移(4.97分)等维度甚至优于Nano-Banana、Seedream4.0等闭源模型,支持文本保留、老照片修复、多图虚拟试衣等能力。

60 6
|
19小时前
|
缓存 架构师 前端开发
|

MiniMax M2.5 开源,低成本Agent时代来了!社区Day0部署、工具调用、推理&提示词参数实战来啦!

2月13日,MiniMax发布M2.5大模型,108天内三连更!编程(SWE-Bench 80.2%)、搜索(BrowseComp 76.3%)、办公场景全面领先,开源权重已上线ModelScope,支持API调用、本地部署及工具调用。

194 7
|
19小时前
|
机器学习/深度学习 编解码 JSON
|

FantasyWorld 正式开源!一次前向传播,同时生成视频与 3D 几何——视频世界模型的新范

高德地图发布「FantasyWorld」——新一代几何一致世界模型,单次前向即可生成高质量视频与3D场景(深度图、点云、相机轨迹),无需后处理或逐场景优化。ICLR 2026录用,WorldScore榜首,已开源代码与模型。

49 6
|
19小时前
|
机器学习/深度学习 人工智能 资源调度
|

万亿参数、混合线性架构、开源免费——Ring-2.5-1T 来了,思考模型卷到新高度

蚂蚁inclusionAI发布开源万亿参数思考模型Ring-2.5-1T,首创混合线性注意力架构,实现“快、深、长”三大突破:推理吞吐提升3倍+,IMO/CMO达金牌水平,可在Claude Code中连续2小时开发可运行的迷你操作系统。MIT协议完全开源。

71 21
|
20小时前
|
数据采集 机器学习/深度学习 人工智能
|

全球Top下载中文开源数据集更新|OpenCSG持续打造中文高质量数据集开源底座

OpenCSG正式发布Fineweb-Edu-Chinese V2.2数据集:覆盖预训练(1.5T tokens,质量分层)与SFT微调(143.7万条DeepSeek V3.2蒸馏问答对)全流程,严格事实锚定、支持溯源,是当前少有的高质量中文教育全栈数据解决方案。

48 13
|
20小时前
|
机器学习/深度学习 人工智能 算法
|

GLM-5开源:迈向Agentic Engineering新范式,社区Day0 部署、推理实战来了!

智谱发布GLM-5:开源SOTA大模型,Coding与Agent能力双强,真实编程体验媲美Claude Opus 4.5;全球AI榜单排名第四、开源第一;MIT协议开源,支持复杂系统工程与长程Agent任务。

81 5
|
1天前
|
存储 自然语言处理 Java
|

OoderAgent 能力中心与能力库 技术白皮书(V0.7.3)

OoderAgent平台核心由能力中心(SkillCenter)与能力库(ooder-skills)构成:前者统一管理技能生命周期、市场运营与P2P调度;后者提供40+模块化、场景驱动的多语言(Java/Node/Python)技能包,支持GitHub/Gitee一键发现安装。

43 3
|
3天前
|
人工智能 语音技术 云计算
|

书尖 AI 功能实测|阿里云 AI 技术加持,与喜马拉雅听书体验深度对比

在阿里云AI赋能下,书尖AI实测展现三大优势:1.2亿册全品类书库、双人互动式AI播客、2分钟极速提炼书籍精华,并依托阿里云TTS实现自然听书体验。相较喜马拉雅,其AI深度解读与定制化能力更胜一筹。(239字)

84 9
|
4天前
|
人工智能 语音技术 云计算
|

书尖 AI 功能实测|基于阿里云 AI 技术,与微信读书阅读体验对比

本文深度实测阿里云赋能的智能阅读工具“书尖AI”,对比微信读书,客观呈现其1.2亿册书库、双人AI播客听书、2分钟极速解读等核心优势,展现高效轻松的智能阅读新体验。(239字)

148 8
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
|

PPO 应用 —— 大模型偏好优化的核心场景与落地思路

本文详解PPO算法在大模型RLHF落地中的核心应用:聚焦对话风格、客服话术、内容生成、安全合规、垂直领域及多模态六大场景,强调“偏好定制化”价值。全程无代码,提供4步落地法与3大实操要点,助力企业高效实现大模型优化。(239字)

147 11
|
12天前
|
机器学习/深度学习 自然语言处理 搜索推荐
|

蚂蚁百灵全模态 Ming-flash-omni-2.0 开源!视觉百科+可控语音生成+全能型图像编辑,打破全模态“博而不精”

2月11日,蚂蚁百灵团队开源全模态大模型Ming-flash-omni-2.0(基于Ling-2.0 MoE架构),在视觉理解、语音交互与图像编辑三大领域实现代际跃迁,达开源领先水平。支持多模态统一生成与深度编辑,模型权重与代码已开放。

273 4
|
12天前
|
人工智能 JSON 监控
|

基于 AgentScope x AI Agent A2Z部署平台的生产级别Agent上线Live实战分享

本文分享如何用AgentScope框架+AI Agent A2Z平台,一键完成AI Agent生产级部署:解决“开发易、上线难”痛点,快速生成标准/chat接口(如https://agentscope.aiagenta2z.com/deep_research_agent/chat),支持高并发、实时监控与冷启动。

143 4
|
12天前
|
机器学习/深度学习 并行计算 算法
|

LLaDA2.1 正式开源,可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限

蚂蚁研究院发布LLaDA2.1,首创“可纠错编辑(ECE)”机制,突破扩散语言模型(dLLM)速度与质量瓶颈:推理达892 TPS,支持极速/质量双模式,并集成业界首个dLLM强化学习框架EBPO。开源即用,迈向真正可用的下一代大模型。

156 6
|
12天前
|
人工智能 文字识别 物联网
|

ModelScope魔搭社区发布月报 -- 26年2月

临近年关,ModelScope迎来春节模型发布潮:Qwen3、GLM-4.7、MiniMax M2.1等大模型密集上新;AIGC生图、语音合成、具身智能全面突破;OpenAPI、OAuth、Gallery等生态基建同步升级,加速AI开源普惠。(239字)

219 7
|
13天前
|
存储 自然语言处理 搜索推荐
|

RAG 应用 —— 解锁大模型在各行业的落地场景与价值

RAG(检索增强生成)技术通过实时接入行业知识库,有效解决大模型知识过时、易幻觉、难适配等痛点,已在金融、医疗、教育、法律、电商五大领域规模化落地,显著提升准确性、合规性与响应效率,成为大模型行业应用的首选路径。(239字)

209 4
|
13天前
|
人工智能 API 对象存储
|

Seedance vs Sora vs Kling:AI 视频生成模型深度对比

本文深度解析Sora、Kling、Runway Gen-3、Seedance等主流文生视频模型的底层原理、性能差异与生产适配性,直击开发者选型难、API碎片化、成本失控三大痛点,提供统一接入方案、智能路由策略与高并发部署实战指南。(239字)

396 1
|
13天前
|
人工智能 数据可视化 数据安全/隐私保护
|

深度评论:《ooder-Nexus 2.0.0 预览版 —— 以“轻量化”破局,构建用户主权的边缘 AI 网络》

ooder-Nexus 2.0.0预览版聚焦轻量、本地、可控,专为路由器、树莓派等边缘设备设计。支持P2P自组网、Web可视化控制台、技能插件市场与AES-256加密通信,128MB内存即可运行,MIT开源,致力让AI真正属于每个用户。

120 4
|
13天前
|
数据采集 人工智能 达摩院
|

达摩院开源RynnBrain:首个支持移动操作的具身大脑基础模型

达摩院发布首个可移动操作的具身基础模型RynnBrain,首创时空记忆与物理空间推理能力,支持视频/图像/文本多模态输入及区域、轨迹等具身输出。开源MOE架构RynnBrain-30B-A3B(仅3B激活参数),在16项基准全面SOTA,并推出全新评测集RynnBrain-Bench。

162 8
|
14天前
|
JSON 人工智能 自然语言处理
|

[大模型实战 05] 大模型实战的杀手锏: 模型微调

本文通过Kaggle实操对比Base与Instruct模型,图解大模型预训练→指令微调→人类对齐三阶段演进,并厘清Prompt工程、RAG(注知识)与微调(塑性格)的技术边界与选型策略,助你科学决策模型优化路径。

176 5
来自: 自然语言处理  版块
|
14天前
|
人工智能 缓存 Java
|

[大模型实战 03预备] 云端炼丹房 1:Google Colab 上手指南

本文教你用免费Google Colab(Tesla T4 GPU)解决本地显存不足、无法运行7B+大模型的痛点;通过挂载Google Drive持久化保存模型,避免运行时重置丢失;手把手配置云端环境,为后续RAG实战打下坚实基础。(239字)

201 6
来自: 自然语言处理  版块
|
14天前
|
人工智能 数据可视化 物联网
|

[大模型实战 06] 我的模型我做主:在 Kaggle 上用 Unsloth 极速微调 Qwen3

本文介绍如何用Unsloth+QLoRA高效微调Qwen3-4B模型,仅需Kaggle免费T4显卡,速度提升2–5倍、显存节省60%;三步实现“灵魂认主”,让模型自认“AlgiebaLLM AI”,全程代码简洁,零基础可上手。

272 7
来自: 自然语言处理  版块
|
14天前
|
机器学习/深度学习 存储 人工智能
|

[大模型实战 03] 拆解 Transformers:从原理图解到 HuggingFace Transformers 实战

本文图解Transformer核心原理(注意力机制+位置编码),在Kaggle双T4 GPU环境下实战拆解Hugging Face“铁三角”(Config/Tokenizer/Model),并详解Temperature与Top_p两大生成调控参数,助你真正理解并掌控大模型推理。

213 11
来自: 自然语言处理  版块
|
14天前
|
安全 API Docker
|

[大模型实战 02] 图形化的大模型交互: Open WebUI部署指南

本文教你用 Docker 一键部署 Open WebUI,为本地 Ollama 模型打造媲美 ChatGPT 的图形化界面:支持流畅对话、本地知识库(RAG)检索增强、自定义角色(Agent),全程私有化、零数据上传,10分钟即可启用!

368 3
|
14天前
|
人工智能 运维 数据库
|

一文读懂向量数据库:从核心概念到实际应用

本文精析向量数据库核心能力、优势(毫秒级相似检索、原生支持非结构化数据)与痛点(精度/效率难兼得、成本高、运维复杂),对比Milvus/Chroma/FAISS等开源方案及Pinecone/Zilliz商业产品,提供AI开发者高效选型指南。(239字)

58 0
|
14天前
|
存储 数据采集 人工智能
|

大模型微调常见术语解析:新手也能看懂的入门指南

本文通俗解析大模型微调核心术语:涵盖预训练模型、LoRA/QLoRA等轻量方法、学习率/批次大小等训练参数,以及过拟合、数据投毒等效果与安全要点,助新手快速入门并安全实践。(239字)

109 0
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
|

微调与推理:解锁大模型定制化能力的核心密钥

本文深入浅出讲解大模型微调与推理的核心原理与实践:微调(如LoRA)让通用模型适配垂直场景,推理则实现价值落地。以LLaMA为例,手把手演示数据准备、平台微调、在线测试与效果评估,零代码门槛,助初学者快速打造专属AI模型。(239字)

73 1
|
14天前
|
人工智能 JSON 自然语言处理
|

Agent Skills 究竟是什么?从玩具到工程化的必经之路

AI应用开发正从“Prompt驱动”迈向“技能驱动”。本文详解Agent Skills标准化实践:以Claude Code Skills为范本,用SKILL.md实现自描述技能;借MCP协议统一多源工具调用,解决兼容与安全难题;结合DeepSeek+OpenAI实战,展现可插拔、可审计、可演进的工业级Agent构建路径。

235 0
|
14天前
|
人工智能 JSON API
|

开源开放被集成:魔搭OpenAPI上新,广泛链接社区生态

ModelScope正式推出OpenAPI与OAuth 2.0开放服务,覆盖模型、数据集、MCP及用户信息四大核心板块,支持自动化发现、集成与管理AI资源。接口遵循OpenAPI规范,提供标准REST能力与安全授权机制,助力开发者低门槛构建AI应用、CI/CD流水线及Agentic智能体系统,践行“AI基础设施即代码”理念。(239字)

172 6
|
15天前
|
人工智能 测试技术 API
|

让大模型真正为你工作:一文读懂RAG与微调的选择逻辑

本文深入解析RAG(开卷考试)与微调(封闭特训)两大私有知识注入技术:RAG实时更新、可追溯但依赖检索质量;微调风格统一、响应快但成本高、难迭代。结合实践案例与评估方法,重点推荐2024主流“混合架构”——RAG管“说什么”,微调管“怎么说”,兼顾准确性与规范性。

153 8
|
15天前
|
缓存 自然语言处理 API
|

美团开源 LongCat-Flash-Lite:实现轻量化 MoE 高效推理

美团LongCat团队开源68.5B MoE大模型LongCat-Flash-Lite,创新采用N-gram Embedding架构,推理仅激活2.9B–4.5B参数,却在Agent工具调用、代码生成等任务上大幅领先;支持256K长上下文,API生成速度达500–700 token/s,MIT协议开源。

272 6
|
15天前
|
边缘计算 人工智能 物联网
|

Ultralytics YOLO26来啦!5种尺寸全家桶,速度与精度兼顾

Ultralytics发布YOLO26,系列迄今最先进、易部署的模型,支持分类、检测、分割、姿态估计等多任务。五种尺寸灵活适配边缘设备,CPU推理提速43%,首创无NMS端到端推理,移除DFL提升兼容性,已上架魔搭社区。(239字)

159 13
|
15天前
|
存储 API 数据库
|

投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库

Zvec 是一款开源(Apache 2.0)轻量级嵌入式向量数据库,专为终端侧设计,具备开箱即用、资源可控、极致性能与完整向量能力四大优势,支持标量-向量混合查询、CRUD、崩溃恢复等生产级特性,让端侧RAG如SQLite般简单可靠。(239字)

174 7
|
16天前
|
机器学习/深度学习 缓存 前端开发
|

讨论下llm的prefix caching机制

本文探讨LLM推理中Prefix Caching机制的原理与实践:解释为何将动态内容(如React循环中的tool call结果)放在system prompt会破坏缓存命中,导致成本激增;强调应将变量部分置于user prompt末尾,以最大化复用system+固定user前缀的KV缓存,显著降本提效

103 7
|
17天前
|
人工智能 自然语言处理 前端开发
|

写了10万行代码,却毁在配色上?这套指令让后端直男秒变设计总监

这是一篇专为后端及全栈开发者定制的实用指南,旨在解决开发者“代码强但审美弱”的痛点。文章提供了一套核心AI指令,能将DeepSeek等AI变成专业UI设计顾问,快速生成符合大厂规范(Design Token)的配色体系。通过一个后台管理系统的实战案例,演示了如何用AI将“土味”界面瞬间升级为专业级UI,让开发者无需学习设计理论也能搞定高颜值配色。

153 4
|
18天前
|
存储 安全 API
|

微调与安全隐私 —— 大模型定制化过程中的风险防控指南

本文详解大模型微调中的安全隐私风险与防控策略,涵盖数据泄露、模型投毒、恶意查询等典型威胁,提出数据最小化、隐私-性能平衡、全生命周期防控三大原则,并提供脱敏处理、联邦学习、输出过滤等可落地的全流程防护方案,助力安全合规地实现模型定制化。(239字)

126 6
|
18天前
|
存储 数据采集 安全
|

微调与安全隐私 —— 大模型落地的合规必修课

本文聚焦大模型微调中的安全与隐私合规风险,系统剖析数据集、训练、输出三大环节的典型隐患(如敏感信息泄露、版权侵权、模型反演等),提出“脱敏+加密+过滤”全流程防护方案,并推荐合规认证平台与实操工具,助力企业实现技术落地与法律合规双保障。(239字)

118 9
|
18天前
|
机器学习/深度学习 调度
|

大模型微调参数设置 —— 新手必看的核心参数与优化技巧

本文系统解析大模型微调核心参数(Epochs、Learning Rate、Batch Size等),涵盖SFT/PPO/DPO场景,提供新手友好默认值、作用解读与实用调优技巧,强调“先跑通默认值、再针对性优化”原则,助你避开过拟合/欠拟合陷阱,零代码快速提升微调效果。

176 4
|
18天前
|
人工智能 自然语言处理 数据可视化
|

OoderAI BridgeCode 产品白皮书——全方位赋能企业编程升级

ooderAI BridgeCode 是面向企业的AI确定性代码框架解决方案,通过自学习能力生成专属代码、无缝衔接新旧系统、优化AI时代工作流,并提供128个开源可视化组件。开源无绑定、Web化易用,助力企业降本增效、灵活转型。(239字)

422 1
|
18天前
|
存储 人工智能 资源调度
|

迈向AI4S 2.0,上海AI实验室开源书生1T Moe 科学大模型Intern-S1-Pro!

2月4日,上海AI实验室开源万亿参数科学多模态大模型Intern-S1-Pro,全球开源社区中规模最大的AI4S模型。基于SAGE“通专融合”架构与MoE设计,融合傅里叶位置编码与创新路由机制,科学推理达奥赛金牌水平,综合能力稳居国际第一梯队,赋能AGI for Science范式革命。(239字)

196 3
|
19天前
|
SQL 人工智能 分布式计算
|

MaxCompute SQL AI 实践:电商用户评论情感洞察与关键词提取

本实践基于阿里云MaxCompute SQL AI功能,仅用SQL即可完成电商评论的情感分类(正/负/中性)与关键词提取,无需Python开发。内置模型开箱即用,业务人员零门槛上手,10万条评论分析仅需数秒,显著提升非结构化文本洞察效率。(239字)

114 4
|
19天前
|
机器学习/深度学习 监控 算法
|

PPO与DPO:大模型对齐的两大核心算法,差异与选型全解析

本文深度解析大模型对齐核心算法PPO与DPO:PPO基于RLHF框架,需训练奖励模型,对齐精准、稳定性强,但流程繁琐、资源消耗大;DPO跳过奖励建模,直接优化偏好,轻量高效、易上手。对比原理、流程、优劣及适用场景,助你科学选型,提升对齐效率。

186 1
|
19天前
|
机器学习/深度学习 自然语言处理 API
|

Qwen3-Coder-Next开源!推动小型混合模型在智能体编程上的边界

Qwen团队开源Qwen3-Coder-Next:基于Qwen3-Next-80B的轻量级编程智能体模型,采用混合注意力+MoE架构,通过可执行任务合成与强化学习训练,在SWE-Bench Verified达70%+,以仅3B激活参数媲美10–20倍大模型,兼顾高性能与低成本部署。(239字)

592 3

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15112
内容
6
活动
3983
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互