|
2小时前
|
编解码 人工智能
|

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

18 2
|
7小时前
|
开发者
|

魔搭核心开发者共创会 | 邀请函

魔搭核心开发者共创会 | 邀请函

21 4
|
1天前
|
物联网
|

“一丹一世界”三等奖 | 木刻时光·细密风 经验分享

“一丹一世界”三等奖 | 木刻时光·细密风 经验分享

31 7
|
1天前
|
数据可视化 API Swift
|

全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源

OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。

56 17
|
2天前
|
机器学习/深度学习 数据采集 安全
|

MiMo-7B:从预训练到强化学习,解锁语言模型的推理潜能

目前,大多数成功的 强化学习 工作,包括开源研究,都依赖于相对较大的基础模型,例如 32B 模型,特别是在增强代码推理能力方面。业内普遍认为在一个小模型中同时提升数学和代码能力是具有挑战性的。然而,小米MiMo研究团队相信 RL 训练的推理模型的有效性取决于基础模型固有的推理潜力。为了完全解锁语言模型的推理潜力,不仅需要关注后训练,还需要针对推理定制预训练策略。

76 29
|
3天前
|
机器学习/深度学习 人工智能 监控
|

实战 | Qwen3大模型微调入门实战(完整代码)

Qwen3是阿里通义实验室最近开源的大语言模型,发布时便登顶了开源LLM榜单第一名。同时,Qwen系列模型也超越LLaMA,成为了开源模型社区中最受欢迎的开源LLM。

246 21
|
3天前
|
人工智能 自然语言处理 搜索推荐
|

魔搭社区模型速递(4.27-5.10)

🙋魔搭ModelScope本期社区进展:📟2341个模型,206个数据集,🎨224个创新应用,📄 15篇内容

90 20
|
3天前
|
人工智能 自然语言处理 测试技术
|

UGMathBench:评估语言模型数学推理能力的动态基准测试数据集

近年来,人工智能蓬勃发展,自然语言模型(LLM)进展显著。语言模型被广泛应用于自动翻译、智能客服、甚至医疗、金融、天气等领域。而研究者们仍在不断努力,致力于提高语言模型的规模和性能。随着语言模型的蓬勃发展,评估一个语言模型的性能变得越来越重要。其中一个重要的评估指标,就是衡量语言模型的推理能力和解决数学问题的能力。

66 24
|
6天前
|
人工智能 自然语言处理 搜索推荐
|

阶跃多模态再添一员:阶跃与 ACE Studio 联合开源音乐大模型 ACE-Step!

阶跃多模态再添一员:阶跃与 ACE Studio 联合开源音乐大模型 ACE-Step!

82 10
|
6天前
|
人工智能 自然语言处理 安全
|

“一丹一世界”三等奖 | 灵犀共生 经验分享&浅谈AI对摄影的帮助

“一丹一世界”三等奖 | 灵犀共生 经验分享&浅谈AI对摄影的帮助

66 9
|
7天前
|
传感器 供应链 物联网
|

农业单亩价值创造功能技术集成的概念与内涵

农业单亩价值创造的技术集成,通过系统性创新打破传统单一模式,融合现代科技与生态理念,提升资源效率、经济效益和生态价值。其核心在于技术协同,实现精准农业、智能装备和生物强化等多维联动,推动经济、生态和社会价值统一。同时,注重资源集约化与循环化利用,延伸产业链并升级价值链,从短期高产转向长期可持续发展。政策与制度创新支撑技术普惠,未来需因地制宜解决技术适配性和成本收益平衡问题,重塑农业评价体系,实现高质量发展。

61 11
|
7天前
|
传感器 人工智能 算法
|

聚焦“以技术集成支撑单亩价值创造”与“增加值分配机制区块链存证确权”两大核心本质

“振兴链-技术集成科技小院”以技术集成与区块链为核心,推动农业现代化。通过多维度技术整合(如精准农业、物联网等),突破资源约束,最大化单亩产值;同时利用区块链确权存证,建立透明分配机制,解决传统农业中收益不均问题。技术赋能生产,制度重塑分配,实现效率与公平的平衡,助力乡村振兴与产业升级。典型场景显示,该模式可显著提升单亩价值并确保增值公平分配。

44 10
|
7天前
|
Web App开发 人工智能 JSON
|

Windows版来啦!Qwen3+MCPs,用AI自动发布小红书图文/视频笔记!

上一篇用 Qwen3+MCPs实现AI自动发小红书的最佳实践 有超多小伙伴关注,同时也排队在蹲Windows版本的教程。

140 1
|
7天前
|
人工智能 搜索推荐 小程序
|

AI故事随心绘:多主体ID保留,个性化生成

近期通义实验室提出了一种AnyStory的方法,旨在实现高质量的个性化文本到图像生成,支持单个和多个主体。

52 1
|
9天前
|
人工智能
|

我说魔,你说搭-魔搭AI视频宣传片挑战赛

当大家都喊魔塔的时候,我们决定搞个事情...有人管咱们叫"魔塔"?

60 4
|
9天前
|
人工智能 API 开发者
|

用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频

魔搭自动发布小红书MCP,是魔搭开发者小伙伴实现的小红书笔记自动发布器,可以通过这个MCP自动完成小红书标题、内容和图片的发布。

328 28
|
9天前
|
人工智能 物联网 数据处理
|

“一丹一世界”三等奖 | 曙光_麦橘超然 创作分享

“一丹一世界”三等奖 | 曙光_麦橘超然 创作分享

56 0
|
9天前
|
边缘计算 弹性计算 人工智能
|

魔搭社区大模型一键部署到阿里云边缘云(ENS)

随着大模型技术的快速发展,业界的关注点正逐步从模型训练往模型推理 转变。这一转变不仅反映了大模型在实际业务中的广泛应用需求,也体现了技术优化和工程化落地的趋势。

85 7
|
14天前
|
机器学习/深度学习 人工智能 算法
|

小米7B参数推理大模型首次开源!Xiaomi MiMo:数学代码双杀,超越32B巨头

小米开源的MiMo推理大模型通过联动预训练与强化学习算法,在7B参数规模下实现数学推理与代码生成能力的突破性提升,技术报告显示其性能超越部分32B级模型。

332 74
来自: 自然语言处理  版块
|
14天前
|
人工智能 语音技术 iOS开发
|

Kimi-Audio:月之暗面开源音频大模型,1300万小时训练重塑语音交互

Kimi-Audio是月之暗面推出的开源音频基础模型,基于1300万小时多样化音频数据训练,采用混合输入架构和流式解码技术,支持语音识别、情感分析等十余种音频处理任务。

191 14
来自: 语音  版块
|
14天前
|
机器学习/深度学习 人工智能 API
|

阿里通义开源新一代混合推理模型 Qwen3:创新双模式推理,支持"思考模式"和"非思考模式"

Qwen3是阿里巴巴推出的新一代大型语言模型,支持119种语言和两种推理模式,采用四阶段训练流程和Apache 2.0协议开源,提供从0.6B到235B的多种模型配置。

209 19
来自: 自然语言处理  版块
|
14天前
|
机器学习/深度学习 人工智能 JSON
|

这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现

Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。

136 18
来自: 自然语言处理  版块
|
15天前
|
算法 物联网 Swift
|

Qwen3 X ModelScope工具链: 飞速训练 + 全面评测

Qwen于近日发布了Qwen3系列模型,包含了各个不同规格的Dense模型和MoE模型。开源版本中,Dense模型基本沿用了之前的模型结构,差别之处在于对于Q和K两个tensor增加了RMSNorm;MoE模型去掉了公共Expert,其他结构基本与前一致。在模型大小上,涵盖了从0.6B到32B(Dense)和235B(MoE)不同的尺寸。

117 15
|
15天前
|
前端开发 语音技术
|

面向对话语音合成的模态间与模态内上下文交互建模

面向对话语音合成的模态间与模态内上下文交互建模

62 15
|
15天前
|
API 开发者 异构计算
|

实战 | Intel OpenVINO™ Day0 实现 Qwen3 快速部署

实战 | Intel OpenVINO™ Day0 实现 Qwen3 快速部署

102 10
|
15天前
|
自然语言处理 测试技术 Serverless
|

Qwen3开源发布:Think Deeper, Act Faster!社区推理、部署、微调、MCP调用实战教程来啦!

Qwen3开源发布:Think Deeper, Act Faster!社区推理、部署、微调、MCP调用实战教程来啦!

346 22
|
16天前
|
人工智能
|

Open AI Model

Open AI Model is an open model for defining AI. Focused on AI rather than application, Open AI Model [OAM] brings simplest but most powerful design for modeling AI.

50 4
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
|

魔搭社区模型速递(4.20-4.26)

魔搭ModelScope本期社区进展:2227个模型,270个数据集,167个创新应用,10篇内容

141 4
|
18天前
|
数据可视化 搜索推荐
|

Ollama-Deep-Researcher-本地Mac结合魔搭社区模型搭建网页研究助手

Ollama Deep Researcher 是一款完全本地化的网络研究助手,可使用Ollama托管的任何 LLM 。输入一个主题,它将生成网络搜索查询,收集网络搜索结果(默认通过Tavily),总结网络搜索结果,反思总结以检查知识差距,生成新的搜索查询以解决差距,搜索并改进总结,循环次数由用户定义。它将为用户提供最终的 markdown 摘要,其中包含所有使用的来源。

78 2
|
18天前
|
物联网 容器
|

“一丹一世界”三等奖 | 绮影录 创作分享

“一丹一世界”三等奖 | 绮影录 创作分享

54 2
|
18天前
|
人工智能 搜索推荐 API
|

AI赋能大学计划·大模型技术与应用实战学生训练营——华东师范大学站圆满结营

4月24日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行大模型应用实战学生训练营——华东师范大学站圆满结营。

61 2
|
19天前
|
人工智能 自然语言处理 监控
|

Cooragent:清华 LeapLab 开源 AI Agent 协作框架,一句话召唤AI军团!

Cooragent 是清华大学 LeapLab 团队推出的开源 AI Agent 协作框架,支持基于简单描述快速创建 Agent 并实现多 Agent 协作,具备 Prompt-Free 设计和本地部署能力。

185 6
来自: 自然语言处理  版块
|
19天前
|
人工智能 自然语言处理 监控
|

LongPort MCP:证券业首个券商MCP,AI赋能智能投资新时代,散户也能玩转机构级交易

LongPort MCP是长桥集团推出的证券行业首个券商模型上下文协议,通过标准化接口实现AI与金融服务的无缝对接,支持自然语言交互的智能投资服务。

233 8
来自: 自然语言处理  版块
|
19天前
|
Web App开发 人工智能 自然语言处理
|

Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互

Open Avatar Chat是阿里开源的模块化数字人对话系统,支持文本/音频/视频多模态交互,采用可替换组件设计,平均响应延迟仅2.2秒,为开发者提供灵活高效的解决方案。

417 3
来自: 多模态  版块
|
19天前
|
机器学习/深度学习 人工智能 算法
|

RAGEN:RL训练LLM推理新范式!开源强化学习框架让Agent学会多轮决策

RAGEN是一个基于StarPO框架的开源强化学习系统,通过马尔可夫决策过程形式化Agent与环境的交互,支持PPO、GRPO等多种优化算法,显著提升多轮推理训练的稳定性。

108 5
来自: 多模态  版块
|
20天前
|
机器学习/深度学习 人工智能 算法
|

高考理科题AI秒解!昆仑万维开源多模态推理模型 Skywork-R1V 2.0

Skywork-R1V 2.0是昆仑万维最新开源的多模态推理模型,通过混合强化学习和多模态奖励模型实现复杂推理任务,在理科题目解答和科研分析中展现出色性能。

124 11
来自: 多模态  版块
|
20天前
|
机器学习/深度学习 人工智能 物联网
|

开源8B参数全能扩散模型Flex.2-preview:把线稿变商稿,还能边画边改!

Flex.2-preview是Ostris开源的80亿参数文本到图像扩散模型,支持512token长文本输入和多类型控制引导,内置修复功能并兼容主流AI绘画工具链。

103 3
来自: 多模态  版块
|
20天前
|
机器学习/深度学习 人工智能 编解码
|

OpenAI 最新多模态图像生成模型 GPT-image-1:一句话生成商业图+智能修图

GPT-image-1是OpenAI推出的新一代多模态图像生成模型,通过API提供专业级图像生成与编辑能力,支持多种分辨率、格式和艺术风格定制。

132 10
来自: 多模态  版块
|
20天前
|
人工智能 测试技术 计算机视觉
|

让AI看懂3小时长视频!Eagle 2.5:英伟达推出8B视觉语言模型,长视频理解能力碾压72B大模型

Eagle 2.5是英伟达推出的8B参数视觉语言模型,通过创新训练策略在长视频和高分辨率图像理解任务中超越更大规模模型,支持512帧视频输入和多样化多模态任务。

131 10
来自: 多模态  版块
|
20天前
|
机器学习/深度学习 人工智能 自动驾驶
|

让AI看懂图像每个像素!英伟达推出多模态大模型 DAM-3B:图像视频局部描述精度提升300%

英伟达推出的DAM-3B多模态大语言模型,通过创新的焦点提示技术和局部视觉骨干网络,实现了对图像和视频中特定区域的精准描述生成,为内容创作和智能交互领域带来全新可能。

137 0
来自: 多模态  版块
|
20天前
|
存储 人工智能 编解码
|

"一丹一世界"二等奖 | MAJICFLUS_新浮世 创作分享

"一丹一世界"二等奖 | MAJICFLUS_新浮世 创作分享

53 2
|
20天前
|
存储 机器学习/深度学习 芯片
|

微软推出bitnet-b1.58-2B-4T:极致的量化,小巧而强大

随着大语言模型的发展,参数量逐渐扩大,大语言模型的训练和运行通常需要大量的计算资源,这也限制了大语言模型在一些场景尤其是端侧的应用,所以,探索剪枝,蒸馏等量化方式,已经成为大语言模型研究的一个重要方向。

157 3
|
20天前
|
人工智能 自然语言处理 物联网
|

"一丹一世界"二等奖 | TPSZ_二次元卡通梦幻插画风格-童梦拾光 创作分享

"一丹一世界"二等奖 | TPSZ_二次元卡通梦幻插画风格-童梦拾光 创作分享

56 7
|
20天前
|
前端开发 机器人 API
|

答疑机器人实践:AgentScope多智能体带你玩转多源召回

答疑机器人实践:AgentScope多智能体带你玩转多源召回

73 3
|
20天前
|
机器学习/深度学习 自然语言处理 物联网
|

Prot2Chat:融合蛋白质序列与结构的新型问答框架

Prot2Chat:融合蛋白质序列与结构的新型问答框架

50 1
|
20天前
|
机器学习/深度学习 编解码 缓存
|

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

339 6
|
20天前
|
编解码 开发者
|

ImagePulse图律脉动数据集开源发布:解码GPT-4o级图像生成能力,四大原子数据集+自动生成工具开放

ImagePulse图律脉动数据集开源发布:解码GPT-4o级图像生成能力,四大原子数据集+自动生成工具开放

44 3
|
20天前
|
人工智能 自然语言处理 算法
|

"一丹一世界"一等奖 | 曙光_麦橘超然 创作分享

"一丹一世界"一等奖 | 曙光_麦橘超然 创作分享

53 4
|
20天前
|
机器学习/深度学习 人工智能 算法
|

HumanRig:高德地图提出在大规模数据集中学习人形角色的自动绑定技术,数据集开源!

HumanRig:高德地图提出在大规模数据集中学习人形角色的自动绑定技术,数据集开源!

271 88
|
21天前
|
人工智能 自然语言处理 数据可视化
|

让AI单次生成4万字!WriteHERE:开源AI长文写作框架,单次生成超长文本,小说报告一键搞定!

WriteHERE是基于异质递归规划技术的开源AI写作框架,能动态分解写作任务并管理任务依赖关系,支持单次生成超过4万字的专业报告。

98 2
来自: 自然语言处理  版块

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

3
今日
14118
内容
6
活动
3297
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互