|
9月前
|
人工智能 文字识别 安全
|

趣丸千音MCP首发上线魔搭社区,多重技术引擎,解锁AI语音无限可能

近日,趣丸千音(All Voice Lab)MCP正式首发上线魔搭社区。用户只需简单文本输入,即可调用视频翻译、TTS语音合成、智能变声、人声分离、多语种配音、语音转文本、字幕擦除等多项能力。

994 32
|
9月前
|
开发框架 定位技术 API
|

AgentScope 与 MCP:实践、思考与展望

AgentScope 作为一款功能强大的开源多智能体开发框架,为开发者提供了智能体构建、工具使用、多智能体编排等全方位支持。

1074 37
|
9月前
|
人工智能 安全 算法
|

十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!

近日,国家数据局举办了2025“数据要素×”首场新闻发布会。

365 9
|
9月前
|
机器学习/深度学习 数据采集 自然语言处理
|

魔搭社区模型速递(6.2-6.7)

魔搭ModelScope本期社区进展:1910个模型,183个数据集,47个创新应用,5 篇内容

1156 11
|
9月前
|
机器学习/深度学习 数据采集 并行计算
|

面壁小钢炮MiniCPM 4.0开源,端侧推理常规提速5倍!

面壁智能重磅推出MiniCPM 4.0 ——一个极致高效的端侧大模型,通过其 CPM.cu 自研推理框架,可实现220倍极致的速度提升,5 倍常规提速。

1259 14
|
9月前
|

开赛啦!AFAC2025金融智能创新大赛正式启动,等你来报名

开赛啦!AFAC2025金融智能创新大赛正式启动,等你来报名

338 13
|
9月前
|
机器学习/深度学习 编解码 文字识别
|

小米又放大招!MiMo-VL 多模态大模型开源,魔搭推理微调全面解读来了!

今天,小米开源发布两款 7B 规模视觉-语言模型 MiMo-VL-7B-SFT 和 MiMo-VL-7B-RL。

1297 9
|
9月前
|
测试技术
|

字节Seed开源统一多模态理解和生成模型 BAGEL!

近期,字节跳动Seed推出了 BAGEL—— 一个开源的多模态理解和生成础模型,具有70亿个激活参数(总共140亿个),并在大规模交错多模态数据上进行训练。

743 3
|
10月前
|
机器学习/深度学习 算法 测试技术
|

DeepSeek-R1-0528:小更新大升级

今天,DeepSeek R1 开源发布了其“小版本”升级——DeepSeek-R1-0528。

1126 24
|
10月前
|
机器学习/深度学习 算法 测试技术
|

DeepSeek-R1-0528:小更新大升级

今天,DeepSeek R1 开源发布了其“小版本”升级——DeepSeek-R1-0528。

1194 23
|
10月前
|
并行计算 异构计算 算法框架/工具
|

Funasr GPU2.0.0部署推理,RTF达不到0.0008,连0.0076都达不到。

335 0
来自:语音 版块
|
10月前
|
人工智能 编解码 API
|

搭友来碰头|魔搭核心开发者共创会精彩回顾

周五,首期"搭友来碰头"——魔搭核心开发者共创会在 [杭州·阿里巴巴云谷园区] 圆满落幕。来自杭州、上海、南京、北京等各地的魔搭社区核心开发者齐聚一堂,共同探索从模型开源到技术突破的转化路径。

295 11
|
10月前
|
人工智能 自然语言处理 API
|

魔搭社区模型速递(5.18-5.24)

魔搭ModelScope本期社区进展:📟3790个模型,📁307个数据集,🎨90个创新应用,📄 7 篇内容

633 14
|
10月前
|
人工智能 数据可视化 物联网
|

Reasoning模型蒸馏实践:用大模型提升小模型能力

DeepSeek-R1的爆火让更多开发者注意到模型蒸馏技术——这种让小模型也能"开小灶"习得大模型知识精华的秘诀。今天我们就用Qwen2.5-1.5B小模型(相当于AI界的初中生)来进行实践!

874 5
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI Agent

本文介绍了AI Agent的概念及其在云计算3.0时代的焦点地位,强调了其与大语言模型(LLM)的紧密联系。AI Agent由控制端(Brain)、感知端(Perception)和行动端(Action)组成,能够通过LLMs实现复杂的任务分解、记忆管理及工具使用。文章探讨了单代理、多代理及人机交互的应用场景,并分析了钢铁侠中贾维斯的现实版——微软开源JARVIS项目。此外,还提及了国内外多个开源平台及Python在AI领域的核心地位,同时提出了关于智能代理发展的开放问题,如安全性、群体智能演化及代理服务化等。最后提供了丰富的参考资料以供深入研究。

1421 16
|
10月前
|
人工智能 自然语言处理 数据安全/隐私保护
|

智源研究院发布开源中文互联网语料库CCI 4.0,新增高质量英文数据与合成数据

2025年5月6日,智源研究院在法国巴黎举行的GOSIM全球开源创新论坛上发布大型开源文本数据集CCI 4.0,为全球的大模型创新发展再次提供重要的开源资源,并积极推动全球开源合作。

360 10
|
10月前
|
人工智能 测试技术 API
|

通义灵码 + 魔搭MCP:全流程构建创空间应用

最近,通义灵码上线 MCP(ModelScope Cloud Platform)功能,从之前代码生成及修改的基础功能,到可以使用MCP服务连接更多功能,开发者可以实现从 代码爬取、模型推理到应用部署

2546 27
|
10月前
|
自然语言处理 监控 安全
|

阿里云发布可观测MCP!支持自然语言查询和分析多模态日志

阿里云可观测官方发布了Observable MCP Server,提供了一系列访问阿里云可观测各产品的工具能力,包含阿里云日志服务SLS、阿里云应用实时监控服务ARMS等,支持用户通过自然语言形式查询

1448 0
|
10月前
|
机器学习/深度学习 存储 安全
|

4G手机内存玩转Qwen2.5-Omni?MNN全面支持Qwen2.5-Omni与Qwen3!

随着移动端算力、存储能力的提升,在端侧部署大模型已成为趋势。本地化运行可消除网络延迟实现毫秒响应,降低云端算力成本,同时避免数据上传保障隐私安全。

2231 1
|
10月前
|
人工智能 监控 前端开发
|

基于 Next.js 的书法字体生成工具架构设计与 SSR 优化实践

本项目是一款书法字体生成工具,采用 Next.js 14(App Router)与 Tailwind CSS 构建前端,阿里云 Serverless 部署后端。通过混合渲染策略(SSG/SSR/CSR)、Web Worker 异步计算及 CDN 字体分片加载优化性能。服务端借助阿里云函数计算处理计算密集型任务,将平均耗时从 1200ms 降至 280ms,支持 1000+ QPS。动态路由与 ARMS 监控提升工程化水平,未来计划引入 WebGPU 和 AI 字体风格迁移技术,进一步优化用户体验。

340 0
|
10月前
|
机器学习/深度学习 开发框架 数据可视化
|

B站开源SOTA动画视频生成模型 Index-AniSora!

B站升级动画视频生成模型Index-AniSora技术并开源,支持番剧、国创、漫改动画、VTuber、动画PV、鬼畜动画等多种二次元风格视频镜头一键生成!

1027 32
|
10月前
|
机器学习/深度学习 算法 计算机视觉
|

产教融合结成果 与阿里云合作的结晶

近日,上海市计算机学会公布2024年度教学成果奖名单,赵卫东老师荣获一等奖。他长期专注计算机科学教学与科研,在课程体系创新和人才培养方面成效显著。获奖项目《面向新工科的计算机专业实践教学体系构建与创新》聚焦工程教育需求,通过教学改革提升学生实践能力。该成果包含与阿里云合作结晶,其深度学习教材涵盖多个实际应用案例,如图像分类、声音识别等,助力读者深入理解算法实践。

222 2
|
10月前
|
机器学习/深度学习 人工智能 机器人
|

魔搭社区模型速递(5.11-5.17)

🙋魔搭ModelScope本期社区进展:📟1656个模型,151个数据集,645个创新应用,📄 9 篇内容

440 11
|
10月前
|
开发框架 人工智能 安全
|

ModelScope魔搭25年5月发布月报

不知不觉间,日历已经翻过了立夏,而开源模型的世界中似乎并没有春夏秋冬。在刚刚过去的四月份,见证了开源社区又一次蓬勃发展的浪潮。以Qwen3家族为代表,一系列新模型的开源为整个生态注入了新的活力。通过全面覆盖多种规格的 dense 与 MoE 模型架构,Qwen3 首次在开源模型中引入“快思考与慢思考” 双模式的支持,获得了广大开发者的热烈欢迎,成为新一代开源大模型的标杆之作。

367 10
|
10月前
|
数据采集 人工智能 自然语言处理
|

阶跃星辰联合光影焕像开源 3D 大模型 Step1X-3D,高保真+可控!

阶跃星辰联合光影焕像开源 3D 大模型 Step1X-3D,高保真+可控!

372 4
|
10月前
|
前端开发 算法 API
|

构建高性能图像处理Web应用:Next.js与TailwindCSS实践

本文分享了构建在线图像黑白转换工具的技术实践,涵盖技术栈选择、架构设计与性能优化。项目采用Next.js提供优秀的SSR性能和SEO支持,TailwindCSS加速UI开发,WebAssembly实现高性能图像处理算法。通过渐进式处理、WebWorker隔离及内存管理等策略,解决大图像处理性能瓶颈,并确保跨浏览器兼容性和移动设备优化。实际应用案例展示了其即时处理、高质量输出和客户端隐私保护等特点。未来计划引入WebGPU加速、AI增强等功能,进一步提升用户体验。此技术栈为Web图像处理应用提供了高效可行的解决方案。

455 9
|
10月前
|
编解码 人工智能
|

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

2050 7
|
10月前
|
开发者
|

魔搭核心开发者共创会 | 邀请函

魔搭核心开发者共创会 | 邀请函

209 4
|
10月前
|
机器学习/深度学习
|

基于deepseek-v3来复现r1

174 0
|
10月前
|
物联网
|

“一丹一世界”三等奖 | 木刻时光·细密风 经验分享

“一丹一世界”三等奖 | 木刻时光·细密风 经验分享

226 7
|
10月前
|
数据可视化 API Swift
|

全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源

OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。

436 17
|
10月前
|
机器学习/深度学习 数据采集 安全
|

MiMo-7B:从预训练到强化学习,解锁语言模型的推理潜能

目前,大多数成功的 强化学习 工作,包括开源研究,都依赖于相对较大的基础模型,例如 32B 模型,特别是在增强代码推理能力方面。业内普遍认为在一个小模型中同时提升数学和代码能力是具有挑战性的。然而,小米MiMo研究团队相信 RL 训练的推理模型的有效性取决于基础模型固有的推理潜力。为了完全解锁语言模型的推理潜力,不仅需要关注后训练,还需要针对推理定制预训练策略。

683 43
|
10月前
|
人工智能 自然语言处理 搜索推荐
|

魔搭社区模型速递(4.27-5.10)

🙋魔搭ModelScope本期社区进展:📟2341个模型,206个数据集,🎨224个创新应用,📄 15篇内容

700 20

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15174
内容
6
活动
4077
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互