ModelScope模型即服务-推荐-第14页-阿里云开发者社区

开心工作室V(kaic_kaic)

|

8月前

|

小程序 JavaScript 关系型数据库

|

博文

weixin118电影院订票选座系统设计及实现+ssm(文档+源码)_kaic

本文介绍了一款基于微信小程序的电影院订票选座系统。该系统采用WXML、WXS、JS小程序语言开发，结合微信开发者工具和MYSQL数据库，实现了便捷的订票选座功能。用户无需下载安装，通过微信即可快速访问，操作简单高效。系统分为用户与管理员两大模块，支持电影信息查询、在线选座、订单管理等功能，同时确保数据安全与用户体验。经过可行性分析、功能设计、测试等环节，系统表现出良好的稳定性、实用性和可扩展性，为用户提供了一个全面、便捷的订票平台。

260 18 20

modelscope

|

8月前

|

人工智能编解码自然语言处理

|

博文

Gemma3：Google开源多模态神器，轻量高效，精通140+语言，解锁文本与图像任务

在当今快速发展的 AI 领域，多模态模型正逐渐成为推动技术革新的重要力量。Google 最新推出的 Gemma 3 模型，凭借其轻量级、多模态的特性，为文本生成和图像理解任务带来了全新的可能性。它不仅支持文本和图像输入，还具备强大的语言处理能力，覆盖超过 140 种语言，并且能够在资源有限的设备上高效运行。从问答到摘要，从推理到图像分析，Gemma 3 正在重新定义 AI 模型的边界，为开发者和研究人员提供了一个极具潜力的工具。

627 0 0

modelscope

|

8月前

|

人工智能自然语言处理机器人

|

博文

今日AI论文推荐：ReCamMaster、PLADIS、SmolDocling、FlowTok

由浙江大学、快手科技等机构提出的ReCamMaster是一个相机控制的生成式视频重渲染框架，可以使用新的相机轨迹重现输入视频的动态场景。该工作的核心创新在于利用预训练的文本到视频模型的生成能力，通过一种简单但强大的视频条件机制。为克服高质量训练数据的稀缺问题，研究者使用虚幻引擎5构建了一个全面的多相机同步视频数据集，涵盖多样化的场景和相机运动。

409 2 2

modelscope

|

8月前

|

人工智能安全测试技术

|

博文

本周 AI Benchmark 方向论文推荐

由北京大学和微软亚洲研究院的魏李等人提出的 FEA-Bench，是一个专为评估大型语言模型（LLMs）在代码库级别进行增量开发能力的基准测试。它从 83 个 GitHub 仓库中收集了 1,401 个任务实例，专注于新功能的实现。研究表明，即使是先进的 LLMs 在此任务中的表现仍远低于预期，揭示了仓库级代码开发的重大挑战。

337 0 0

蚝油菜花

|

8月前

|

存储人工智能 JSON

|

博文

Evolving Agents：开源Agent革命！智能体动态进化框架上线，复杂任务一键协同搞定

Evolving Agents 是一个开源的AI Agent管理与进化框架，支持智能代理之间的通信与协作，能够根据语义理解需求动态进化，适用于文档处理、医疗保健、金融分析等多个领域。

361 26 26

来自：自然语言处理版块

蚝油菜花

|

9月前

|

人工智能分布式计算监控

|

博文

AgentSociety：告别纸上谈兵！AI社会模拟器预判政策漏洞：输入新规秒看30年后社会形态

AgentSociety 是清华大学推出的基于大语言模型的社会模拟器，通过构建类人心智的智能体模拟复杂社会行为，适用于政策沙盒测试、危机预警等场景。

384 6 6

来自：多模态版块

蚝油菜花

|

9月前

|

人工智能文字识别安全

|

博文

Stirling-PDF：51.4K Star！用Docker部署私有PDF工作站，支持50多种PDF操作，从此告别在线工具

Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具，支持 50 多种 PDF 操作，包括合并、拆分、转换、压缩等，同时提供多语言支持和企业级功能，满足个人和企业用户的多样化需求。

694 6 6

来自：自然语言处理版块

modelscope

|

9月前

|

编解码 API 开发工具

|

博文

ModelScope魔搭25年2月版本发布月报

新春佳节的鞭炮声已经渐渐远去，在刚刚过去的一个月里，小鲸鱼给全球的开发者带来了一个不平凡的春节。DeepSeek-R1一系列开源模型的发布，给大家带来了惊喜和震动。所有人的热情，也给ModelScope社区带来了前所未见的巨大下载需求和流量，在这个月里，我们进行了数次紧急扩容和线上优化，尽量为大家提供更好的支持与服务。非常感谢大家的陪伴和理解，我们会持续进行平台优化和开源工具的建设，服务好整个开源社区。

323 9 9

modelscope

|

9月前

|

数据可视化 API 开发者

|

博文

R1类模型推理能力评测手把手实战

随着DeepSeek-R1模型的广泛应用，越来越多的开发者开始尝试复现类似的模型，以提升其推理能力。

656 2 2

蚝油菜花

|

9月前

|

人工智能 NoSQL Redis

|

博文

Collaborative Gym：斯坦福人机协作框架开源！异步交互+三方感知，让你的AI学会主动补位

介绍Collaborative Gym，一个专注于人机协作的框架，支持异步交互和多种任务环境。

279 14 15

来自：自然语言处理版块

蚝油菜花

|

10月前

|

机器学习/深度学习人工智能搜索推荐

|

博文

PaSa：字节跳动开源学术论文检索智能体，自动调用搜索引擎、浏览相关论文并追踪引文网络

PaSa 是字节跳动推出的基于强化学习的学术论文检索智能体，能够自动调用搜索引擎、阅读论文并追踪引文网络，帮助用户快速获取精准的学术文献。

660 15 15

来自：自然语言处理版块

蚝油菜花

|

10月前

|

数据采集人工智能异构计算

|

博文

Sky-T1：开源版"OpenAI o1-preview"，训练成本竟不到450美元

Sky-T1是NovaSky发布的开源推理AI模型，支持低成本训练，性能优异，适用于数学问题解决、编程评估和科学研究。

332 3 3

来自：自然语言处理版块

游客phlala5woslcc

|

10月前

|

Swift Python

|

问答

swift webui导出模型时报KeyError: 'base_model.model.model

411 2 0

蚝油菜花

|

10月前

|

人工智能语音技术 iOS开发

|

博文

MiniCPM-o 2.6：面壁智能开源多模态大模型，仅8B参数量就能媲美GPT-4o，支持实时交互，在ipad等终端设备上运行

MiniCPM-o 2.6 是面壁智能开源的多模态大模型，支持视觉、语音和多模态直播，性能媲美GPT-4o，能够在端侧设备上高效运行。

758 10 10

来自：多模态版块

蚝油菜花

|

10月前

|

人工智能编解码自然语言处理

|

博文

Aria-UI：港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型，整合动作历史信息实现更加准确的定位

Aria-UI 是香港大学与 Rhymes AI 联合开发的多模态模型，专为 GUI 智能交互设计，支持高分辨率图像处理，适用于自动化测试、用户交互辅助等场景。

388 11 12

来自：多模态版块

蚝油菜花

|

10月前

|

机器学习/深度学习编解码人工智能

|

博文

SeedVR：高效视频修复模型，支持任意长度和分辨率，生成真实感细节

SeedVR 是南洋理工大学和字节跳动联合推出的扩散变换器模型，能够高效修复低质量视频，支持任意长度和分辨率，生成真实感细节。

439 16 18

来自：计算机视觉版块

CodeFuse

|

11月前

|

运维前端开发算法

|

博文

开源中国【专访】 | CodeFuse：让研发变得更简单

CodeFuse 是蚂蚁集团自研的代码生成大模型，旨在简化研发流程，提供智能建议和实时支持。它能自动生成代码、添加注释、生成测试用例并优化代码。通过创新的 Rodimus 架构，CodeFuse 实现了“小体量，大能量”，显著提升了资源利用效率。其特色功能“图生代码”可将设计图一键转换为代码，准确率超过90%，大幅提高前端开发效率。此外，CodeFuse 还引入了“Code Graph”概念，帮助 LLM 更好地理解仓库级代码结构，缩短任务处理时间。未来，CodeFuse 将致力于全生命周期的研发支持，涵盖需求分析、代码生成到运维监测，推动行业技术迭代与创新。

466 3 3

蚝油菜花

|

11月前

|

人工智能 Linux API

|

博文

PromptWizard：微软开源 AI 提示词自动化优化框架，能够迭代优化提示指令和上下文示例，提升 LLMs 特定任务的表现

PromptWizard 是微软开源的 AI 提示词自动化优化框架，通过自我演变和自我适应机制，迭代优化提示指令和上下文示例，提升大型语言模型（LLMs）在特定任务中的表现。本文详细介绍了 PromptWizard 的主要功能、技术原理以及如何运行该框架。

829 8 9

来自：自然语言处理版块

Lucky_H

|

11月前

|

博文

【求助】ModelScope Notebook中如何使用conda

在魔搭创建的CPU环境中，虽然在Terminal中可以正常使用miniconda，但在Notebook中无法切换到conda环境，只能选择默认的ipykernel。如何解决这一问题？

235 12 12

蚝油菜花

|

11月前

|

人工智能数据挖掘大数据

|

博文

Freestyler：微软联合西工大和香港大学推出说唱音乐生成模型，支持控制生成的音色、风格和节奏等

Freestyler是由西北工业大学、微软和香港大学联合推出的说唱乐生成模型，能够根据歌词和伴奏直接生成说唱音乐。该模型基于语言模型生成语义标记，并通过条件流匹配模型和神经声码器生成高质量音频。Freestyler还推出了RapBank数据集，支持零样本音色控制和多种应用场景。

371 16 16

来自：语音版块

蚝油菜花

|

11月前

|

人工智能自然语言处理 API

|

博文

Multimodal Live API：谷歌推出新的 AI 接口，支持多模态交互和低延迟实时互动

谷歌推出的Multimodal Live API是一个支持多模态交互、低延迟实时互动的AI接口，能够处理文本、音频和视频输入，提供自然流畅的对话体验，适用于多种应用场景。

391 3 3

来自：自然语言处理版块

蚝油菜花

|

11月前

|

人工智能人机交互

|

博文

Proactive Agent：清华联合面壁智能开源的新一代主动Agent交互范式

Proactive Agent是由清华大学联合面壁智能等团队推出的新一代主动Agent交互范式。它具备主动性，能够预测用户需求并在没有直接指令的情况下采取行动。本文详细介绍了Proactive Agent的主要功能、技术原理以及如何运行和评估其性能。

559 9 9

来自：自然语言处理版块

蚝油菜花

|

12月前

|

SQL 人工智能 JSON

|

博文

XGrammar：陈天奇团队推出的LLM结构化生成引擎

XGrammar是由陈天奇团队推出的开源软件库，专为大型语言模型（LLM）设计，提供高效、灵活且可移植的结构化数据生成能力。基于上下文无关语法（CFG），XGrammar支持递归组合以表示复杂结构，适用于生成JSON、SQL等格式数据，并通过字节级下推自动机优化解释CFG，实现百倍加速。

460 0 0

来自：自然语言处理版块

蚝油菜花

|

12月前

|

人工智能 API

|

博文

OmniSearch：阿里巴巴通义推出的多模态检索增强生成框架

本文介绍了阿里巴巴通义实验室推出的多模态检索增强生成框架 OmniSearch，该框架具备自适应规划能力，能够动态拆解复杂问题，根据检索结果和问题情境调整检索策略，从而提升检索效率和准确性。

999 5 5

来自：多模态版块

rover12421

|

3月前

|

问答

DeepSeek V3.1 昨天还能用tool，今天怎么就用不了了？

295 0 0

modelscope

|

4月前

|

机器学习/深度学习 JSON 自然语言处理

|

博文

小模型，大用途！用于结构化输出的小型语言模型

小型语言模型（SLM）通常被用于端侧推理，搜索推荐query改写这类对于资源要求低，大规模并发时延要求高的场景

202 0 0

modelscope

|

5月前

|

人工智能移动开发物联网

|

博文

ModelScope魔搭25年6月发布月报

从2022年11月的青涩发布，魔搭现今已进入第三个年头，成为中国最大最活跃的开源模型社区，与超过1600万的开发者同行。

278 6 6

joln

|

5月前

|

API PHP

|

问答

obsidian插件Smart Composer添加modelscope的API后，执行报错

120 0 0

蚝油菜花

|

7月前

|

机器学习/深度学习人工智能编解码

|

博文

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图

SimpleAR是复旦大学与字节Seed团队联合研发的自回归图像生成模型，仅用5亿参数即可生成1024×1024分辨率的高质量图像，在GenEval等基准测试中表现优异。

254 4 4

来自：多模态版块

飞天葫芦

|

7月前

|

数据采集分布式计算监控

|

博文

智能数据建设与治理 Dataphin：阿里云的一站式数据治理利器

阿里云Dataphin是一款企业级数据治理与智能建设平台，专注于解决数据孤岛、质量低下和开发效率低等问题。它提供从数据集成、规范建模、智能开发到质量监控及资产管理的全生命周期解决方案，特别适用于中大型企业构建数据中台或推进数字化转型。Dataphin通过自动化生成代码、内置质量规则模板和全局血缘追踪等功能，显著提升数据开发效率与跨团队协作能力。尽管学习曲线较陡峭且资源消耗较高，但其深度集成阿里云生态的优势，使其成为追求规范化数据治理企业的理想选择。推荐已采用阿里云技术栈并具备一定数据团队规模的企业使用。

430 1 1

游客oumtlkfjwvjdg

|

7月前

|

问答

有免费好用开源的textToSQL开源框架(准确率高的)

113 0 0

蚝油菜花

|

7月前

|

机器学习/深度学习人工智能前端开发

|

博文

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

Meta最新开源的SWEET-RL框架通过优化多轮交互任务的信用分配机制，使Llama-3.1-8B模型在协作推理任务中的表现提升6%，性能达到顶尖大模型水平。

356 33 33

来自：自然语言处理版块

蚝油菜花

|

8月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

DeepMesh：3D建模革命！清华团队让AI自动优化拓扑，1秒生成工业级网格

DeepMesh 是由清华大学和南洋理工大学联合开发的 3D 网格生成框架，基于强化学习和自回归变换器，能够生成高质量的 3D 网格，适用于虚拟环境构建、动态内容生成、角色动画等多种场景。

565 4 4

来自：计算机视觉版块

游客pxzqqffppfet6

|

8月前

|

博文

用通义万象做一个动态海报庆祝4月24日中国航天日

这段文案描述了一幅动画海报的设计理念，融合传统与现代、科技与梦想。画面以上海黄浦江为背景，明月升起象征传统，火箭升空代表科技探索。穿着旗袍的女孩和多元人群展现文化传承，火箭化为飞船遨游宇宙寓意人类追求未知。古代天文仪器与现代科技呼应，体现历史与未来的对话。整体传达对科技成就的喜悦及对未来的美好期许，致敬中国科学家与宇航员，祝福祖国繁荣昌盛。

232 0 0

蚝油菜花

|

8月前

|

机器学习/深度学习人工智能 API

|

博文

GPT-4o-Transcribe：OpenAI 推出高性能语音转文本模型！错误率暴降90%+方言通杀，Whisper当场退役

GPT-4o-Transcribe 是 OpenAI 推出的高性能语音转文本模型，支持多语言和方言，适用于复杂场景如呼叫中心和会议记录，定价为每分钟 0.006 美元。

390 2 2

来自：语音版块

modelscope

|

8月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

RWKV-7革新序列建模，Impossible Videos探索超现实，Creation-MMBench点燃创意火花: 今日论文

由 RWKV 项目（Linux Foundation AI & Data）和 EleutherAI 等机构提出的 RWKV-7 "Goose"，是一种全新的序列建模架构。它在30亿参数规模上刷新了多语言任务的下游性能纪录，媲美顶级英文语言模型，同时仅需恒定内存和推理时间。核心创新包括广义delta规则和上下文学习率优化，超越了传统Transformer的表达能力。作者还开源了3.1万亿token的多语言数据集和代码，助力社区研究。

159 3 3

尘2

|

8月前

|

异构计算

|

问答

Qwen2.5-14B-Instruct-GPTQ-Int4量化模型是只能在GPU上运行吗？

313 0 0

modelscope

|

8月前

|

人工智能自然语言处理开发者

|

博文

魔搭社区模型速递（2.16-3.1）

🙋魔搭ModelScope本期社区进展：📟2621个模型，Ovis2系列模型等，📁276个数据集，🎨203个创新应用，📄 12篇技术内容

520 2 2

蚝油菜花

|

8月前

|

存储 SQL 人工智能

|

博文

DeepSeek开源周第五弹之二！Smallpond：构建于3FS之上的轻量级数据处理框架，高效处理PB级数据

Smallpond 是 DeepSeek 开源的轻量级数据处理框架，基于 DuckDB 和 3FS 构建，支持 PB 级数据处理，提供高性能的数据加载、查询和转换功能，适合大规模数据预处理和实时分析。

436 1 1

来自：科学计算版块

蚝油菜花

|

9月前

|

人工智能数据可视化数据处理

|

博文

PySpur：零代码构建AI工作流！开源可视化拖拽平台，支持多模态与RAG技术

PySpur 是一款开源的轻量级可视化 AI 智能体工作流构建器，支持拖拽式界面，帮助用户快速构建、测试和迭代 AI 工作流，无需编写复杂代码。它支持多模态数据处理、RAG 技术、文件上传、结构化输出等功能，适合非技术背景的用户和开发者快速上手。

539 5 6

来自：自然语言处理版块

探索云世界动手实践

|

9月前

|

存储自然语言处理监控

|

博文

基于DeepSeek的智能客服系统安全与隐私保护：构建可信赖的服务

在前四篇文章中，我们完成了智能客服系统的开发、部署、优化和扩展。本文聚焦于安全与隐私保护，探讨如何构建安全可靠的智能客服系统。内容涵盖数据安全（加密、脱敏、备份）、系统安全（输入验证、身份认证、日志监控）和隐私保护（隐私政策、数据最小化、访问控制），确保用户数据安全及系统稳定运行。通过这些措施，我们可以打造一个可信赖的智能客服系统，为用户提供更好的服务体验。

463 1 1

蚝油菜花

|

9月前

|

人工智能 Rust 安全

|

博文

DeepClaude：结合 DeepSeek R1 和 Claude AI 各自优势开发的 AI 应用平台，支持 API 调用和零延迟的即时响应

DeepClaude 是一个开源的 AI 应用开发平台，结合了 DeepSeek R1 和 Claude 模型的优势，提供即时响应、端到端加密和高度可配置的功能。

651 4 4

来自：自然语言处理版块

蚝油菜花

|

9月前

|

人工智能安全数据挖掘

|

博文

MedRAX：专注于胸部X光检查的AI医学推理智能体，帮助医生快速解读胸部X光片

MedRAX 是一款专门用于胸部X光检查的医学推理AI智能体，整合了多种最先进的分析工具，支持多模态推理和动态任务分解。

495 10 10

来自：多模态版块

modelscope

|

9月前

|

Swift

|

博文

DeepSeek开源Janus-Pro多模态理解生成模型，魔搭社区推理、微调最佳实践

Janus-Pro是DeepSeek最新开源的多模态模型，是一种新颖的自回归框架，统一了多模态理解和生成。

821 19 21

蚝油菜花

|

9月前

|

人工智能编解码文字识别

|

博文

OCRmyPDF：16.5K Star！快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具

OCRmyPDF 是一款开源命令行工具，专为将扫描的 PDF 文件转换为可搜索、可复制的文档。支持多语言、图像优化和多核处理。

970 17 17

来自：多模态版块

蚝油菜花

|

10月前

|

人工智能自然语言处理搜索推荐

|

博文

GLM-Realtime：智谱推出多模态交互AI模型，融入清唱功能，支持视频和语音交互

GLM-Realtime 是智谱推出的端到端多模态模型，具备低延迟的视频理解与语音交互能力，支持清唱功能、2分钟内容记忆及灵活调用外部工具，适用于多种智能场景。

410 4 4

来自：多模态版块

蚝油菜花

|

10月前

|

人工智能文字识别异构计算

|

博文

NVIDIA-Ingest：英伟达开源智能文档提取及结构化工具，支持 GPU 加速和并行处理

NVIDIA-Ingest 是英伟达开源的智能文档提取工具，支持 PDF、Word、PPT 等多种格式，提供并行处理和 GPU 加速，适用于企业内容管理和生成式应用。

381 18 19

来自：多模态版块

游客ieeecuqh5ljc4

|

10月前

|

问答

对modelscope的实体命名预训练模型进行微调上出现错误

246 1 0

蚝油菜花

|

10月前

|

人工智能 Python

|

博文

ImBD：复旦联合华南理工推出 AI 内容检测模型，快速辨别文本内容是否为 AI 生成

ImBD是一款由复旦大学、华南理工大学等机构联合推出的AI内容检测器，能够快速识别机器修订文本，适用于多种场景，显著提升检测性能。

717 8 8

来自：自然语言处理版块

蚝油菜花

|

10月前

|

人工智能 JSON API

|

博文

LongDocURL：中科院联合阿里推出多模态长文档理解基准数据集，用于评估模型对复杂文档分析与推理的能力

LongDocURL 是由中科院与淘天集团联合推出的多模态长文档理解基准数据集，涵盖 2,325 个问答对，支持复杂文档的理解、推理和定位任务。

476 77 77

来自：多模态版块

最新

文章

视频

问答

推荐

weixin118电影院订票选座系统设计及实现+ssm(文档+源码)_kaic

Gemma3：Google开源多模态神器，轻量高效，精通140+语言，解锁文本与图像任务

今日AI论文推荐：ReCamMaster、PLADIS、SmolDocling、FlowTok

本周 AI Benchmark 方向论文推荐

Evolving Agents：开源Agent革命！智能体动态进化框架上线，复杂任务一键协同搞定

AgentSociety：告别纸上谈兵！AI社会模拟器预判政策漏洞：输入新规秒看30年后社会形态

Stirling-PDF：51.4K Star！用Docker部署私有PDF工作站，支持50多种PDF操作，从此告别在线工具

ModelScope魔搭25年2月版本发布月报

R1类模型推理能力评测手把手实战

Collaborative Gym：斯坦福人机协作框架开源！异步交互+三方感知，让你的AI学会主动补位

PaSa：字节跳动开源学术论文检索智能体，自动调用搜索引擎、浏览相关论文并追踪引文网络

Sky-T1：开源版"OpenAI o1-preview"，训练成本竟不到450美元

swift webui导出模型时报KeyError: 'base_model.model.model

MiniCPM-o 2.6：面壁智能开源多模态大模型，仅8B参数量就能媲美GPT-4o，支持实时交互，在ipad等终端设备上运行

Aria-UI：港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型，整合动作历史信息实现更加准确的定位

SeedVR：高效视频修复模型，支持任意长度和分辨率，生成真实感细节

开源中国【专访】 | CodeFuse：让研发变得更简单

PromptWizard：微软开源 AI 提示词自动化优化框架，能够迭代优化提示指令和上下文示例，提升 LLMs 特定任务的表现

【求助】ModelScope Notebook中如何使用conda

Freestyler：微软联合西工大和香港大学推出说唱音乐生成模型，支持控制生成的音色、风格和节奏等

Multimodal Live API：谷歌推出新的 AI 接口，支持多模态交互和低延迟实时互动

Proactive Agent：清华联合面壁智能开源的新一代主动Agent交互范式

XGrammar：陈天奇团队推出的LLM结构化生成引擎

OmniSearch：阿里巴巴通义推出的多模态检索增强生成框架

DeepSeek V3.1 昨天还能用tool，今天怎么就用不了了？

小模型，大用途！用于结构化输出的小型语言模型

ModelScope魔搭25年6月发布月报

obsidian插件Smart Composer添加modelscope的API后，执行报错

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图

智能数据建设与治理 Dataphin：阿里云的一站式数据治理利器

有免费好用开源的textToSQL开源框架(准确率高的)

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

DeepMesh：3D建模革命！清华团队让AI自动优化拓扑，1秒生成工业级网格

用通义万象做一个动态海报庆祝4月24日中国航天日

GPT-4o-Transcribe：OpenAI 推出高性能语音转文本模型！错误率暴降90%+方言通杀，Whisper当场退役

RWKV-7革新序列建模，Impossible Videos探索超现实，Creation-MMBench点燃创意火花: 今日论文

Qwen2.5-14B-Instruct-GPTQ-Int4量化模型是只能在GPU上运行吗？

魔搭社区模型速递（2.16-3.1）

DeepSeek开源周第五弹之二！Smallpond：构建于3FS之上的轻量级数据处理框架，高效处理PB级数据

PySpur：零代码构建AI工作流！开源可视化拖拽平台，支持多模态与RAG技术

基于DeepSeek的智能客服系统安全与隐私保护：构建可信赖的服务

DeepClaude：结合 DeepSeek R1 和 Claude AI 各自优势开发的 AI 应用平台，支持 API 调用和零延迟的即时响应

MedRAX：专注于胸部X光检查的AI医学推理智能体，帮助医生快速解读胸部X光片

DeepSeek开源Janus-Pro多模态理解生成模型，魔搭社区推理、微调最佳实践

OCRmyPDF：16.5K Star！快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具

GLM-Realtime：智谱推出多模态交互AI模型，融入清唱功能，支持视频和语音交互

NVIDIA-Ingest：英伟达开源智能文档提取及结构化工具，支持 GPU 加速和并行处理

对modelscope的实体命名预训练模型进行微调上出现错误

ImBD：复旦联合华南理工推出 AI 内容检测模型，快速辨别文本内容是否为 AI 生成

LongDocURL：中科院联合阿里推出多模态长文档理解基准数据集，用于评估模型对复杂文档分析与推理的能力

ModelScope模型即服务

活跃用户

相关产品