文档备案控制台

图像识别

# 图像识别 #

0 关注

1229内容

相关子社区

ModelScope模型即服务

15097内容 6活动 3980关注

最新热门文章问答视频训练营活动

游客ogm6hgopdrgay

|

21天前

|

博文

|

来自： ModelScope模型即服务

别再只依赖 ChatGPT 了：多模型协同，才是 AI 项目走向生产的关键一步

本文剖析AI项目落地困局：ChatGPT Agent类应用用户流失率超70%，根源不在模型不够强，而在于单模型架构难以支撑生产环境——稳定性差、成本高、难治理。文章从数据冲击、痛点直击等五维度论证，提出“多模型协同”是破局关键：按场景选模、统一调度、动态兜底，构建可控、可替换、可长期运行的AI系统架构。

# 图像识别 # 人工智能 # API # 调度

大米1003

|

22天前

|

博文

|

来自： ModelScope模型即服务

工程师思维看透人心？这个“集成框架”可能颠覆了个人成长领域

《内生力量智慧集成系统》是一套专为技术人设计的“自我认知操作系统”，以系统工程思维重构个人成长：用“七力光谱”扫描内在配置，以“阻滞系数”“一致性指数”等指标动态诊断，支持从调优（1.0–2.0）到重构（3.0）、集成（4.0）乃至超越工具（5.0）的全周期演进。它不贴标签，只提供可测量、可干预、可迭代的元认知框架，助你在AI时代成为自身意识系统的架构师。（239字）

# 图像识别 # 人工智能 # 监控 # 架构师 # 算法 # 持续交付

Kevosky

|

29天前

|

博文

|

来自： ModelScope模型即服务

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

Doo AI是一款简洁易用的开源AI模型本地部署工具，支持通义千问3/VL、LLaMA3.1等主流HF格式模型。下载即用，扫描→点击“加载”，可以快速、轻松完成部署；纯本地运行，隐私安全；支持文本对话、图像识别、RAG、角色提示词等实用功能。（239字）

# 图像识别 # 存储 # 人工智能 # 安全 # 前端开发 # API

maoyutinga1

|

2月前

|

博文

|

来自： ModelScope模型即服务

PPO最强，DPO一般？一文带你了解常见三种强化学习方法，文末推荐大模型微调神器！

大模型如何更懂人类？关键在于“对齐”。PPO、DPO、KTO是三大主流对齐方法：PPO效果强但复杂，DPO平衡高效，KTO低成本易上手。不同团队可根据资源选择路径。LLaMA-Factory Online让微调像浏览器操作一样简单，助力人人皆可训练专属模型。

# 图像识别 # 机器学习/深度学习 # 安全 # 算法 # 异构计算 # 数据采集

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策

RAGEN是一个基于StarPO框架的开源强化学习系统，通过马尔可夫决策过程形式化Agent与环境的交互，支持PPO、GRPO等多种优化算法，显著提升多轮推理训练的稳定性。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 算法

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！

Flex.2-preview是Ostris开源的80亿参数文本到图像扩散模型，支持512token长文本输入和多类型控制引导，内置修复功能并兼容主流AI绘画工具链。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 物联网 # 异构计算

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

MAGI-1是Sand AI开源的全球首个自回归视频生成大模型，采用创新架构实现高分辨率流畅视频生成，支持无限扩展和精细控制，在物理行为预测方面表现突出。

# 图像识别 # 人工智能 # 编解码 # 算法 # Docker # 容器

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱

上海AI Lab推出的Infinite Mobility采用程序化生成技术，可高效生成22类高质量可交互物体，单个生成仅需1秒且成本低至0.01元，已应用于机器人仿真训练等领域。

# 图像识别 # 人工智能 # 算法 # 数据可视化 # 机器人 # 开发工具

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

OpenUtau是一款开源的歌声合成工具，兼容UTAU音源库和重采样器，支持多语言界面及预渲染功能，让音乐创作更加高效便捷。

# 图像识别 # 人工智能 # Linux # iOS开发 # MacOS # Windows

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

视觉分词器突破天花板！GigaTok：港大字节联手打造3B参数视觉分词器，突破图像生成瓶颈

GigaTok是香港大学与字节跳动联合研发的3B参数视觉分词器，通过语义正则化技术和创新架构设计，解决了图像重建与生成质量间的矛盾，显著提升自回归模型的表示学习能力。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 知识图谱

1

2

3

4

...

20

免费试用