魔搭中文开源模型社区:模型即服务-视觉AI能力的开放现状及ModelScope实战

简介: 魔搭中文开源模型社区:模型即服务-

 

作者:谢宣松(星瞳)达摩院开放视觉智能资深算法专家

 

一、 视觉技术发展史

 

image.png

 

视觉是人类获取信息的最大渠道,它的应用非常广泛。在视觉领域,所有的信息都从感知增强开始,通过压缩传输、评估安全、搜索挖掘、生成编辑、认知理解,直至最后的重建互动。

 

image.png

 

视觉分类有很多维度,可以从技术、模态等维度进行分类。比如识别分割、缺陷检测、语义分割、外在识别等等。因此不管从技术维度、模态维度、其他应用维度来看,视觉分类非常广泛。

 

image.png

 

与此同时,视觉开放也有多种形态。比如开放学术圈的方法与思想,开放中高级开发者的模型与数据,开放初中级开发者的API,开放开发者的SDK组件,以及开放用户产品的解决方案等等。

 

image.png

 

为此,阿里巴巴在视觉开放方面,做了很多努力。比如达摩院针对API形态,开放的视觉智能开放平台。该平台开放了15类能力,200多种API能,日均调用达到亿级,目前开通的用户达到了七万人。

 


 

 

相关文章
|
5月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
938 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
5月前
|
存储 人工智能 搜索推荐
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
本文介绍基于LangGraph构建的双层记忆系统,通过短期与长期记忆协同,实现AI代理的持续学习。短期记忆管理会话内上下文,长期记忆跨会话存储用户偏好与决策,结合人机协作反馈循环,动态更新提示词,使代理具备个性化响应与行为进化能力。
1031 10
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
|
5月前
|
人工智能 IDE 开发工具
从6人日到1人日:一次AI驱动的客户端需求开发实战
从6人日到1人日:一次AI驱动的客户端需求开发实战
从6人日到1人日:一次AI驱动的客户端需求开发实战
|
5月前
|
数据采集 人工智能 JSON
Prompt 工程实战:如何让 AI 生成高质量的 aiohttp 异步爬虫代码
Prompt 工程实战:如何让 AI 生成高质量的 aiohttp 异步爬虫代码
|
5月前
|
人工智能 自然语言处理 JavaScript
Playwright MCP在UI回归测试中的实战:构建AI自主测试智能体
Playwright MCP结合AI智能体,革新UI回归测试:通过自然语言驱动浏览器操作,降低脚本编写门槛,提升测试效率与覆盖范围。借助快照解析、智能定位与Jira等工具集成,实现从需求描述到自动化执行的闭环,推动测试迈向智能化、民主化新阶段。
|
6月前
|
人工智能 Java API
Java AI智能体实战:使用LangChain4j构建能使用工具的AI助手
随着AI技术的发展,AI智能体(Agent)能够通过使用工具来执行复杂任务,从而大幅扩展其能力边界。本文介绍如何在Java中使用LangChain4j框架构建一个能够使用外部工具的AI智能体。我们将通过一个具体示例——一个能获取天气信息和执行数学计算的AI助手,详细讲解如何定义工具、创建智能体并处理执行流程。本文包含完整的代码示例和架构说明,帮助Java开发者快速上手AI智能体的开发。
2350 8
|
6月前
|
设计模式 人工智能 API
AI智能体开发实战:17种核心架构模式详解与Python代码实现
本文系统解析17种智能体架构设计模式,涵盖多智能体协作、思维树、反思优化与工具调用等核心范式,结合LangChain与LangGraph实现代码工作流,并通过真实案例验证效果,助力构建高效AI系统。
804 7
|
5月前
|
人工智能 自然语言处理 搜索推荐
营销智能体 AI 平台:技术人告别营销需求返工的实战手册
技术人常陷营销琐事:改文案、调接口、算数据。营销智能体AI平台并非“营销玩具”,而是为技术减负的利器。它将内容生成、投放优化、数据复盘自动化,无缝对接现有系统,提升效率2倍以上。落地需避三坑:勿贪全、勿求完美、紧扣业务需求。让技术专注核心,告别重复搬运。
197 0
|
5月前
|
人工智能 JSON 前端开发
实战教程:构建能交互网页的 AI 助手——基于 Playwright MCP 的完整项目
本项目构建一个智能网页操作助手,结合AI与Playwright实现自然语言驱动的网页自动化。支持登录、填表、数据提取等复杂操作,采用Node.js + React全栈架构,集成Anthropic Claude模型,打造高效、可扩展的自动化解决方案。
|
5月前
|
人工智能 供应链 安全
「AI大模型时代的CIO」云栖专场: AI实战者与落地破局者的坦白局
AI浪潮席卷每个企业,云栖大会CIO专场聚焦大模型落地难题。从阿里云到安克创新、顺丰等实战案例,揭示“Demo易、落地难”的根源,提出RIDE方法论与RaaS实践,破解组织、数据与技术协同困局,助力CIO冲破迷雾,探索AI转型的真痛点与真解法。

热门文章

最新文章