文档备案控制台

图像识别

# 图像识别 #

0 关注

1226内容

相关子社区

ModelScope模型即服务

15280内容 6活动 4272关注

最新热门文章问答视频训练营活动

阿里云OpenVI

|

博文

|

来自：视觉智能

【视觉智能AI场景解决方案——智慧考勤】

随着科技和经济的发展，考勤管理制度无论是对于企业还是学习，都是相对重要的管理制度。在传统考勤制度中，员工的出勤和工时需要依靠人工记录，并需要相应的人力来处理和审批。这种方式在浪费了时间和人力成本的基础上，还极易出现数据记录错误，造成一系列严重的后果。现如今，随着视觉智能AI的发展，智慧考勤可以实现。除了可以解决传统的考勤制度中的劣势之外，还具备完善的数据传输和保存系统，管理者可以更好地利用考勤数据和实时通知系统，更好地规划资源和调整工作安排。

# 图像识别 # 视觉智能开放平台 # 人工智能 # 算法 # 安全 # API

风正豪

|

博文

2023年电赛---运动目标控制与自动追踪系统（E题）发挥题思路

2023年电赛---运动目标控制与自动追踪系统（E题）发挥题思路

# 图像识别 # 编解码 # IDE # 算法 # 开发工具 # 计算机视觉

楠竹11

|

博文

|

来自：千问大模型

AI能力新突破下的AIGC：内容生产新范式

【1月更文挑战第1天】AI能力新突破下的AIGC：内容生产新范式

# 图像识别 # 人工智能 # 自然语言处理 # 搜索推荐 # 语音技术

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

VSI-Bench：李飞飞谢赛宁团队推出视觉空间智能基准测试集，旨在评估多模态大语言模型在空间认知和理解方面的能力

VSI-Bench是由李飞飞和谢赛宁团队推出的视觉空间智能基准测试集，旨在评估多模态大型语言模型（MLLMs）在空间认知和理解方面的能力。该基准测试集包含超过5000个问题-答案对，覆盖近290个真实室内场景视频，涉及多种环境，能够系统地测试和提高MLLMs在视觉空间智能方面的表现。

# 图像识别 # 数据采集 # 人工智能 # 自动驾驶 # 机器人 # 测试技术

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

OpenEMMA：德克萨斯开源端到端的自动驾驶多模态模型框架，基于预训练的 MLLMs，处理复杂的视觉数据，推理驾驶场景

OpenEMMA 是德州农工大学、密歇根大学和多伦多大学共同开源的端到端自动驾驶多模态模型框架，基于预训练的多模态大型语言模型处理视觉数据和复杂驾驶场景的推理。

# 图像识别 # 传感器 # 人工智能 # 自动驾驶 # API # 数据处理

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

AIOpsLab：云服务自动化运维 AI，微软开源云服务 AI 框架，覆盖整个生命周期

AIOpsLab 是微软等机构推出的开源框架，支持云服务自动化运维，涵盖故障检测、根本原因分析等完整生命周期。

# 图像识别 # 人工智能 # 运维 # Prometheus # Cloud Native # API

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

OpenBioMed：开源生物医学AI革命！20+工具链破解药物研发「死亡谷」

OpenBioMed 是清华大学智能产业研究院（AIR）和水木分子共同推出的开源平台，专注于 AI 驱动的生物医学研究，提供多模态数据处理、丰富的预训练模型和多样化的计算工具，助力药物研发、精准医疗和多模态理解。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 数据处理 # API # 容器

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

多模态模型卷王诞生！InternVL3：上海AI Lab开源78B多模态大模型，支持图文视频全解析！

上海人工智能实验室开源的InternVL3系列多模态大语言模型，通过原生多模态预训练方法实现文本、图像、视频的统一处理，支持从1B到78B共7种参数规模。

# 云解析DNS # 图像识别 # 人工智能 # 算法 # API

测试开发干货

|

博文

【实测】用airtest自动化做手游的每日任务

【实测】用airtest自动化做手游的每日任务

# 图像识别 # 编解码 # IDE # 开发工具

ModelScope运营小助手

|

问答

|

来自： ModelScope模型即服务

多模态模型的发展趋势：迄今为止最先进的模型，跨模态 GAN，多模态 Transformer

# 图像识别 # 机器学习/深度学习

1

...

16

17

18

19

20

免费试用