计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
26104内容
|
15小时前
| |
魔搭Flowra开源:让AI工作流开发像搭积木一样简单
ModelScope联合呜哩WULI开源Flowra,FlowBench核心引擎!一站式节点开发工具,支持多模态数据、DAG执行、分布式调度与ModelScope模型无缝集成,助力AI工作流高效构建。
NeurIPS 2025 Spotlight!跨模态重识别革命!东北大学等 MDReID 图像信息智能匹配
东北大学等提出MDReID,获NeurIPS 2025 Spotlight!该方法实现跨模态行人重识别,创新性地将图像特征解耦为通用与专用特征,支持RGB、NIR、TIR等任意模态自由匹配,显著提升异源图像检索精度,推动安防、监控等领域智能化发展。
|
6天前
|
一键搞定人脸识别、语音识别、车牌识别本地化!离线跑模型不装框架!!!
SmartJavaAI 是专为 Java 开发者打造的离线 AI 工具箱,集成人脸识别、OCR、语音识别、机器翻译等 20+ 主流模型,基于 DJL + JNI 封装,支持 Maven 一键引入,两行代码调用,让 Java 工程师无需掌握 Python/C++ 即可轻松接入 AI 能力,高效落地各类智能场景。
|
7天前
|
用Qoder自动生成开源项目的说明书(wiki),新人爱看,老人爱用
程序员晚枫分享AI编程新利器Qoder:一键自动生成中文项目Wiki,解决文档维护难题。支持代码同步更新,降低学习成本,助力开源项目发展。12月第二周将在重庆阿里中心分享实战经验,欢迎交流!
|
10天前
|
Pixeltable:一张表搞定embeddings、LLM、向量搜索,多模态开发不再拼凑工具
Pixeltable 是一个开源多模态 AI 基础设施框架,统一管理文档、图像、视频、embedding 和 LLM 输出,通过“一切皆表”理念,将数据存储、计算与 pipeline 自动化集成于一体,简化 RAG、目标检测、相似性检索等应用开发,告别拼凑式架构,提升开发效率与可维护性。
|
10天前
|
2025年最佳AIGC视频服务商推荐!
2025年权威发布:聚焦快消行业,深度测评TOP5 AIGC视频服务商。从集之互动的私有化部署与全栈赋能,到可灵、即梦、梦影、讯视在内容生成、创意互动与数据驱动上的突破,全面助力品牌实现高效创作、精准传播与用户共创,引领AI营销新趋势。
|
10天前
|
Java 跳出多层循环
本文详解Java中如何使用带标签的`break`语句跳出多层循环。通过实例展示其语法与应用场景,如图像黑屏检测,并对比传统方法与Stream API,帮助开发者在性能与可读性间做出权衡,提升代码效率与质量。(238字)
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
|
11天前
|
停车场空车位检测数据集(3000张图片已划分)[目标检测]
在城市交通管理与智慧停车建设快速发展的当下,如何高效、精准地识别停车场空车位已成为智慧城市重要课题。为了支持研究者和工程团队训练高性能停车检测模型,我们构建了停车场空车位检测数据集,专为目标检测任务优化设计。
免费试用