计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
26078内容
AI公有云第一,阿里云持续领跑
国际数据公司(IDC)发布《中国AI公有云服务市场份额,2024》,其中阿里云以24.6%的市场占比稳居全国第一,并在对话式AI和智能语音两大细分市场蝉联榜首。
|
20小时前
| |
构建AI智能体:二十、妙笔生花:Gradio集成DashScope Qwen-Image模型实现文生图
本文介绍了一个基于Gradio和阿里云通义千问Qwen-Image模型的文生图应用。该应用通过简洁的Web界面实现文本生成图像功能,支持多种风格(3D卡通、动漫、油画等)和尺寸选择,并包含负面提示词功能。文章详细解析了代码结构,包括API调用封装、参数映射、错误处理等核心功能模块,同时提供了丰富的示例提示词和生成效果展示。该工具适合探索AI图像生成能力,通过调整提示词和参数可优化生成效果。
|
21小时前
| |
仅3B激活参数,更强的多模态理解与推理能力,百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源!
11月11日,百度开源文心ERNIE-4.5-VL-28B-A3B-Thinking多模态模型,仅3B激活参数,性能媲美顶级大模型。具备强大视觉语言理解、跨模态推理与“图像思考”等创新功能,支持工具调用与视频分析,适用于复杂图文任务,全面开放商用。
2025年11月,数字人平台排行与数字化应用选择指南
数字人企业正引领未来产业新蓝海,AI交互与场景落地,推动数字人从概念走向规模化应用,重塑金融、教育、元宇宙等多领域生态,开启虚实融合的全新篇章。
基于YOLOv8的可回收瓶类垃圾快速识别与自动化分拣|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于 YOLOv8 构建了一套可回收瓶类垃圾的实时识别与自动化分拣系统,从数据集构建、模型训练到 PyQt5 可视化界面部署,形成了完整的工程化闭环。系统能够对多种瓶类废弃物进行高精度识别,并支持图片、视频、摄像头流等多场景实时处理,适用于垃圾回收站、环卫中转站、产线分拣系统等实际应用场景。
基于 YOLOv8 的焊接表面缺陷检测|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于 YOLOv8 深度学习目标检测模型,结合 PyQt5 图形界面,实现了一个完整的焊接表面缺陷检测系统。通过实际演示可以看出,该系统能够对单张图片、批量图片、视频以及实时摄像头流进行高精度检测,并自动标注缺陷位置和类别,支持检测结果的保存和复查,为工业生产线提供了高效、智能化的焊接质量监控手段。
基于YOLOv8的牛行为检测识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目通过 YOLOv8 模型与 PyQt5 界面结合,实现了牛行为的高效识别与分类。5000张高质量标注数据保证了模型的准确性,多样化场景增强了泛化能力。系统简单易用,支持图片、视频、摄像头多种输入方式,为智能养殖和畜牧管理提供了高效工具。无论是科研实验还是实际牧场监控,本项目都可快速部署,开箱即用。
matlab实现指纹识别
指纹识别技术凭借其唯一性和稳定性,已成为生物特征识别领域的重要组成部分。MATLAB作为强大的数值计算和图像处理平台,为指纹识别算法的研究与实现提供了有力支持。
|
1天前
|
按图搜索1688商品API接口技术实现指南
1688按图搜索基于图像特征匹配技术,用户上传图片后,系统提取特征向量并在商品库中进行相似度匹配,返回相似商品列表。支持JPG/PNG格式,建议图片300×300像素以上、小于2MB。通过API调用,可用于电商比价、选品、侵权检测等场景,需申请权限并注意调用频率与版权问题。(239字)
|
2天前
|
一图掌握通义千问:模型生态与应用场景全览
通义千问(Qwen)系列提供全栈开源AI能力,涵盖语言、视觉、语音等多模态应用。旗舰模型Qwen3-Max性能领先,支持92种语言翻译与高精度语音识别,具备强大代码生成与图像处理能力,助力开发者与企业高效构建智能应用。
免费试用