计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
26080内容
为什么说多模态是推荐系统破局的关键?来自饿了么一线的实战复盘
推荐系统作为互联网时代连接用户与信息的核心技术,正在经历从传统协同过滤向多模态智能推荐的重要变革。随着深度学习技术的快速发展,特别是大语言模型和多模态预训练技术的成熟,推荐系统开始从单纯依赖用户行为ID特征转向充分利用商品图像、文本描述等丰富内容信息的新范式。
|
1小时前
| |
构建AI智能体:二十二、双剑合璧:Qwen系列双模型在文生文、文生图中的搭配应用
使用Gradio构建的一个演示界面,该界面将展示如何使用Qwen-Turbo生成提示词,然后使用Qwen-Image生成图像。 我们将按照之前的设计,将流程分为两个主要步骤:先生成提示词,然后生成图像。在提示词生成成功之前,直接生成图像将会给出提示先生成提示词。
AI公有云第一,阿里云持续领跑
国际数据公司(IDC)发布《中国AI公有云服务市场份额,2024》,其中阿里云以24.6%的市场占比稳居全国第一,并在对话式AI和智能语音两大细分市场蝉联榜首。
|
2天前
| |
构建AI智能体:二十、妙笔生花:Gradio集成DashScope Qwen-Image模型实现文生图
本文介绍了一个基于Gradio和阿里云通义千问Qwen-Image模型的文生图应用。该应用通过简洁的Web界面实现文本生成图像功能,支持多种风格(3D卡通、动漫、油画等)和尺寸选择,并包含负面提示词功能。文章详细解析了代码结构,包括API调用封装、参数映射、错误处理等核心功能模块,同时提供了丰富的示例提示词和生成效果展示。该工具适合探索AI图像生成能力,通过调整提示词和参数可优化生成效果。
仅3B激活参数,更强的多模态理解与推理能力,百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源!
11月11日,百度开源文心ERNIE-4.5-VL-28B-A3B-Thinking多模态模型,仅3B激活参数,性能媲美顶级大模型。具备强大视觉语言理解、跨模态推理与“图像思考”等创新功能,支持工具调用与视频分析,适用于复杂图文任务,全面开放商用。
2025年11月,数字人平台排行与数字化应用选择指南
数字人企业正引领未来产业新蓝海,AI交互与场景落地,推动数字人从概念走向规模化应用,重塑金融、教育、元宇宙等多领域生态,开启虚实融合的全新篇章。
基于YOLOv8的可回收瓶类垃圾快速识别与自动化分拣|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于 YOLOv8 构建了一套可回收瓶类垃圾的实时识别与自动化分拣系统,从数据集构建、模型训练到 PyQt5 可视化界面部署,形成了完整的工程化闭环。系统能够对多种瓶类废弃物进行高精度识别,并支持图片、视频、摄像头流等多场景实时处理,适用于垃圾回收站、环卫中转站、产线分拣系统等实际应用场景。
基于 YOLOv8 的焊接表面缺陷检测|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于 YOLOv8 深度学习目标检测模型,结合 PyQt5 图形界面,实现了一个完整的焊接表面缺陷检测系统。通过实际演示可以看出,该系统能够对单张图片、批量图片、视频以及实时摄像头流进行高精度检测,并自动标注缺陷位置和类别,支持检测结果的保存和复查,为工业生产线提供了高效、智能化的焊接质量监控手段。
基于YOLOv8的牛行为检测识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目通过 YOLOv8 模型与 PyQt5 界面结合,实现了牛行为的高效识别与分类。5000张高质量标注数据保证了模型的准确性,多样化场景增强了泛化能力。系统简单易用,支持图片、视频、摄像头多种输入方式,为智能养殖和畜牧管理提供了高效工具。无论是科研实验还是实际牧场监控,本项目都可快速部署,开箱即用。
matlab实现指纹识别
指纹识别技术凭借其唯一性和稳定性,已成为生物特征识别领域的重要组成部分。MATLAB作为强大的数值计算和图像处理平台,为指纹识别算法的研究与实现提供了有力支持。
免费试用