视觉智能开放平台

首页 标签 视觉智能开放平台
|
1天前
| |
来自: 视觉智能
AI Glasses识别百变脸谱
本项目提出“AI脸谱眼镜”方案:通过端云协同架构,结合人脸检测、EasyDL脸谱识别、戏曲百科与AR投射技术,让观众佩戴眼镜即可实时获取京剧角色名、性格、行当等信息。卡片投射于视野下方,不遮挡表演,专为戏迷、游客及学生设计,助力传统文化沉浸式普及。(239字)
|
1天前
| |
来自: 视觉智能
当AI Glasses走进小吃街,实现美食百科
这是一款面向吃货的AI眼镜系统,融合图像识别、美食百科与AR投射技术。用户扫视小吃,即刻获取名称、热量、辣度、成分及推荐指数等信息,端云协同实现500ms内响应。支持健康色标(绿/黄/红)、动态百科更新与场景化提示,让逛吃更聪明、更安心。(239字)
|
1天前
| |
来自: 视觉智能
AI视频去字幕技术完全指南:原理、方法与工具对比(2026版)
本文深度解析AI视频去字幕技术,涵盖原理(OCR检测+GAN修复+时序一致性)、主流工具横评、分步实操教程及短视频、教育、影视等六大行业应用。适合创作者、自媒体人与技术爱好者,20分钟掌握高效去字幕方法。
|
1天前
| |
来自: 视觉智能
【征文计划】使用Rokid与Unity开发背单词软件
你是否也有这样的时刻:打开手机准备背单词,却被弹出的通知带走了注意力,五分钟后又开始在刷短视频。 我们总想利用通勤和排队的碎片时间,但始终无法逃离手机这个时间黑洞,直到我开始佩戴Rokid AR眼镜,看着眼前空旷的视野,我突然有了一个想法。为何不开发一款极简背单词软件?
|
20天前
| |
来自: 视觉智能
【ComfyUI API 自动化利器:comfyui_xy Python 库使用详解】
`comfyui_xy` 是一个轻量级 Python 客户端库,封装 ComfyUI API,支持一键上传图片/遮罩、动态修改工作流、自动排队执行与结果下载(图/视/音频)。安装即用,无需处理底层 HTTP/WebSocket 细节,助力 AIGC 自动化开发。开源免费,PyPI 可装。
|
2月前
| |
来自: 视觉智能
【编号2571】AI 文生图 & 图生图工具开发与应用经验:高效解决批量图文生成痛点
AI 文生图工具,AI 图生图工具,Python AI 图文生成,批量生成无水印图片,Selenium 浏览器自动化,TKinter 界面开发,AI 生成图片去水印,批量图生图参数配置,参考图批量生成,AI 图文生成错误恢复
|
2月前
| |
来自: 视觉智能
构建AI智能体:九十五、YOLO视觉大模型入门指南:从零开始掌握目标检测
本文介绍了视觉大模型及YOLO目标检测技术,重点讲解YOLOv8在CPU上的部署与应用。涵盖模型选择、图像检测、实时摄像头识别及性能优化,适合初学者快速上手。
免费试用