视觉智能开放平台

首页 标签 视觉智能开放平台
|
2天前
| |
来自: 视觉智能
【图片OCR识别用内容改名应用案例】用图片的内容改图片文件的名字,批量OCR识别图片上的文字并同时进行批量改名的操作,基于阿里云的实现详细步骤和注意事项
本系统通过OCR技术批量识别快递运单或商品图片中的关键文字信息,自动重命名为“单号-发货地-收货地”或“商品名-型号-规格”,支持多区域识别与表格导出,提升物流归档与电商管理效率。
|
2天前
| |
来自: 视觉智能
高效率办公PDF批量处理:批量OCR识别PDF区域文字内容,用PDF内容批量改名或导出表格的货物运单应用案例
针对铁路货运物流单存档需求,本项目基于WPF与飞桨OCR技术,实现批量图片多区域文字识别与自动重命名。用户可自定义识别区域,系统提取关键信息(如车号、批次号)并生成规范文件名,提升档案管理效率与检索准确性,支持PDF及图像文件处理。
|
5天前
| |
来自: 视觉智能
【发票转表格明细】PDF发票提取到表,图片发票提取到表格,扫描件发票提取到表格,全电发票PDF,全电发票扫描件识别导出EXCEL表格数电发票
本文介绍如何一键处理电子发票(PDF)和图片发票,实现自动提取信息、改名并导出Excel表格。支持区域坐标保存复用,批量识别,高效准确,告别手动录入,适合财务人员月末高效处理各类发票。
|
13天前
| |
来自: 视觉智能
pytorch基于AnimeFace128数据集训练DCGAN
基于AnimeFace128数据集,使用PyTorch构建DCGAN生成动漫人脸。包含生成器与判别器网络设计、数据加载及训练流程,通过对抗学习生成64×64清晰图像。
|
23天前
| |
来自: 视觉智能
Python图片上采样工具 - RealESRGANer
Real-ESRGAN基于深度学习实现图像超分辨率放大,有效改善传统PIL缩放的模糊问题。支持多种模型版本,推荐使用魔搭社区提供的预训练模型,适用于将小图高质量放大至大图,放大倍率越低效果越佳。
|
25天前
| |
来自: 视觉智能
AI Ping:精准可靠的大模型服务性能评测平台
AI Ping是清华系团队推出的“大模型服务评测平台”,被誉为“AI界的大众点评”。汇聚230+模型服务,7×24小时监测性能数据,以吞吐量、延迟等硬指标助力开发者科学选型。界面简洁,数据可视化强,支持多模型对比,横向对标国内外主流平台,为AI应用落地提供权威参考。
|
2月前
| |
来自: 视觉智能
OBS美颜美肌插件安装使用教程
软件是不自带美颜插件的,可以安装OBS-Studio-29.1.3安装包,就自带美颜功能的插件。在OBS软件【插件中心】菜单下,打开【打开插件中心】,安装美颜摄像头注册即可。在OBS软件【停靠窗口】菜单下,打开【美颜参数控制面板】的美颜窗口。插件里面有自带教程,可以自行学习。
腾讯混元最新开源:一张图,秒变游戏大片
有没有想过,随手拍的一张风景照,下一秒就能变成可操控的游戏开放世界?
|
3月前
| |
来自: 视觉智能
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现裂缝的检测识别(C#代码UI界面版)
本项目基于YOLOv8模型与C#界面,结合Baumer工业相机,实现裂缝的高效检测识别。支持图像、视频及摄像头输入,具备高精度与实时性,适用于桥梁、路面、隧道等多种工业场景。
免费试用