水印图像数据集、大规模水印数据集、整理分享

简介: 有效整理
❤️ 【专栏:数据集整理】❤️ 之【有效拒绝假数据】
👋 Follow me 👋,一起 Get 更多有趣 AI、冲冲冲 🚀 🚀

基础信息

  • 论文《 Towards Photo-Realistic Visible Watermark Removal with Conditional Generative Adversarial Networks 》中提出基于 U-net + CGAN 模型使用大规模水印数据集进行去水印操作;
  • 论文链接

数据集介绍

LVW数据集由6万张带水印图像组成,包含了80种来自于公司、组织和个人的水印,包括了中文、英文和logo等不同样式,每种水印对应750张图像。为了保证图像数据的一般性和可用性,公开的PASCAL VOC 2012数据集的图像被作为原始的无水印图像,然后将上述80种水印以随机的大小、位置和透明度打在原始图像上,同时记录下水印的位置信息。

1

数据集划分

为了适应现实场景中需要机器自动处理从未见过的水印和图像的需求,需要确保训练集中的水印和图像都不会出现在测试集中,这样可以很好地模拟现实生活中的使用场景。具体地,在80种水印中,64种水印被作为训练水印,剩余的16种水印被作为测试水印。同时,训练集图像从PASCAL VOC 2012数据集的训练和验证图像中挑选,而测试集图像从PASCAL VOC 2012数据集的测试图像中挑选。

数据集样本

1-1

该数据集用于学术,论文引用如下

****** Citation ******

Please cite the following papers if you use this LVW dataset in your research:

[1] Danni Cheng, Xiang Li, Wei-Hong Li, Chan Lu, FakeLi, Hua Zhao and Wei-Shi Zheng. "Large-Scale Visible Watermark Detection and Removal with Deep Convolutional Networks", Chinese Conference on Pattern Recognition and Computer Vision (PRCV) , 2018.

[2] Xiang Li, Chan Lu, Danni Cheng, Wei-Hong Li, Mei Cao, Bo Liu, Jiechao Ma and Wei-Shi Zheng. "Towards Photo-Realistic Visible Watermark Removal with Conditional Generative Adversarial Networks", International Conference on Image and Graphics (ICIG), 2019.

备注(论文中数据集制作说明)

1

数据集获取途径如下

搜索关注本博客同名公号,公号后台,回复 大规模水印获取本博文中的大规模水印数据集下载链接:
大规模水印

📙 博主 AI 领域八大干货专栏、诚不我欺

📙 预祝各位 2022 前途似锦、可摘星辰

🎉 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
❤️ 过去的一年、大家都经历了太多太多、祝你披荆斩棘、未来可期

9-9

目录
相关文章
|
机器学习/深度学习 算法 数据库
Dataset之LFW:LFW人脸数据库的简介、安装、使用方法之详细攻略
Dataset之LFW:LFW人脸数据库的简介、安装、使用方法之详细攻略
Dataset之LFW:LFW人脸数据库的简介、安装、使用方法之详细攻略
Unknown encoder ‘libx264‘的解决方法
Unknown encoder ‘libx264‘的解决方法
2047 0
|
机器学习/深度学习 编解码 人工智能
STAR:南京大学联合字节开源视频超分辨率增强生成框架,视频清晰度一键提升,支持从低分辨率视频生成高分辨率视频
STAR 是由南京大学、字节跳动和西南大学联合推出的视频超分辨率框架,能够将低分辨率视频提升为高分辨率,同时保持细节清晰度和时间一致性。
2433 13
STAR:南京大学联合字节开源视频超分辨率增强生成框架,视频清晰度一键提升,支持从低分辨率视频生成高分辨率视频
|
人工智能 算法 机器人
语音识别接口 - ASR性能指标WER/SER
做人工智能测试,准确一点,做语音聊天机器人、智能音箱等测试,一定会接触到语音误别即ASR (Automatic Speech Recognition)。本篇主要讲ASR的几个最重要的指标字错率、句错率。
2507 0
|
机器学习/深度学习 JSON 算法
实例分割笔记(一): 使用YOLOv5-Seg对图像进行分割检测完整版(从自定义数据集到测试验证的完整流程)
本文详细介绍了使用YOLOv5-Seg模型进行图像分割的完整流程,包括图像分割的基础知识、YOLOv5-Seg模型的特点、环境搭建、数据集准备、模型训练、验证、测试以及评价指标。通过实例代码,指导读者从自定义数据集开始,直至模型的测试验证,适合深度学习领域的研究者和开发者参考。
5691 3
实例分割笔记(一): 使用YOLOv5-Seg对图像进行分割检测完整版(从自定义数据集到测试验证的完整流程)
|
算法 PyTorch 算法框架/工具
论文解读:LaMa:Resolution-robust Large Mask Inpainting with Fourier Convolutions
论文解读:LaMa:Resolution-robust Large Mask Inpainting with Fourier Convolutions
1590 0
|
11月前
|
机器学习/深度学习 文字识别 自然语言处理
分析对比大模型OCR、传统OCR和深度学习OCR
OCR技术近年来迅速普及,广泛应用于文件扫描、快递单号识别、车牌识别及日常翻译等场景,极大提升了便利性。其发展历程从传统方法(基于模板匹配和手工特征设计)到深度学习(采用CNN、LSTM等自动学习高级语义特征),再到大模型OCR(基于Transformer架构,支持跨场景泛化和少样本学习)。每种技术在特定场景下各有优劣:传统OCR适合实时场景,深度学习OCR精度高但依赖大量数据,大模型OCR泛化能力强但训练成本高。未来,大模型OCR将结合多模态预训练,向通用文字理解方向发展,与深度学习OCR形成互补生态,最大化平衡成本与性能。
|
机器学习/深度学习 数据采集 算法
如何在一夜之间成为模型微调大师?——从零开始的深度学习修炼之旅,让你的算法功力飙升!
【10月更文挑战第5天】在机器学习领域,预训练模型具有强大的泛化能力,但直接使用可能效果不佳,尤其在特定任务上。此时,模型微调显得尤为重要。本文通过图像分类任务,详细介绍如何利用PyTorch对ResNet-50模型进行微调,包括环境搭建、数据预处理、模型加载与训练等步骤,并提供完整Python代码。通过调整超参数和采用早停策略等技巧,可进一步优化模型性能。适合初学者快速上手模型微调。
804 8
|
并行计算 PyTorch 算法框架/工具
阿里云PAI-部署Qwen2-VL-72B
阿里云PAI-部署Qwen2-VL-72B踩坑实录
4967 1