水印图像数据集、大规模水印数据集、整理分享

简介: 有效整理
❤️ 【专栏:数据集整理】❤️ 之【有效拒绝假数据】
👋 Follow me 👋,一起 Get 更多有趣 AI、冲冲冲 🚀 🚀

基础信息

  • 论文《 Towards Photo-Realistic Visible Watermark Removal with Conditional Generative Adversarial Networks 》中提出基于 U-net + CGAN 模型使用大规模水印数据集进行去水印操作;
  • 论文链接

数据集介绍

LVW数据集由6万张带水印图像组成,包含了80种来自于公司、组织和个人的水印,包括了中文、英文和logo等不同样式,每种水印对应750张图像。为了保证图像数据的一般性和可用性,公开的PASCAL VOC 2012数据集的图像被作为原始的无水印图像,然后将上述80种水印以随机的大小、位置和透明度打在原始图像上,同时记录下水印的位置信息。

1

数据集划分

为了适应现实场景中需要机器自动处理从未见过的水印和图像的需求,需要确保训练集中的水印和图像都不会出现在测试集中,这样可以很好地模拟现实生活中的使用场景。具体地,在80种水印中,64种水印被作为训练水印,剩余的16种水印被作为测试水印。同时,训练集图像从PASCAL VOC 2012数据集的训练和验证图像中挑选,而测试集图像从PASCAL VOC 2012数据集的测试图像中挑选。

数据集样本

1-1

该数据集用于学术,论文引用如下

****** Citation ******

Please cite the following papers if you use this LVW dataset in your research:

[1] Danni Cheng, Xiang Li, Wei-Hong Li, Chan Lu, FakeLi, Hua Zhao and Wei-Shi Zheng. "Large-Scale Visible Watermark Detection and Removal with Deep Convolutional Networks", Chinese Conference on Pattern Recognition and Computer Vision (PRCV) , 2018.

[2] Xiang Li, Chan Lu, Danni Cheng, Wei-Hong Li, Mei Cao, Bo Liu, Jiechao Ma and Wei-Shi Zheng. "Towards Photo-Realistic Visible Watermark Removal with Conditional Generative Adversarial Networks", International Conference on Image and Graphics (ICIG), 2019.

备注(论文中数据集制作说明)

1

数据集获取途径如下

搜索关注本博客同名公号,公号后台,回复 大规模水印获取本博文中的大规模水印数据集下载链接:
大规模水印

📙 博主 AI 领域八大干货专栏、诚不我欺

📙 预祝各位 2022 前途似锦、可摘星辰

🎉 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
❤️ 过去的一年、大家都经历了太多太多、祝你披荆斩棘、未来可期

9-9

目录
相关文章
【图像分类数据集】非常全面实用的垃圾分类图片数据集共享
【图像分类数据集】非常全面实用的垃圾分类图片数据集共享
980 25
【图像分类数据集】非常全面实用的垃圾分类图片数据集共享
|
9天前
|
人工智能 并行计算 PyTorch
SPRIGHT:提升文本到图像模型空间一致性的数据集
SPRIGHT 是一个专注于空间关系的大型视觉-语言数据集,通过重新描述600万张图像,显著提升文本到图像模型的空间一致性。
40 18
SPRIGHT:提升文本到图像模型空间一致性的数据集
|
13天前
|
人工智能 自然语言处理 并行计算
VITRON:开源像素级视觉大模型,同时满足图像与视频理解、生成、分割和编辑等视觉任务
VITRON 是由 Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大模型,支持图像与视频的理解、生成、分割和编辑,适用于多种视觉任务。
79 13
VITRON:开源像素级视觉大模型,同时满足图像与视频理解、生成、分割和编辑等视觉任务
|
1月前
|
编解码 人工智能
FreeScale:无需微调即可提升模型的图像生成能力,生成 8K 分辨率的高质量图像
FreeScale是一个无需微调的推理框架,旨在提升扩散模型生成高分辨率图像和视频的能力。该框架通过处理和融合不同尺度的信息,首次实现了8K分辨率图像的生成,显著提高了生成内容的质量和保真度,同时减少了推理时间。
78 20
FreeScale:无需微调即可提升模型的图像生成能力,生成 8K 分辨率的高质量图像
|
2月前
|
机器学习/深度学习 计算机视觉 Python
图像数据的特征提取与预处理方法,涵盖图像数据的特点、主要的特征提取技术
本文深入探讨了图像数据的特征提取与预处理方法,涵盖图像数据的特点、主要的特征提取技术(如颜色、纹理、形状特征)及预处理步骤(如图像增强、去噪、分割)。同时介绍了Python中常用的OpenCV和Scikit-image库,并提供了代码示例,强调了预处理的重要性及其在提升模型性能中的作用。
361 5
|
3月前
|
人工智能 计算机视觉
首次!用合成人脸数据集训练的识别模型,性能高于真实数据集
【10月更文挑战第9天】Vec2Face是一种创新的人脸图像合成方法,旨在解决现有方法在生成具有高区分度身份和广泛属性变化的人脸图像时的局限性。该方法通过使用样本向量作为输入,结合特征掩码自编码器和解码器,能够高效生成大规模人脸数据集,显著提升人脸识别模型的训练效果。Vec2Face在多个真实世界测试集上表现出色,首次在某些测试集上超越了使用真实数据集训练的模型。然而,该方法仍存在一些局限性,如生成的变化可能无法完全覆盖真实世界的多样性,且需要较高的计算资源。
40 2
|
3月前
|
数据采集
遥感语义分割数据集中的切图策略
该脚本用于遥感图像的切图处理,支持大尺寸图像按指定大小和步长切割为多个小图,适用于语义分割任务的数据预处理。通过设置剪裁尺寸(cs)和步长(ss),可灵活调整输出图像的数量和大小。此外,脚本还支持标签图像的转换,便于后续模型训练使用。
28 0
|
8月前
|
测试技术
Vript:最为详细的视频文本数据集,每个视频片段平均超过140词标注 | 多模态大模型,文生视频
[Vript](https://github.com/mutonix/Vript) 是一个大规模的细粒度视频文本数据集,包含12K个高分辨率视频和400k+片段,以视频脚本形式进行密集注释,每个场景平均有145个单词的标题。除了视觉信息,还转录了画外音,提供额外背景。新发布的Vript-Bench基准包括三个挑战性任务:Vript-CAP(详细视频描述)、Vript-RR(视频推理)和Vript-ERO(事件时序推理),旨在推动视频理解的发展。
154 1
Vript:最为详细的视频文本数据集,每个视频片段平均超过140词标注 | 多模态大模型,文生视频
|
8月前
|
机器学习/深度学习 编解码 并行计算
深度学习的图像超分技术综述-输入单张图像(SISR)和输入多张图像的基于参考的图像(RefSR)
深度学习的图像超分技术综述-输入单张图像(SISR)和输入多张图像的基于参考的图像(RefSR)
407 0
|
8月前
|
JSON 算法 Shell
【数据集】以人脸关键点为例讲解:如何通过开源项目快速制作关键点数据集
【数据集】以人脸关键点为例讲解:如何通过开源项目快速制作关键点数据集
156 0