用程序自动替换PDF文件中的图像

简介:
要使用Java代码,应该调用iText库。
要使用C#代码,应该调用iTextSharp库。


Here's the code to replace images in PDFs, in Java and C#. It will replace the first image in the first page.

Java代码

PdfReader pdf =  new PdfReader( "in.pdf");
PdfStamper stp =  new PdfStamper(pdf,  new FileOutputStream( "c:\\out.pdf"));
PdfWriter writer = stp.getWriter();
Image img = Image.getInstance( "image.png");
PdfDictionary pg = pdf.getPageN(1);
PdfDictionary res =
    (PdfDictionary)PdfReader.getPdfObject(pg.get(PdfName.RESOURCES));
PdfDictionary xobj =
    (PdfDictionary)PdfReader.getPdfObject(res.get(PdfName.XOBJECT));
if (xobj !=  null) {
     for (Iterator it = xobj.getKeys().iterator(); it.hasNext(); ) {
        PdfObject obj = xobj.get((PdfName)it.next());
         if (obj.isIndirect()) {
            PdfDictionary tg = (PdfDictionary)PdfReader.getPdfObject(obj);
            PdfName type =
                (PdfName)PdfReader.getPdfObject(tg.get(PdfName.SUBTYPE));
             if (PdfName.IMAGE.equals(type)) {
                PdfReader.killIndirect(obj);
                Image maskImage = img.getImageMask();
                 if (maskImage !=  null)
                    writer.addDirectImageSimple(maskImage);
                writer.addDirectImageSimple(img, (PRIndirectReference)obj);
                 break;
            }
        }
    }
}
stp.close();




C#代码:
PdfReader pdf =  new PdfReader( "in.pdf");
PdfStamper stp =  new PdfStamper(pdf,  new FileStream( "out.pdf",
FileMode.Create));
PdfWriter writer = stp.Writer;
Image img = Image.GetInstance( "image.png");
PdfDictionary pg = pdf.GetPageN(1);
PdfDictionary res =
    (PdfDictionary)PdfReader.GetPdfObject(pg.Get(PdfName.RESOURCES));
PdfDictionary xobj =
    (PdfDictionary)PdfReader.GetPdfObject(res.Get(PdfName.XOBJECT));
if (xobj !=  null) {
     foreach (PdfName name  in xobj.Keys) {
        PdfObject obj = xobj.Get(name);
         if (obj.IsIndirect()) {
            PdfDictionary tg = (PdfDictionary)PdfReader.GetPdfObject(obj);
            PdfName type =
                (PdfName)PdfReader.GetPdfObject(tg.Get(PdfName.SUBTYPE));
             if (PdfName.IMAGE.Equals(type)) {
            PdfReader.KillIndirect(obj);
            Image maskImage = img.ImageMask;
             if (maskImage !=  null)
                writer.AddDirectImageSimple(maskImage);
                writer.AddDirectImageSimple(img, PRIndirectReference)obj);
                 break;
            }
        }
    }
}
stp.Close();









本文转自 h2appy  51CTO博客,原文链接:http://blog.51cto.com/h2appy/149127,如需转载请自行联系原作者
目录
相关文章
|
8天前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
74 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
11天前
|
JavaScript
jquery图片和pdf文件预览插件
EZView.js是一款jquery图片和pdf文件预览插件。EZView.js可以为图片和pdf格式文件生成在线预览效果。支持的文件格式有pdf、jpg、 png、jpeg、gif。
41 16
|
4月前
|
XML 缓存 JSON
为什么浏览器中有些图片、PDF等文件点击后有些是预览,有些是下载
为什么浏览器中有些图片、PDF等文件点击后有些是预览,有些是下载
297 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据
Documind 是一款利用 AI 技术从 PDF 中提取结构化数据的先进文档处理工具,支持灵活的本地或云端部署。
99 8
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据
|
2月前
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
2月前
|
Java Apache Maven
Java将word文档转换成pdf文件的方法?
【10月更文挑战第13天】Java将word文档转换成pdf文件的方法?
536 1
|
2月前
|
索引 Python
PDF文件页面提取操作小指南
PDF文件页面提取操作小指南
101 4
|
2月前
|
Python
Python对PDF文件页面的旋转和切割
Python对PDF文件页面的旋转和切割
51 3
|
2月前
|
计算机视觉 Python
Python操作PDF文件
Python操作PDF文件
41 1
|
2月前
|
JSON 数据格式
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
141 2

相关实验场景

更多