C# 合并及拆分PDF文件

简介: C# 合并及拆分PDF文件 有时我们可能会遇到下图这样一种情况 — 我们需要的资料或教程被分成了几部分存放在多个PDF文件中,不管是阅读还是保存都不是很方便,这时我们肯定想要把这些PDF文件合并为一个PDF文件。

C# 合并及拆分PDF文件

有时我们可能会遇到下图这样一种情况 — 我们需要的资料或教程被分成了几部分存放在多个PDF文件中,不管是阅读还是保存都不是很方便,这时我们肯定想要把这些PDF文件合并为一个PDF文件。相对应的,有时候我们也需要拆分一个大的PDF文件,来从中获取我们需要的那一部分资料。这篇文章主要分享如何使用C#来将多个PDF文件合并为一个PDF文件以及将一个PDF文件拆分为多个PDF文件。

   

                   

合并PDF文件

合并PDF文件的代码很简单,主要分为三步,首先获取需要合并的PDF文件,然后调用public static PdfDocumentBase MergeFiles(string[] InputFiles)方法,将这些PDF文件合并,然后保存文件。

代码如下:

using System;
using Spire.Pdf;
namespace 合并PDF文件
{
    class Program
    {
        static void Main(string[] args)
        {
            String[] files = new String[] { "文件1.pdf", "文件2.pdf", "文件3.pdf" };
            string outputFile = "输出.pdf";
            PdfDocumentBase doc = PdfDocument.MergeFiles(files);
            doc.Save(outputFile, FileFormat.PDF);
            System.Diagnostics.Process.Start(outputFile);
        }
    }
}

 

合并前:

合并后:

 

 

拆分PDF文件

在拆分PDF文件时,我们可以选择将文件的每一页单独拆分为一个PDF文件,还可以设定页码范围,将其拆分为多个PDF文件。下面将分两个部分来介绍。

一、将PDF文件的每一页拆分为一个单独的PDF文件

在上一个部分中,合并后的PDF文件一共有4页,这里我将它的每一页拆分为一个单独的PDF文件。

代码如下:

using System;
using Spire.Pdf;

namespace 拆分PDF文件1
{
    class Program
    {
        static void Main(string[] args)
        {
            PdfDocument doc = new PdfDocument("输出.pdf");
            String pattern = "拆分-{0}.pdf";
            doc.Split(pattern);
            doc.Close();
        }
    }
}

 

效果图:

 

 

二、根据指定页面范围拆分PDF文件

这里我将一个18页的PDF文件的前10页拆分为一个PDF文件,后8页拆分为另一个PDF文件。

 

代码如下:

using System.Drawing;
using Spire.Pdf;
using Spire.Pdf.Graphics;

namespace 拆分PDF文件2
{
    class Program
    {
        static void Main(string[] args)
        {
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("各种点心的做法.pdf");
 
            PdfDocument pdf1 = new PdfDocument();
            PdfPageBase page;
            for (int i = 0; i < 10; i++)
            {
                page = pdf1.Pages.Add(pdf.Pages[i].Size, new PdfMargins(0));
                pdf.Pages[i].CreateTemplate().Draw(page, new PointF(0, 0));
            }
            pdf1.SaveToFile("DOC_1.pdf"); 

            PdfDocument pdf2 = new PdfDocument();
            for (int i = 10; i < 18; i++)
            {
                page = pdf2.Pages.Add(pdf.Pages[i].Size, new PdfMargins(0));
                pdf.Pages[i].CreateTemplate().Draw(page, new PointF(0, 0));
            }
            pdf2.SaveToFile("DOC_2.pdf");
        }
    }
}

 

拆分前:

拆分后:

Note: 这里我使用了一个PDF组件Spire.PDF.

目录
相关文章
|
9天前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
78 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
13天前
|
JavaScript
jquery图片和pdf文件预览插件
EZView.js是一款jquery图片和pdf文件预览插件。EZView.js可以为图片和pdf格式文件生成在线预览效果。支持的文件格式有pdf、jpg、 png、jpeg、gif。
44 16
|
2月前
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
2月前
|
Java Apache Maven
Java将word文档转换成pdf文件的方法?
【10月更文挑战第13天】Java将word文档转换成pdf文件的方法?
567 1
|
2月前
|
索引 Python
PDF文件页面提取操作小指南
PDF文件页面提取操作小指南
102 4
|
2月前
|
Python
Python对PDF文件页面的旋转和切割
Python对PDF文件页面的旋转和切割
52 3
|
2月前
|
计算机视觉 Python
Python操作PDF文件
Python操作PDF文件
43 1
|
2月前
|
存储 C#
【C#】大批量判断文件是否存在的两种方法效率对比
【C#】大批量判断文件是否存在的两种方法效率对比
52 1
|
2月前
|
JSON 数据格式
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
146 2
|
2月前
|
人工智能 计算机视觉 Python
ChatGPT编程省钱、方便小示例——实现PDF转成PNG文件
ChatGPT编程省钱、方便小示例——实现PDF转成PNG文件
38 1