C# 将PDF文件转换为word格式

简介: Pdf(Portable Document Format)意为“便携式文档格式”,是现在最流行的文件格式之一,它有很多优点如:尺寸较小、阅读方便、操作系统平台通用等,非常适合在网络上传播和使用。

    Pdf(Portable Document Format)意为“便携式文档格式”,是现在最流行的文件格式之一,它有很多优点如:尺寸较小、阅读方便、操作系统平台通用等,非常适合在网络上传播和使用。如今在我们的日常生活中已随处可见PDF文件的身影,例如产品说明、电子图书、网络资料、电子邮件等,PDF文件已被越来越多的人使用。但在使用过程中,我们会发现一个问题,那就是我们很难对PDF文件进行文本和格式编辑。而一直以来,MS Word 都是最流行的文字处理程序。因此有些时候为了方便编辑,我们通常会将PDF文件转换为word格式。

     Spire.PDF软件给开发者提供了一种以C#编程的方式,在.NET平台上将PDF文件转换为word的功能。下面我们就一起来探讨如何使用Spire.PDF来实现这一功能。

     有需要的朋友,可以从E-iceblue官网上下载使用。安装完成后,将bin文件夹下的相关.dll文件添加引用至Visual Studio。

                       

下面是代码片段:

步骤1:创建一个新的PDF文件并加载要转换的PDF文档。

PdfDocument doc = new PdfDocument();

doc.LoadFromFile("图文版丽江旅游攻略大全.pdf");

步骤2:调用SaveToFile方法将PDF文档转换为word格式;

doc.SaveToFile("图文版丽江旅游攻略大全.doc", FileFormat.DOC);

步骤3:保存文档并重新打开;

System.Diagnostics.Process.Start("图文版丽江旅游攻略大全.doc");

 原PDF文件截图:

转换成word文档后的效果截图:

 

全部代码:

using Spire.Pdf;

using System;

using System.Collections.Generic;

using System.Linq;

using System.Text;

 

namespace convert_pdf_to_word

{

    class Program

    {

        static void Main(string[] args)

        {

            PdfDocument doc = new PdfDocument();

            doc.LoadFromFile("图文版丽江旅游攻略大全.pdf");

            doc.SaveToFile("图文版丽江旅游攻略大全.doc", FileFormat.DOC);

            System.Diagnostics.Process.Start("图文版丽江旅游攻略大全.doc");

        }

    }

}

 

目录
相关文章
|
3天前
|
人工智能 文字识别 自然语言处理
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
Vision Parse 是一款开源的 PDF 转 Markdown 工具,基于视觉语言模型,能够智能识别和提取 PDF 中的文本和表格,并保持原有格式和结构。
40 19
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
|
11天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
16天前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
110 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
6天前
|
C#
基于 C# 编写的 Visual Studio 文件编码显示与修改扩展插件
基于 C# 编写的 Visual Studio 文件编码显示与修改扩展插件
|
2月前
|
XML C# 开发工具
C# 删除Word文档中的段落
【11月更文挑战第3天】本文介绍了两种方法来操作 Word 文档:一是使用 `Microsoft.Office.Interop.Word` 库,适用于 Windows 环境下操作 Word 文档,需引用相应库并在代码中引入命名空间;二是使用 Open XML SDK,适用于处理 .docx 格式的文档,通过引用 `DocumentFormat.OpenXml` 库实现。文中提供了示例代码,展示了如何打开、删除段落并保存文档。
|
3月前
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
3月前
|
Java Apache Maven
Java将word文档转换成pdf文件的方法?
【10月更文挑战第13天】Java将word文档转换成pdf文件的方法?
712 1
|
3月前
|
存储 C#
【C#】大批量判断文件是否存在的两种方法效率对比
【C#】大批量判断文件是否存在的两种方法效率对比
53 1
|
3月前
|
JSON 数据格式
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
161 2
|
3月前
|
XML 存储 缓存
C#使用XML文件的详解及示例
C#使用XML文件的详解及示例
128 0