SharePoint 2013 Word 转换PDF服务介绍及示例

简介:   前言:在SharePoint使用过程中,经常会发现将文档进行格式转换的需求,之前,看到SharePoint 2013有将PPT转换PDF文档的服务,后来,才发现SharePoint 2010开始,就有将Word文档转换PDF的服务了,用起来还是不错的。

  前言:在SharePoint使用过程中,经常会发现将文档进行格式转换的需求,之前,看到SharePoint 2013有将PPT转换PDF文档的服务,后来,才发现SharePoint 2010开始,就有将Word文档转换PDF的服务了,用起来还是不错的。

  下面,我们就来看看这个服务,如何将一个Word文档库批量转换成PDF文件,或者,将单一Word文档转换为PDF文档。

一、             效果展示

新建测试Word文档,如下图:
image

新建文档库inputList作为word存放库,上传测试文档,如下图:

image 

         新建文档库outputList,作为输出PDF库,里面没有文件,如下图:

image 

执行文件转换程序,执行后outputList文档库,如下图:

image

发现outputList还是没有文件,因为该服务是TimerJob的计时器任务,所以需要定时执行,去管理中心,找到该计划任务,立即运行,如下图:image

         再一次刷新outputList文档库,如下图:

image 

下载一个PDF文件到本地,PDF阅读器打开,如下图:

image

二、             操作步骤

1、  新建项目,添加引用Microsoft.Office.Word.Server.dll,如下图:

image 

位置如下:

C:\Windows\Microsoft.NET\assembly\GAC_MSIL\Microsoft.Office.Word.Server\v4.0_15.0.0.0__71e9bce111e9429c\Microsoft.Office.Word.Server.dll

2、  引用类库

using Microsoft.Office.Word.Server;

using Microsoft.Office.Word.Server.Conversions;

主要用于转换操作的是Microsoft.Office.Word.Server.Conversions,详细请参考附后的msdn文档。

3、  编写添加核心代码之文档库批量转换

 1 //创建一个转换job
 2 ConversionJob myJob = newConversionJob("Word Automation Services");
 3 
 4 //设置转换job的UserToken、转换格式
 5 myJob.UserToken = site.UserToken;
 6 myJob.Settings.OutputFormat = SaveFormat.PDF;
 7 myJob.Settings.OutputSaveBehavior = SaveBehavior.AppendIfPossible;
 8 
 9 //获取转出、转入文档库
10 SPList inputLibrary = web.Lists["inputlist"];
11 SPList outputLibrary = web.Lists["outputlist"];
12 
13 //设置并执行转换job
14 myJob.AddLibrary(inputLibrary, outputLibrary);
15 myJob.Start();

4、  编写核心代码之单一文件转换

 1 //创建一个异步转换
 2 SyncConverter sc = newSyncConverter("Word Automation Services");
 3 
 4 //设置转换UserToken、转换类型等
 5 sc.UserToken = site.UserToken;
 6 sc.Settings.UpdateFields = true;
 7 sc.Settings.OutputFormat = SaveFormat.PDF;
 8 
 9 //读取需要转换的文件
10 SPFolder docs = web.Folders[siteURL +
11     "/Word_Transfer"];
12 SPFile file = docs.Files[siteURL +
13     "/Word_Transfer/SharePoint2013Word转换PDF服务测试文档.docx"];
14 
15 //生成保存转换后文档的文件流
16 Stream fStream = file.OpenBinaryStream();
17 SPFileStream stream = newSPFileStream(web, 0x1000);
18 
19 //启动异步转换
20 ConversionItemInfo info = sc.Convert(fStream, stream);
21 
22 //转换后文档添加到文档库
23 SPFile newFile = docs.Files.Add(
24     "SharePoint2013Word转换PDF服务测试文档.pdf",
25     stream,
26     true);

5、  单一文件转换效果图,如下图:

image 

三、             Word Automation Services介绍

1、  简单介绍

  Word Automation Services 是一项新的 SharePoint Server 2010 技术,它允许以无人参与的方式从服务器端转换 Microsoft Word 支持的文档。简言之,Word Automation Services 采用 Word 客户端应用程序的“另存为…”功能并为服务器复制该功能。

  通过 Word Automation Services,以前需要您运行 Word 客户端应用程序的任务现在可以无人参与模式自动运行,并且比以前的解决方案更可靠、伸缩性更强。

  以上是msdn上,关于Word Automation Services的说明,msdn很清楚的说到,这个服务的本质是采用Word客户端另存为的功能,所以,打开和另存的格式,和word2013客户端基本一致。

 

2、  Word Automation Services体系结构

image 

  如上图,可以看到Word Automation Services服务的原理,通过对象模型将操作进入队列管理器,排队等候计时器作业(TimerJob)定时执行,然后调用Word文件转换服务引擎,将转换后的文件存入SharePoint内容数据库。

  特别的是,这个服务并不需要在服务器端,安装Office Word各种版本,即可完成操作,并且支持SharePoint2010和SharePoint2013版本。

3、  Word Automation Services三个基本概念

  Word Automation Services 包含三个基本概念,即转换、转换作业和文档队列。转换是一个过程,在此过程中,Word Automation Services 会接收一个具有给定格式的文件,然后以不同的格式将该文件输出。例如,服务可以将 Word 2010 文档 (.docx) 转换为 PDF 文档。

所有转换都通过以下步骤进行:

Ø  创建一个转换作业。

Ø  提供该作业的设置(例如,所需的输出文件格式)。

Ø  向该作业添加一个或多个文件。

Ø  将该作业提交到文档队列。

  所有转换操作都基于转换作业 的创建或使用。转换作业将描述要转换的文件和要对这些文件执行的操作。每个文件都将构成一个转换项,并且每个转换项都将映射到一个转换作业。一个转换作业可包含多个转换项。

文档队列 是一个“先进先出”队列,Word Automation Services 使用它根据为转换作业设置的计划来启动转换。

4、  支持打开的文档格式

Ø  打开 XML 文件格式文档(.docx, .docm, .dotx, .dotm)。

Ø  Word 97-2003 文档(.doc, .dot)。

Ø  RTF 格式文件 (.rtf)

Ø  单个文件网页(.mht, .mhtml)。

Ø  Word 2003 XML 文档 (.xml)

Ø  Word XML 文档 (.xml)

5、  保存 Word 可以保存的文档类型,除去支持以上支持打开的类型,还包括一下两种:

Ø  可移植文档格式 (PDF) 文件。

Ø  XML 纸张规范 (XPS) 文件。

四、             完整代码

1、文档库批量转换代码

using (SPSite site = new SPSite(siteURL))
{
using (SPWeb web = site.OpenWeb())
{
    ConversionJob myJob = new ConversionJob("Word Automation Services");

    myJob.UserToken = site.UserToken;
    myJob.Settings.OutputFormat = SaveFormat.PDF;
    myJob.Settings.OutputSaveBehavior = SaveBehavior.AppendIfPossible;

    SPList inputLibrary = web.Lists["inputlist"];
    SPList outputLibrary = web.Lists["outputlist"];

    myJob.AddLibrary(inputLibrary, outputLibrary);
    myJob.Start();
}
}
View Code

2、文档单独转换代码

using (SPSite site = new SPSite(siteURL))
{
using (SPWeb web = site.OpenWeb())
{
    SyncConverter sc = new SyncConverter("Word Automation Services");

    sc.UserToken = site.UserToken;
    sc.Settings.UpdateFields = true;
    sc.Settings.OutputFormat = SaveFormat.PDF;

    SPFolder docs = web.Folders[siteURL +
        "/Word_Transfer"];
    SPFile file = docs.Files[siteURL +
        "/Word_Transfer/SharePoint2013Word转换PDF服务测试文档.docx"];

    Stream fStream = file.OpenBinaryStream();
    SPFileStream stream = new SPFileStream(web, 0x1000);
    ConversionItemInfo info = sc.Convert(fStream, stream);

    SPFile newFile = docs.Files.Add(
        "SharePoint2013Word转换PDF服务测试文档.pdf",
        stream,
        true);
}
}
View Code

参考文献

Word Automation Services

http://msdn.microsoft.com/zh-cn/library/ee558278(v=office.14).aspx

目录
相关文章
|
1月前
|
小程序
公众号如何添加附传Word、Excel、Pdf、PPT文档
公众号里添加一些文档给公众号粉丝下载,比如课件PPT、申请表Word文档、岗位需求Excel表、大赛入围/获奖名单等。公众号本身是不支持直接上传文件的,但我们可以通过附件小程序“间接”上传文件。
366 0
|
2月前
|
监控 Linux 数据安全/隐私保护
Python实现Word转PDF全攻略:从入门到实战
在数字化办公中,Python实现Word转PDF自动化,可大幅提升处理效率,解决格式兼容问题。本文详解五种主流方案,包括跨平台的docx2pdf、Windows原生的pywin32、服务器部署首选的LibreOffice命令行、企业级的Aspose.Words,以及轻量级的python-docx+pdfkit组合。每种方案均提供核心代码与适用场景,并涵盖中文字体处理、表格优化、批量进度监控等实用技巧,助力高效办公自动化。
588 0
|
3月前
|
存储 人工智能 文字识别
三款安卓手机word编辑器下载,Microsoft Word,wps office,Word手机版,手机word编辑查看阅读器,PDF转换器apk下载
WPS Office是一款功能强大的办公软件,支持文档编辑、表格处理和演示文稿制作,兼容多种格式并提供丰富的云服务。它具备低内存占用、快速运行的特点,支持跨设备同步与多人协作,内置海量模板及AI辅助功能,如智能写作和PPT自动生成。此外,还可扫描文件、编辑PDF并转换为其他格式,极大提升办公效率,适合手机用户便捷操作。
300 1
|
5月前
|
人工智能 算法 安全
使用CodeBuddy实现批量转换PPT、Excel、Word为PDF文件工具
通过 CodeBuddy 实现本地批量转换工具,让复杂的文档处理需求转化为 “需求描述→代码生成→一键运行” 的极简流程,真正实现 “技术为效率服务” 的目标。感兴趣的快来体验下把
203 10
DeepSeek + Xmind,1分钟自动把pdf/word文档转成思维导图
DeepSeek与Xmind结合,1分钟将PDF、Word文档转换为思维导图。只需四步:上传文档至DeepSeek,请求转换为Markdown格式,保存文件并修改后缀为.md,最后导入Xmind生成思维导图。轻松驾驭复杂文档,适用于学习笔记、工作报告、项目规划等场景,大幅提升效率!
|
10月前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
2046 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
6月前
|
存储 JSON API
如何将 Swagger 文档导出为 PDF 文件
你会发现自己可能需要将 Swagger 文档导出为 PDF 或文件,以便于共享和存档。在这篇博文中,我们将指导你完成将 Swagger 文档导出为 PDF 格式的过程。
|
3月前
|
C#
【PDF提取内容改名】批量提取PDF指定区域内容重命名PDF文件,PDF自动提取内容命名的方案和详细步骤
本工具可批量提取PDF中的合同编号、日期、发票号等关键信息,支持PDF自定义区域提取并自动重命名文件,适用于合同管理、发票处理、文档归档和数据录入场景。基于iTextSharp库实现,提供完整代码示例与百度、腾讯网盘下载链接,助力高效处理PDF文档。
544 40
|
3月前
|
编译器 Python
如何利用Python批量重命名PDF文件
本文介绍了如何使用Python提取PDF内容并用于文件重命名。通过安装Python环境、PyCharm编译器及Jupyter Notebook,结合tabula库实现PDF数据读取与处理,并提供代码示例与参考文献。

热门文章

最新文章