分享 MSDN 下载工具(Word/PDF)

简介:

给大伙分享一个最近出炉的 MSDN 到 Word/PDF 转换器。我已经用它转换了 WPF、VSPackage、WWF 等 MSDN 章节为 PDF。

  • 介绍
  • 下载
  • 使用要求
  • 使用方法
  • 结语

 

介绍


现在的 MSDN 已经做得非常好了,章节非常清晰,从入门到精通各个层次都有。我常常会把 MSDN 当作一个系统的学习书籍来看。有时候,特别想把 MSDN 下载下来,转换为 PDF,放到平板电脑上看。

最近急于研究 VS-Package 的使用,所以花了一整个晚上写了这个转换器。

软件功能描述:

用于从 MSDN 网站上下载指定章节下的所有文章,读取内容中的文本及图片等。读取完成后,转换为 Word 文件,并生成相应的目录。(有了 word 文件,Word 2010 就可以把它导出为 pdf 等其它格式了。)

软件截图

MSDNConverter1[1]

 

 

下载


下载地址:

online_icon[1]1.5 版下载地址 (支持中文版本的 MSDN 下载)。
online_icon[1]1.4 版下载地址 (修复带版本号的地址直接报错的问题)。
online_icon[1]1.3 版下载地址 。

 

使用要求


使用本软件,需要安装 .NET4.0 以及 Office 软件。由于我使用的是 office 2010,较低的版本我没有尝试过。

 

使用方法


例如,我期望转换 MSDN 中 online_icon[2]《Windows Workflow Fundation》 中的所有内容到 PDF。

步骤
  1. 打开你要下载的 MSDN 页面,查看该页面的标识。如下图,其中标识为 dd489441。

    MSDNConverter0[1]

  2. 编辑配置文件

    打开 MSDNConverter.exe.config,编辑以下配置: 
    <configuration>  
        <appSettings>  
            <add key="RootId" value="dd489441"/>  
            <add key="ExcludeSubIdList" value="dd483375,dd489447"/>  
        </appSettings>  
    </configuration>

  3. 把页面的标识“RootId”设置为上面的 dd489441。

    有时候,你不想下载某一些子章节,例如大量类型的 API 说明。你可以把这些不想下载的子章节标识,都加入到 “ExcludeSubIdList” 配置中,以逗号分隔即可。

  4. 运行软件即可

    MSDNConverter1[2]

    点击回车,开始全自动运行……

    先下载整本书的目录结构……

    MSDNConverter2[1]

    目录下载完毕后,会开始下载每一篇文章的文本内容:

    MSDNConverter3[1]

    文本下载完毕,会开始下载所有的图片:

    MSDNConverter4[1]

    文本和图片,会下载到程序对应文件夹下缓存着。防止中途中断不再重复下载。

    待文本和图片下载完成后,程序会打开 Word,开始把内容输出到 Word 文档中。在转换过程中,打开 Word 只是方便查看,不要去人为编辑 Word 文档,否则会影响转换。

    MSDNConverter5[1]

  5. 输出完成

    转换完成后,程序为整个文档生成了目录和导航。这时,保存为 Word、或者 PDF 即可。:)

    MSDNConverter6[1]

  6. 输出

    MSDNConverter7

 

结语


目前软件是 1.3 版本,还有一些问题没有解决。例如没识别表格、列表、许多样式等。这两天比较懒,反正能看了,以后有时间再加吧。

Enjoy it. :)

目录
相关文章
|
2月前
|
应用服务中间件
使用 Adobe Livecycle Enterprise service 将 word 文档转换成 PDF 格式
使用 Adobe Livecycle Enterprise service 将 word 文档转换成 PDF 格式
28 0
|
2月前
|
Java Linux 数据安全/隐私保护
Java【代码 16】将word、excel文件转换为pdf格式和将pdf文档转换为image格式工具类分享(Gitee源码)aspose转换中文乱码问题处理
【2月更文挑战第3天】Java 将word、excel文件转换为pdf格式和将pdf文档转换为image格式工具类分享(Gitee源码)aspose转换中文乱码问题处理
101 0
|
2月前
|
Java 程序员 数据安全/隐私保护
分享一个word转pdf的工具类Aspose[java]
分享一个word转pdf的工具类Aspose[java]
45 0
|
2月前
|
数据安全/隐私保护 Python Windows
Python办公自动化【Word转换PDF、PDF读取内容、PDF合并文件、PDF拆分文件、PDF加密文件、PPT基本操作-增加幻灯片、增加内容】(六)-全面详解(学习总结---从入门到深化)
Python办公自动化【Word转换PDF、PDF读取内容、PDF合并文件、PDF拆分文件、PDF加密文件、PPT基本操作-增加幻灯片、增加内容】(六)-全面详解(学习总结---从入门到深化)
47 0
|
3月前
|
存储 Shell 数据安全/隐私保护
Python 自动化指南(繁琐工作自动化)第二版:十五、使用 PDF 和 WORD 文档
Python 自动化指南(繁琐工作自动化)第二版:十五、使用 PDF 和 WORD 文档
52 1
|
3月前
|
数据安全/隐私保护 Python
Python办公自动化【Word转换PDF、PDF读取内容、PDF合并文件、PDF拆分文件、PDF加密文件、PPT基本操作-增加幻灯片、增加内容】(六)-全面详解(学习总结---从入门到深化)(下)
Python办公自动化【Word转换PDF、PDF读取内容、PDF合并文件、PDF拆分文件、PDF加密文件、PPT基本操作-增加幻灯片、增加内容】(六)-全面详解(学习总结---从入门到深化)
34 1
|
3月前
|
数据安全/隐私保护 Python Windows
Python办公自动化【Word转换PDF、PDF读取内容、PDF合并文件、PDF拆分文件、PDF加密文件、PPT基本操作-增加幻灯片、增加内容】(六)-全面详解(学习总结---从入门到深化)(上)
Python办公自动化【Word转换PDF、PDF读取内容、PDF合并文件、PDF拆分文件、PDF加密文件、PPT基本操作-增加幻灯片、增加内容】(六)-全面详解(学习总结---从入门到深化)
54 0
|
1月前
|
数据挖掘 数据安全/隐私保护 开发者
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
74 0
|
1月前
|
存储 缓存 Python
如何使用Python抓取PDF文件并自动下载到本地
如何使用Python抓取PDF文件并自动下载到本地
34 0
|
3月前
|
Java API Apache
使用 Apache PDFBox 操作PDF文件
Apache PDFBox库是一个开源的Java工具,专门用于处理PDF文档。它允许用户创建全新的PDF文件,编辑现有的PDF文档,以及从PDF文件中提取内容。此外,Apache PDFBox还提供了一些命令行实用工具。
103 6

热门文章

最新文章