看了园子里的一系列关于生成CHM的文件的方式,主要是这些:
C#生成CHM文件(入门篇)
C#生成CHM文件(中级篇)
C#生成CHM文件(应用篇)
http://www.cnblogs.com/alexis/archive/2010/10/16/1853275.html
自己就想写一个从网上下载页面,然后将页面编译成CHM的小程序。现在把源代码提供出来:
主要的难点是网页编码的判断,目前是先对Request的HEAD里面的Content-Type中进行判断,如果这里没有获取到,在根据默认的编码解析网页内容,获取网页内部的Content-Type标签数据。如果这两种都无法获取到,这个网页就有可能会出现乱码,如果哪位有更好的解决方案,还望不吝赐教!
HTML的解析,我用的是开源的Winista.Htmlparser.Net,感觉挺方便,园子里也有相应的教程,我就不多说了。
本文转自齐师傅博客园博客,原文链接http://www.cnblogs.com/youring2/archive/2012/04/24/2467747.html,如需转载请自行联系原作者