将网页保留格式在线打印为PDF文档

简介:          如果使用浏览器自身的打印功能,网页排版格式往往不能保留。但是使用PDFMYURL的在线打印功能则能很好的解决这个问题,不但可以将有价值的互联网网页直接打印为PDF文档,而且保留了格式,甚至其中的链接资源。
         如果使用浏览器自身的打印功能,网页排版格式往往不能保留。但是使用PDFMYURL的在线打印功能则能很好的解决这个问题,不但可以将有价值的互联网网页直接打印为PDF文档,而且保留了格式,甚至其中的链接资源。很简单,很实用,很…
         (一)使用方法是将网页链接输入pdfmyurl对话框,点击生成 即可。
         (二)将这个功能添加到自己的博客或网站,仅需要加入以下代码(以本网页为例):
                  <a href=http://pdfmyurl.com?url=www.readwiki.com/geophysics>打印本页为PDF文档</a>
效果如:打印本页为PDF文档
         (三)其他高级设置如:自定义打印名称,加头部说明,打印纸张大小,代理设置,页面留空宽度,都可以通过参数予以控制。
                  <a href="http://pdfmyurl.com?url=www.readwiki.com/geophysics&amp;-O=Landscape&amp;--header-left=hi&amp;--filename=name.pdf">打印本页</a>


Advanced Options
       How to use / insert pdfmyurl in your own site
              Simply link the text or image you want people to use for downloading a specific page/url like this:
                     http://pdfmyurl.com?url=www.opentracker.net 
       for example:
              <a href="http://pdfmyurl.com?url=www.opentracker.net">downlaod this page as pdf</a> 
       will create a text link that looks like this: 
              download this page as pdf
       How to use on your server
       Synopsis (the first -O <filename> is wget's own output file option):
              wget -O opentracker.pdf "pdfmyurl.com?url=www.opentracker.net&-O=Landscape&--header-left=hello"
       General Options:
              You can mix-and-match the underneath options to customize the pdf to your needs.
       For example, if you want a landscaped pdf you add-O=Landscape or --orientation=Landscape and if you want to add a header with text aligned to the left you would use--header-left=hi. You can also alter the default filename by providing the --filename=ot.pdf option.
       These three options combined in one text link would look like this:
              <a href="http://pdfmyurl.com?url=opentracker.net&-O=Landscape&--header-left=hi&--filename=ot.pdf">pdf</a> 
       Notice that in the above example the ampersand "&" sign separates each option, and the separating character for a parameter is an equals "=" sign. You will need to url escape any reserved url characters for option values.
     --original-url                        Set the --header-right parameter to be the url of the created pdf page.
     --filename <filename>           Set the filename to download, default is a filename made from the url.
 -O, --orientation <orientation>     Set orientation to Landscape or Portrait
 -s, --page-size <size>              Set paper size to: A4, Letter, etc.
 -p, --proxy <proxy>                 Use a proxy
     --username <username>           HTTP Authentication username
     --password <password>           HTTP Authentication password
     --custom-header <name> <value>  Set an additional HTTP header (single)
 -b, --book                          Set the options one would usually set when 
                                     printing a book
     --cover <url>                   Use html document as cover. It will be 
                                           inserted before the toc with no headers
                                     and footers
 -H, --default-header                Add a default header, with the name of the
                                     page to the left, and the page number to
                                     the right, this is short for:
                                     --header-left='[webpage]'
                                     --header-right='[page]/[toPage]' --top 2cm
                                     --header-line
 -t, --toc                           Insert a table of content in the beginning
                                     of the document
 -d, --dpi <dpi>                     Change the dpi explicitly (this has no
                                     effect on X11 based systems)
     --page-height <unitreal>        Page height (default unit millimeter)
     --page-width <unitreal>         Page width  (default unit millimeter)
 -n, --disable-javascript            Do not allow web pages to run javascript
 -g, --grayscale                     PDF will be generated in grayscale
 -l, --lowquality                    Generates lower quality pdf/ps. Useful to
                                     shrink the result document space
 -B, --margin-bottom <unitreal>      Set the page bottom margin (default 10mm)
 -L, --margin-left <unitreal>        Set the page left margin (default 10mm)
 -R, --margin-right <unitreal>       Set the page right margin (default 10mm)
 -T, --margin-top <unitreal>         Set the page top margin (default 10mm)
     --redirect-delay <msec>         Wait some milliseconds for js-redirects
                                     (default 200)
     --enable-plugins                Enable installed plugins (such as flash)
     --zoom <float>                  Use this zoom factor (default 1)


     --disable-internal-links        Do no make local links
     --disable-external-links        Do no make links to remote web pages
     --print-media-type              Use print media-type instead of screen
     --page-offset <offset>          Set the starting page number (default 1)
     --disable-smart-shrinking       Disable the intelligent shrinking strategy
                                     used by WebKit that makes the pixel/dpi
                                     ratio none constant
     --encoding <encoding>           Set the default text encoding, for input
     --no-background                 Do not print background
     --user-style-sheet <url>        Specify a user style sheet, to load with
                                     every page


Headers And Footer Options:
     --footer-center <text>          Centered footer text
     --footer-font-name <name>       Set footer font name (default Arial)
     --footer-font-size <size>       Set footer font size (default 11)
     --footer-left <text>            Left aligned footer text
     --footer-line                   Display line above the footer
     --footer-right <text>           Right aligned footer text
     --footer-spacing <real>         Spacing between footer and content in mm (default 0)
     --footer-html <url>             Adds a html header
     --header-center <text>          Centered header text
     --header-font-name <name>       Set header font name (default Arial)
     --header-font-size <size>       Set header font size (default 11)
     --header-left <text>            Left aligned header text
     --header-line                   Display line below the header
     --header-right <text>           Right aligned header text
     --header-spacing <real>         Spacing between header and content in mm (default 0)
     --header-html <url>             Adds a html header


Table Of Content Options:
     --toc-font-name <name>          Set the font used for the toc (default Arial)
     --toc-no-dots                   Do not use dots, in the toc
     --toc-depth <level>             Set the depth of the toc (default 3)
     --toc-header-text <text>        The header text of the toc (default Table Of Contents)
     --toc-header-fs <size>          The font size of the toc header (default 15)
     --toc-disable-links             Do not link from toc to sections
     --toc-disable-back-links        Do not link from section header to toc
     --toc-l1-font-size <size>       Set the font size on level 1 of the toc (default 12)
     --toc-l1-indentation <num>      Set indentation on level 1 of the toc (default 0)
     --toc-l2-font-size <size>       Set the font size on level 2 of the toc (default 10)
     --toc-l2-indentation <num>      Set indentation on level 2 of the toc (default 20)
     --toc-l3-font-size <size>       Set the font size on level 3 of the toc (default 8)
     --toc-l3-indentation <num>      Set indentation on level 3 of the toc (default 40)
     --toc-l4-font-size <size>       Set the font size on level 4 of the toc (default 6)
     --toc-l4-indentation <num>      Set indentation on level 4 of the toc (default 60)
     --toc-l5-font-size <size>       Set the font size on level 5 of the toc (default 4)
     --toc-l5-indentation <num>      Set indentation on level 5 of the toc (default 80)
     --toc-l6-font-size <size>       Set the font size on level 6 of the toc (default 2)
     --toc-l6-indentation <num>      Set indentation on level 6 of the toc (default 100)
     --toc-l7-font-size <size>       Set the font size on level 7 of the toc (default 0)
     --toc-l7-indentation <num>      Set indentation on level 7 of the toc (default 120)


Outline Options:
     --outline                       Put an outline into the pdf
     --outline-depth <level>         Set the depth of the outline (default 4)


Page sizes:
 The default page size of the rendered document is A4, but using this
 --page-size option this can be changed to almost anything else, such as: A3,
 Letter and Legal.  For a full list of supported pages sizes please see 
 http://doc.trolltech.com/4.6/qprinter.html#PageSize-enum.


 For a more fine grained control over the page size the --page-height and
 --page-width options may be used


目录
相关文章
|
4天前
|
人工智能 文字识别 自然语言处理
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
Vision Parse 是一款开源的 PDF 转 Markdown 工具,基于视觉语言模型,能够智能识别和提取 PDF 中的文本和表格,并保持原有格式和结构。
44 19
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
|
12天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
17天前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
114 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
18天前
|
存储 运维 安全
《VERICUT 9.X电脑配置要求与安装说明(官方)》—— PDF文档
本文档详细介绍了 CGTech Vericut 9.X 的安装指南,涵盖安装前准备、安装流程、系统要求、故障排除、许可证配置及多种接口配置等内容,为用户提供全面的软件安装与配置指导。
45 2
|
2月前
|
API C#
在.NET中使用QuestPDF高效地生成PDF文档
在.NET中使用QuestPDF高效地生成PDF文档
|
3月前
|
JSON 数据格式
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
163 2
|
5月前
|
Linux Python Windows
Python PDF文件转Word格式,只需要3秒(附打包)
Python PDF文件转Word格式,只需要3秒(附打包)
110 3
Python PDF文件转Word格式,只需要3秒(附打包)
|
5月前
|
移动开发 资源调度 JavaScript
Vue移动端网页(H5)预览pdf文件(pdfh5和vue-pdf)
这篇文章介绍了在Vue移动端网页中使用`pdfh5`和`vue-pdf`两个插件来实现PDF文件的预览,包括滚动查看、缩放、添加水印、分页加载、跳转指定页数等功能。
4179 0
Vue移动端网页(H5)预览pdf文件(pdfh5和vue-pdf)
|
5月前
|
C# 开发者 Windows
WPF与PDF文档:解锁创建和编辑PDF文件的新技能——从环境配置到代码实践,手把手教你如何在WPF应用中高效处理PDF,提升文档管理效率
【8月更文挑战第31天】随着数字文档的普及,PDF因跨平台兼容性和高保真度成为重要格式。WPF虽不直接支持PDF处理,但借助第三方库(如iTextSharp)可在WPF应用中实现PDF的创建与编辑。本文通过具体案例和示例代码,详细介绍了如何在WPF中集成PDF库,并展示了从设计用户界面到实现PDF创建与编辑的完整流程。不仅包括创建新文档的基本步骤,还涉及在现有PDF中添加页眉页脚等高级功能。通过这些示例,WPF开发者可以更好地掌握PDF处理技术,提升应用程序的功能性和实用性。
199 0
|
21天前
|
JavaScript
jquery图片和pdf文件预览插件
EZView.js是一款jquery图片和pdf文件预览插件。EZView.js可以为图片和pdf格式文件生成在线预览效果。支持的文件格式有pdf、jpg、 png、jpeg、gif。
48 16