NetCore实战:基于html生成pdf文件案例讲解

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: WkHtmlToPdfDotNet是基于本地 wkhtmltopdf封装的.NET Core类库,主要通过webkit引擎实现html页面转换为pdf文件。并且支持在Windows、Docker、Linux、MacOSX运行。

一、WkHtmlToPdfDotNet介绍

WkHtmlToPdfDotNet是基于本地 wkhtmltopdf封装的.NET Core类库,主要通过webkit引擎实现html页面转换为pdf文件。并且支持在Windows、Docker、Linux、MacOSX运行。

主要功能实现在线URL转pdf文件或者html代码直接转换为pdf文件,并对css样式、图片等很好的支持,导出的pdf文件和网站相差不大。

今天给大家通过实际的案例给大家介绍一下如何使用它,感兴趣的朋友可以一起来学习一下!

官网:https://github.com/HakanL/WkHtmlToPdf-DotNet

二、安装

1、使用Visual Studio 2019及以上版本创建一个.NET Core控制台程序。

2、安装WkHtmlToPdfDotNet依赖包

命令方式安装

工具→NuGet包管理器→程序包管理器控制包

安装命令如下:

Install-Package Haukcode.WkHtmlToPdfDotNet

直接通过Nuget包搜索安装

工具→NuGet包管理器→管理解决方案的NuGet程序包

3、实现代码


using System;
using System.IO;
using WkHtmlToPdfDotNet;
namespace HtmlToPdf
{
    class Program
    {
        // https://github.com/HakanL/WkHtmlToPdf-DotNet
        // 安装依赖包 Install-Package Haukcode.WkHtmlToPdfDotNet

        static void Main(string[] args)
        {
            //ConvertHtmlToPdf();
            ConvertUrlToPdf();
        }
        /// <summary>
        /// 基于html导出pdf
        /// </summary>
        private static void ConvertHtmlToPdf()
        {
            
            var converter = new BasicConverter(new PdfTools());
            // 绑定转换过程中处理事件日志
            converter.PhaseChanged += Converter_PhaseChanged;
            converter.ProgressChanged += Converter_ProgressChanged;
            converter.Finished += Converter_Finished;
            converter.Warning += Converter_Warning;
            converter.Error += Converter_Error;
            // pdf 样式设置
            var doc = new HtmlToPdfDocument()
            {
                GlobalSettings = {
                    ColorMode = ColorMode.Color,
                    Orientation = Orientation.Landscape,
                    PaperSize = PaperKind.A4,
                },
                Objects = {
                    new ObjectSettings() {
                        PagesCount = true,
                        HtmlContent = @" <p style='color:red'>hello</p><h2>测试</h2><img src='https://www.baidu.com/img/pc_675fe66eab33abff35a2669768c43d95.png' alt=''>",
                        WebSettings = { DefaultEncoding = "utf-8" },
                        HeaderSettings = { FontSize = 9, Right = "Page [page] of [toPage]", Line = false },
                        FooterSettings = { FontSize = 9, Right = "Page [page] of [toPage]" }
                    }
                }
            };
            // 转换为二进制
            byte[] pdf = converter.Convert(doc);
            // 判断目录是否存在,不存在则创建
            if (!Directory.Exists("Files"))
            {
                Directory.CreateDirectory("Files");
            }
            // 文件保存
            using (var stream = new FileStream(Path.Combine("Files", DateTime.UtcNow.Ticks.ToString() + ".pdf"), FileMode.Create))
            {
                stream.Write(pdf, 0, pdf.Length);
            }
        }

        /// <summary>
        /// 基于url导出pdf
        /// </summary>
        private static void ConvertUrlToPdf()
        {

            var converter = new BasicConverter(new PdfTools());
            // 绑定转换过程中处理事件日志
            converter.PhaseChanged += Converter_PhaseChanged;
            converter.ProgressChanged += Converter_ProgressChanged;
            converter.Finished += Converter_Finished;
            converter.Warning += Converter_Warning;
            converter.Error += Converter_Error;
            // pdf 样式设置
            var doc = new HtmlToPdfDocument()
            {
                GlobalSettings = {
                    PaperSize = PaperKind.A3, // 纸张类型
                    Orientation = Orientation.Landscape,
                },
                // 支持多个网址
                Objects = {
                    new ObjectSettings()
                    {
                        Page = "http://baidu.com/",
                    },
                     new ObjectSettings()
                    {
                        Page = "https://www.163.com/dy/article/HJVSIG920511DTU9.html?clickfrom=w_yw_zgzz",

                    }
                }
            };

            // 转换为二进制
            byte[] pdf = converter.Convert(doc);
            // 判断目录是否存在,不存在则创建
            if (!Directory.Exists("FilesHtml"))
            {
                Directory.CreateDirectory("FilesHtml");
            }
            // 文件保存
            using (var stream = new FileStream(Path.Combine("FilesHtml", DateTime.UtcNow.Ticks.ToString() + ".pdf"), FileMode.Create))
            {
                stream.Write(pdf, 0, pdf.Length);
            }
        }


        /// <summary>
        /// 转换产生错误日志输出
        /// </summary>
        /// <param name="sender"></param>
        /// <param name="e"></param>
        private static void Converter_Error(object sender, WkHtmlToPdfDotNet.EventDefinitions.ErrorArgs e)
        {
            Console.WriteLine("[转换错误] {0}", e.Message);
        }
        /// <summary>
        /// 转换产生警告日志输出
        /// </summary>
        /// <param name="sender"></param>
        /// <param name="e"></param>

        private static void Converter_Warning(object sender, WkHtmlToPdfDotNet.EventDefinitions.WarningArgs e)
        {
            Console.WriteLine("[警告] {0}", e.Message);
        }
        /// <summary>
        /// 转转完成日志输出
        /// </summary>
        /// <param name="sender"></param>
        /// <param name="e"></param>
        private static void Converter_Finished(object sender, WkHtmlToPdfDotNet.EventDefinitions.FinishedArgs e)
        {
            Console.WriteLine("转换 {0} ", e.Success ? "成功" : "失败");
        }
        /// <summary>
        /// 转换进度日志输出
        /// </summary>
        /// <param name="sender"></param>
        /// <param name="e"></param>
        private static void Converter_ProgressChanged(object sender, WkHtmlToPdfDotNet.EventDefinitions.ProgressChangedArgs e)
        {
            Console.WriteLine("转换进度 {0}", e.Description);
        }
        /// <summary>
        /// 转换阶段日志输入
        /// </summary>
        /// <param name="sender"></param>
        /// <param name="e"></param>
        private static void Converter_PhaseChanged(object sender, WkHtmlToPdfDotNet.EventDefinitions.PhaseChangedArgs e)
        {
            Console.WriteLine("阶段进度 {0} - {1}", e.CurrentPhase, e.Description);
        }


    }
}

三、运行效果

基于在线url方式导出效果

直接拼接html方式导出效果

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
17天前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
112 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
20天前
|
JavaScript
jquery图片和pdf文件预览插件
EZView.js是一款jquery图片和pdf文件预览插件。EZView.js可以为图片和pdf格式文件生成在线预览效果。支持的文件格式有pdf、jpg、 png、jpeg、gif。
48 16
|
2月前
|
JavaScript API 开发工具
<大厂实战场景> ~ Flutter&鸿蒙next 解析后端返回的 HTML 数据详解
本文介绍了如何在 Flutter 中解析后端返回的 HTML 数据。首先解释了 HTML 解析的概念,然后详细介绍了使用 `http` 和 `html` 库的步骤,包括添加依赖、获取 HTML 数据、解析 HTML 内容和在 Flutter UI 中显示解析结果。通过具体的代码示例,展示了如何从 URL 获取 HTML 并提取特定信息,如链接列表。希望本文能帮助你在 Flutter 应用中更好地处理 HTML 数据。
132 1
|
3月前
|
Web App开发 前端开发 搜索推荐
创建HTML文件
【10月更文挑战第14天】创建HTML文件
68 4
|
3月前
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
3月前
|
Java Apache Maven
Java将word文档转换成pdf文件的方法?
【10月更文挑战第13天】Java将word文档转换成pdf文件的方法?
712 1
|
3月前
|
Java BI API
spring boot 整合 itextpdf 导出 PDF,写入大文本,写入HTML代码,分析当下导出PDF的几个工具
这篇文章介绍了如何在Spring Boot项目中整合iTextPDF库来导出PDF文件,包括写入大文本和HTML代码,并分析了几种常用的Java PDF导出工具。
706 0
spring boot 整合 itextpdf 导出 PDF,写入大文本,写入HTML代码,分析当下导出PDF的几个工具
|
3月前
|
索引 Python
PDF文件页面提取操作小指南
PDF文件页面提取操作小指南
106 4
|
3月前
|
Python
Python对PDF文件页面的旋转和切割
Python对PDF文件页面的旋转和切割
54 3
|
3月前
|
计算机视觉 Python
Python操作PDF文件
Python操作PDF文件
47 1