开发者社区> 问答> 正文

用iTextSharp读取PDF文档中文本内容:报错

用iTextSharp读取PDF文档中文本内容,执行这条Reader reader = new PdfReader(@"C:\WS.pdf");语句时,提示PDF header signature not found,

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using iTextSharp.text;
using iTextSharp.text.pdf;


namespace ConsoleApplication2
{
    class Program
    {
        static void Main(string[] args)
        {
            Console.WriteLine("读取PDF文档");
            try
            {
                // 创建一个PdfReader对象
                PdfReader reader = new PdfReader(@"C:\WS.pdf");

展开
收起
kun坤 2020-06-06 15:17:33 1263 0
1 条回答
写回答
取消 提交回答
  • PDF 文档受损?还是需要密码之类的?######

    pdf没有加密,用wordpad.exe打开

    %PDF-1.5
    %âãÏÓ
    29 0 obj <</Linearized 1/L 306899/O 31/E 2477/N 2/T 306272/H [ 476 202]>>
    endobj

    .......

     

     


     

    ###### 请问第一步是不是还要先处理 PDF extraction 啊?
    2020-06-06 15:17:40
    赞同 展开评论 打赏
问答分类:
C#
问答地址:
问答排行榜
最热
最新

相关电子书

更多
对象存储实战指南-试读 立即下载
OpenAnolis 龙蜥操作系统开源社区技术创新白皮书 立即下载
使用CNFS搭建弹性Web服务 立即下载