开发者社区 问答 正文

用iTextSharp读取PDF文档中文本内容:报错

用iTextSharp读取PDF文档中文本内容,执行这条Reader reader = new PdfReader(@"C:\WS.pdf");语句时,提示PDF header signature not found,

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using iTextSharp.text;
using iTextSharp.text.pdf;


namespace ConsoleApplication2
{
    class Program
    {
        static void Main(string[] args)
        {
            Console.WriteLine("读取PDF文档");
            try
            {
                // 创建一个PdfReader对象
                PdfReader reader = new PdfReader(@"C:\WS.pdf");

展开
收起
kun坤 2020-06-06 15:17:33 1370 分享 版权
1 条回答
写回答
取消 提交回答
  • PDF 文档受损?还是需要密码之类的?######

    pdf没有加密,用wordpad.exe打开

    %PDF-1.5
    %âãÏÓ
    29 0 obj <</Linearized 1/L 306899/O 31/E 2477/N 2/T 306272/H [ 476 202]>>
    endobj

    .......

     

     


     

    ###### 请问第一步是不是还要先处理 PDF extraction 啊?
    2020-06-06 15:17:40
    赞同 展开评论
问答分类:
C#
问答地址: