C# 提取PPT文本和图片的实现方案

简介: 在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。

在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。首先也是需要安装组件Spire.Presentation,然后添加引用dll文件到项目中。下面是主要的代码步骤。

原文档:

 

1. 提取文本

步骤一:创建一个Presentation实例并加载文档

Presentation presentation = new Presentation(@"C:\Users\Administrator\Desktop\sample.pptx", FileFormat.Pptx2010);

步骤二:创建一个StringBuilder对象

StringBuilder sb = new StringBuilder();

 步骤三:遍历幻灯片及幻灯片中的图形,提取文本内容

 foreach (ISlide slide in presentation.Slides)
            {
                foreach (IShape shape in slide.Shapes)
                {
                    if (shape is IAutoShape)
                    {
                        foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
                        {
                            sb.Append(tp.Text + Environment.NewLine);
                        }
                    }
                }
            }

步骤四:写入Txt文档

 File.WriteAllText("target.txt", sb.ToString());
 Process.Start("target.txt");

 

2. 提取图片

 这里提取图片有两种情况,一种是提取整个文档中的所有图片,另外一种是只提取文档中某一特定幻灯片中的图片。

     2.1提取所有图片

步骤一:初始化一个Presentation类实例,并加载文档

 Presentation ppt = new Presentation();
 ppt.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步骤二:遍历文档中图片,提取图片并保存

 for (int i = 0; i < ppt.Images.Count; i++)
 {
     Image image = ppt.Images[i].Image;
     image.Save(string.Format(@"..\..\Images{0}.png", i));
 }

提取的图片已保存到项目文件夹下

       2.2.提取特定幻灯片中的图片

步骤一:创建一个Presentation类实例,并加载文档

Presentation PPT = new Presentation();
PPT.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步骤二:获取第三张幻灯片,提取并保存图片

int i = 0;
foreach (IShape s in PPT.Slides[2].Shapes)
{
    if (s is SlidePicture)
    {
        SlidePicture ps = s as SlidePicture;
        ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png", i));
        i++;
    }
    if (s is PictureShape)
    {
        PictureShape ps = s as PictureShape;
        ps.EmbedImage.Image.Save(string.Format("{0}.png", i));
        i++;
    }
}

提取的第三张幻灯片中的图片已保存至指定位置

 

上文演示了如何提取文本和图片,步骤比较简单实用,希望对你有所帮助,感谢阅读!

如需转载请注明出处。

 

目录
相关文章
|
4月前
|
C#
C#读取txt文本的行数
C#读取txt文本的行数
149 0
|
11月前
C#WPF 图片在显示时没有问题,但在运行时图片显示不出来的解决
选中项目,点击右上角的显示全部文件按钮,会将默认隐藏的文件显示出来,选中所需图片,右键,添加到项目,然后选择图片查看属性,生成操作选择resource。完毕。本人目前的解决方案。
388 41
C#WPF 图片在显示时没有问题,但在运行时图片显示不出来的解决
|
4月前
|
存储 API C#
C# 实现格式化文本导入到Excel
C# 实现格式化文本导入到Excel
|
4月前
|
存储 算法 C#
C# 生成指定图片的缩略图
C# 生成指定图片的缩略图
|
4月前
|
C# 开发工具 数据安全/隐私保护
C# 给图片添加文字水印
C# 给图片添加文字水印
|
4月前
|
开发框架 .NET C#
C# 自动填充文字内容到指定图片
C# 自动填充文字内容到指定图片
|
4月前
|
存储 SQL 数据库
C# 将 Word 转文本存储到数据库并进行管理
C# 将 Word 转文本存储到数据库并进行管理
112 2
|
4月前
|
存储 SQL 数据库
C# 将 Word 转文本存储到数据库并进行管理
C# 将 Word 转文本存储到数据库并进行管理
|
4月前
|
API C# 数据安全/隐私保护
C# 实现网页内容保存为图片并生成压缩包
C# 实现网页内容保存为图片并生成压缩包
下一篇
DDNS