java读取doc里的表格

简介: java读取doc里的表格

要在Java中读取doc文件中的表格,可以使用Apache POI库。以下是一个简单的示例,展示了如何使用Apache POI库读取doc文件中的表格:

  1. 首先,确保已经安装了Apache POI库。如果使用Maven,可以在pom.xml文件中添加以下依赖:
<dependencies>
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi</artifactId>
        <version>5.2.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>5.2.0</version>
    </dependency>
</dependencies>
  1. 创建一个Java类,用于读取doc文件中的表格:
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFTable;
import org.apache.poi.xwpf.usermodel.XWPFTableRow;
import org.apache.poi.xwpf.usermodel.XWPFTableCell;

import java.io.FileInputStream;
import java.io.IOException;
import java.util.List;

public class ReadDocTable {
   
    public static void main(String[] args) {
   
        try {
   
            FileInputStream fis = new FileInputStream("example.docx");
            XWPFDocument document = new XWPFDocument(fis);
            List<XWPFTable> tables = document.getTables();

            for (XWPFTable table : tables) {
   
                System.out.println("读取表格: " + table.getText());
                for (XWPFTableRow row : table.getRows()) {
   
                    for (XWPFTableCell cell : row.getTableCells()) {
   
                        System.out.print(cell.getText() + "\t");
                    }
                    System.out.println();
                }
            }
            document.close();
            fis.close();
        } catch (IOException e) {
   
            e.printStackTrace();
        }
    }
}
  1. example.docx替换为你要读取的doc文件的路径。运行程序后,它将打印出doc文件中所有表格的内容。
目录
相关文章
|
6月前
|
Java
一个表格带你搞懂java的类加载机制
一个表格带你搞懂java的类加载机制,加载->验证->准备->解析->初始化->使用.卸载
|
6月前
|
Java 程序员
【Java编程实现 9 * 9 乘法表格打印四种形态,七种打法】
【Java编程实现 9 * 9 乘法表格打印四种形态,七种打法】
61 0
|
2天前
|
Java API Apache
Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
【10月更文挑战第29天】Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
14 5
|
2月前
|
人工智能 JavaScript Java
java表格识别PaddleOcr总结
本文介绍了使用OpenCV和PaddleOCR进行表格识别的方法。通过OpenCV进行图像处理,并利用PaddleOCR进行文字识别。文中详细描述了在Windows和Linux环境下搭建PaddleOCR环境的过程,包括解决CMake依赖问题、生成DLL文件等。此外,还提供了C++代码示例说明如何导出识别结果,并探讨了Java环境下使用JNA进行复杂对象传递遇到的问题及解决方案。作者分享了在表格识别项目中的实践经验,包括处理模型转换和优化等方面的挑战。
java表格识别PaddleOcr总结
|
1月前
|
Java Apache
Apache POI java对excel表格进行操作(读、写) 有代码!!!
文章提供了使用Apache POI库在Java中创建和读取Excel文件的详细代码示例,包括写入数据到Excel和从Excel读取数据的方法。
31 0
|
6月前
|
Java
java base64转doc文件
以下是使用Java进行Base64转换的例子: 1. 使用Java Base64工具类进行转换 ```java // 导入相关包 import java.util.Base64; import java.io.FileOutputStream; import java.io.IOException; // 将Base64字符串转换为字节数组 byte[] decodedBytes = Base64.getDecoder().decode(base64String); // 将字节数组写入到文件中 try (FileOutputStream fos = new FileOutputStrea
184 0
|
6月前
|
Java 数据库 开发者
Java数组件与表格组件
Java数组件与表格组件
54 0
|
6月前
|
Java Linux API
|
6月前
|
Java
Java 读取 Excel 模板,将数据填入Excel表格,后转换为PDF文件(实用)
Java 读取 Excel 模板,将数据填入Excel表格,后转换为PDF文件(实用)
382 0
|
前端开发 easyexcel Java
java实现利用阿里巴巴开源的easyexcel进行对excel表格的导入和导出[附完整代码]
java实现利用阿里巴巴开源的easyexcel进行对excel表格的导入和导出[附完整代码]