java poi拆分excel文件,每个文件保留标题行

简介: java poi拆分excel文件,每个文件保留标题行

一、背景

在工作中,经常需要处理excel文件,将提供的excel文件导入数据库,有时候文件太大我们就需要做拆分了,下面实现将xlsx文件和xls文件按行数拆分,每个文件都保留标题行。这篇文件接着拆分csv大文件进行说明。

二、后端代码

1、我们需要引入poi的依赖

        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>4.0.1</version>
        </dependency>
        <!-- 07版本以后的格式 -->
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>4.0.1</version>
        </dependency>

2、拆分xls类型的文件方法


(1)参数inputStream为要拆分的文件流


(2)参数fileName为拆分文件名


(3)参数splitSize为拆分后每个文件的最大行数


(4)思路:根据前端传的excel文件流转换为一个Workbook文件,创建Workbook文件目的就是能够更好的操作excel,然后获取总行数,根据传到splitSize计算出需要创建几个excel文件,然后创建需要的若干个空excel放入list集合中,遍历原始excel,遍历时有行,单元格的概念,这个poi都能够操作,原始文件第一行的所有单元格都遍历到每个拆分文件的第一行,其余行随机往拆分文件里面一行一行的写,写到最后,将拆分文件集合中的Workbook文件写入存放拆分文件的目录中,关流。

   /**
     * 拆分xls文件并返回文件夹路径
     * @param inputStream
     * @param fileName
     * @param splitSize
     * @return
     */
    public static String getXlsZipPath(InputStream inputStream, String fileName, int splitSize) {
        StopWatch stopWatch = new StopWatch();
        stopWatch.start();
        Workbook workBook = null;
        try {
            workBook = WorkbookFactory.create(inputStream);
        } catch (Exception e) {
            logger.error("Load excel file error!", e);
            return null;
        }
        try {
            Sheet sheet = workBook.getSheetAt(0);
            Iterator<Row> rowIterator = sheet.rowIterator();
            int totalRows = sheet.getPhysicalNumberOfRows();
            int splitNumber = (int) ((totalRows % splitSize == 0) ? (totalRows / splitSize) : (totalRows / splitSize + 1));
            logger.info("xls文件总行数: {}行  拆分文件个数:{}个", totalRows, splitNumber);
            List<HSSFWorkbook> hssfWorkbooks = new ArrayList<>();
            //创建存放拆分文件的目录,文件夹存在,可能里面有内容,删除所有内容
            File dir = new File(defaultDir + fileName);
            if (dir.exists()) {
                delAllFile(dir.getAbsolutePath());
            }
            dir.mkdirs();
            //创建的拆分文件写入流并放入集合中
            for (int count = 0; count < splitNumber; count++) {
                HSSFWorkbook hssfWorkbook = new HSSFWorkbook();
                hssfWorkbook.createSheet().createRow(0);
                hssfWorkbooks.add(hssfWorkbook);
            }
            int oldRow = 0;
            while (rowIterator.hasNext()) {
                Row row = rowIterator.next();
                if (row.getRowNum() == 0) {
                    oldRow++;
                    Iterator<Cell> cellIterator = row.cellIterator();
                    int index = 0;
                    while (cellIterator.hasNext()) {
                        Cell next = cellIterator.next();
//                        解决获取excel数据的方法与实际类型不符
                        next.setCellType(CellType.STRING);
                        String value = next.getStringCellValue();
                        for (int count = 0; count < splitNumber; count++) {
                            HSSFRow row1 = hssfWorkbooks.get(count).getSheetAt(0).getRow(0);
                            row1.createCell(index).setCellValue(value);
                        }
                        index++;
                    }
                }
                if (row.getRowNum() != 0) {
                    Iterator<Cell> cellIterator = row.cellIterator();
                    HSSFWorkbook hssfWorkbook = hssfWorkbooks.get(oldRow % splitNumber);
                    HSSFSheet sheet1 = hssfWorkbook.getSheetAt(0);
                    int index = 0;
                    HSSFRow row1 = sheet1.createRow(sheet1.getLastRowNum() + 1);
                    while (cellIterator.hasNext()) {
                        Cell next = cellIterator.next();
                        next.setCellType(CellType.STRING);
                        String value = next.getStringCellValue();
                        row1.createCell(index++).setCellValue(value);
                    }
                    oldRow++;
                }
            }
            //创建拆分文件并关流
            for (int i = 0; i < hssfWorkbooks.size(); i++) {
                String splitFilePath = defaultDir + fileName + File.separator + fileName + i + ".xlsx";
                File file = new File(splitFilePath);
                file.createNewFile();
                FileOutputStream outputStream = new FileOutputStream(file);
                hssfWorkbooks.get(i).write(outputStream);
                hssfWorkbooks.get(i).close();
            }
        } catch (IOException e) {
            logger.error("拆分xls文件失败  :" + e);
        }
        stopWatch.stop();
        logger.info("xls文件拆分共花费:  " + stopWatch.getTotalTimeMillis() + " ms");
        return defaultDir + fileName + File.separator;
    }

3、拆分xlsx类型的文件方法


(1)参数inputStream为要拆分的文件流


(2)参数fileName为拆分文件名


(3)参数splitSize为拆分后每个文件的最大行数


(4)思路:根据前端传的excel文件流转换为一个Workbook文件,创建Workbook文件目的就是能够更好的操作excel,然后获取总行数,根据传到splitSize计算出需要创建几个excel文件,然后创建需要的若干个空excel放入list集合中,遍历原始excel,遍历时有行,单元格的概念,这个poi都能够操作,原始文件第一行的所有单元格都遍历到每个拆分文件的第一行,其余行随机往拆分文件里面一行一行的写,写到最后,将拆分文件集合中的Workbook文件写入存放拆分文件的目录中,关流。

    /**
     * 拆分xlsx文件并返回文件夹路径
     *
     * @param inputStream
     * @param fileName
     * @param splitSize
     * @return
     */
    public static String getXlsxZipPath(InputStream inputStream, String fileName, int splitSize) {
        StopWatch stopWatch = new StopWatch();
        stopWatch.start();
        Workbook workBook = null;
        try {
            workBook = WorkbookFactory.create(inputStream);
        } catch (Exception e) {
            logger.error("Load excel file error!", e);
            return null;
        }
        try {
            Sheet sheet = workBook.getSheetAt(0);
            Iterator<Row> rowIterator = sheet.rowIterator();
            int totalRows = sheet.getPhysicalNumberOfRows();
            int splitNumber = (int) ((totalRows % splitSize == 0) ? (totalRows / splitSize) : (totalRows / splitSize + 1));
            logger.info("xlsx文件总行数: {}行  拆分文件个数:{}个", totalRows, splitNumber);
            List<XSSFWorkbook> xssfWorkbooks = new ArrayList<>();
            //创建存放拆分文件的目录,文件夹存在,可能里面有内容,删除所有内容
            File dir = new File(defaultDir + fileName);
            if (dir.exists()) {
                delAllFile(dir.getAbsolutePath());
            }
            dir.mkdirs();
            //创建的拆分文件写入流并放入集合中
            for (int count = 0; count < splitNumber; count++) {
                XSSFWorkbook xssfWorkbook = new XSSFWorkbook();
                xssfWorkbook.createSheet().createRow(0);
                xssfWorkbooks.add(xssfWorkbook);
            }
            int oldRow = 0;
            while (rowIterator.hasNext()) {
                Row row = rowIterator.next();
                if (row.getRowNum() == 0) {
                    oldRow++;
                    Iterator<Cell> cellIterator = row.cellIterator();
                    int index = 0;
                    while (cellIterator.hasNext()) {
                        Cell next = cellIterator.next();
                        next.setCellType(CellType.STRING);
                        String value = next.getStringCellValue();
                        for (int count = 0; count < splitNumber; count++) {
                            XSSFRow row1 = xssfWorkbooks.get(count).getSheetAt(0).getRow(0);
                            row1.createCell(index).setCellValue(value);
                        }
                        index++;
                    }
                }
                if (row.getRowNum() != 0) {
                    Iterator<Cell> cellIterator = row.cellIterator();
                    XSSFWorkbook xssfWorkbook = xssfWorkbooks.get(oldRow % splitNumber);
                    XSSFSheet sheet1 = xssfWorkbook.getSheetAt(0);
                    int index = 0;
                    XSSFRow row1 = sheet1.createRow(sheet1.getLastRowNum() + 1);
                    while (cellIterator.hasNext()) {
                        Cell next = cellIterator.next();
                        next.setCellType(CellType.STRING);
                        String value = next.getStringCellValue();
                        row1.createCell(index++).setCellValue(value);
                    }
                    oldRow++;
                }
            }
            //创建拆分文件并关流
            for (int i = 0; i < xssfWorkbooks.size(); i++) {
                String splitFilePath = defaultDir + fileName + File.separator + fileName + i + ".xlsx";
                File file = new File(splitFilePath);
                file.createNewFile();
                FileOutputStream outputStream = new FileOutputStream(file);
                xssfWorkbooks.get(i).write(outputStream);
                xssfWorkbooks.get(i).close();
            }
        } catch (IOException e) {
            logger.error("拆分xlsx文件失败  :" + e);
        }
        stopWatch.stop();
        logger.info("xlsx文件拆分共花费:  " + stopWatch.getTotalTimeMillis() + " ms");
        return defaultDir + fileName + File.separator;
    }

4、这两种方法具体用哪一个需要在使用之前判断传过来的文件类型。

5、上面需要用到的删除文件方法如下

  /***
     * 删除文件夹
     *
     */
    public static void delFolder(String folderPath) {
        try {
            delAllFile(folderPath); // 删除完里面所有内容
            String filePath = folderPath;
            filePath = filePath.toString();
            File myFilePath = new File(filePath);
            myFilePath.delete(); // 删除空文件夹
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    /***
     * 删除指定文件夹下所有文件
     *
     * @param path 文件夹完整绝对路径
     * @return
     */
    public static boolean delAllFile(String path) {
        boolean flag = false;
        File file = new File(path);
        if (!file.exists()) {
            return flag;
        }
        if (!file.isDirectory()) {
            return flag;
        }
        String[] tempList = file.list();
        File temp = null;
        for (int i = 0; i < tempList.length; i++) {
            if (path.endsWith(File.separator)) {
                temp = new File(path + tempList[i]);
            } else {
                temp = new File(path + File.separator + tempList[i]);
            }
            if (temp.isFile()) {
                temp.delete();
            }
            if (temp.isDirectory()) {
                delAllFile(path + "/" + tempList[i]);// 先删除文件夹里面的文件
                delFolder(path + "/" + tempList[i]);// 再删除空文件夹
                flag = true;
            }
        }
        return flag;
    }
目录
相关文章
|
28天前
|
Java
java小工具util系列5:java文件相关操作工具,包括读取服务器路径下文件,删除文件及子文件,删除文件夹等方法
java小工具util系列5:java文件相关操作工具,包括读取服务器路径下文件,删除文件及子文件,删除文件夹等方法
67 9
|
29天前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
67 2
|
8天前
|
Java
java实现从HDFS上下载文件及文件夹的功能,以流形式输出,便于用户自定义保存任何路径下
java实现从HDFS上下载文件及文件夹的功能,以流形式输出,便于用户自定义保存任何路径下
68 34
|
14天前
|
Python
按条件将Excel文件拆分到不同的工作表
使用Python的pandas库,可以轻松将Excel文件按条件拆分到不同的工作表中。本文通过一个示例代码展示了如何生成一个包含总成绩表和三个班级表的Excel文件。代码首先创建了一个包含学生姓名、班级和各科成绩的数据框,然后按班级分组,将每个班级的数据分别写入不同的工作表。最后,生成的Excel文件将包含四个工作表,分别为总成绩表和三个班级的成绩表。
25 6
按条件将Excel文件拆分到不同的工作表
|
13天前
|
Python
批量将不同的工作簿合并到同一个Excel文件
本文介绍如何使用Python的`pandas`库批量合并不同工作簿至同一Excel文件。通过模拟生成三个班级的成绩数据,分别保存为Excel文件,再将这些文件合并成一个包含所有班级成绩的总成绩单。步骤包括安装必要库、生成数据、保存与合并工作簿。
23 6
|
13天前
|
Python
按条件将Excel文件拆分到不同的工作表
使用Python的pandas库,可以轻松将Excel文件按条件拆分为多个工作表。本文通过一个具体示例,展示了如何根据学生班级将成绩数据拆分到不同的工作表中,并生成一个包含总成绩表和各班级成绩表的Excel文件。代码简洁明了,适合初学者学习和应用。
28 6
|
22天前
|
前端开发
实现Excel文件和其他文件导出为压缩包,并导入
实现Excel文件和其他文件导出为压缩包,并导入
25 1
|
28天前
|
Java BI API
Java Excel报表生成:JXLS库的高效应用
在Java应用开发中,经常需要将数据导出到Excel文件中,以便于数据的分析和共享。JXLS库是一个强大的工具,它基于Apache POI,提供了一种简单而高效的方式来生成Excel报表。本文将详细介绍JXLS库的使用方法和技巧,帮助你快速掌握Java中的Excel导出功能。
61 6
|
25天前
|
消息中间件 存储 Java
RocketMQ文件刷盘机制深度解析与Java模拟实现
【11月更文挑战第22天】在现代分布式系统中,消息队列(Message Queue, MQ)作为一种重要的中间件,扮演着连接不同服务、实现异步通信和消息解耦的关键角色。Apache RocketMQ作为一款高性能的分布式消息中间件,广泛应用于实时数据流处理、日志流处理等场景。为了保证消息的可靠性,RocketMQ引入了一种称为“刷盘”的机制,将消息从内存写入到磁盘中,确保消息持久化。本文将从底层原理、业务场景、概念、功能点等方面深入解析RocketMQ的文件刷盘机制,并使用Java模拟实现类似的功能。
40 3
|
29天前
|
Java 测试技术 Maven
Maven clean 提示文件 java.io.IOException
在使用Maven进行项目打包时,遇到了`Failed to delete`错误,尝试手动删除目标文件也失败,提示`java.io.IOException`。经过分析,发现问题是由于`sys-info.log`文件被其他进程占用。解决方法是关闭IDEA和相关Java进程,清理隐藏的Java进程后重新尝试Maven clean操作。最终问题得以解决。总结:遇到此类问题时,可以通过任务管理器清理相关进程或重启电脑来解决。