java poi拆分excel文件,每个文件保留标题行

简介: java poi拆分excel文件,每个文件保留标题行

一、背景

在工作中,经常需要处理excel文件,将提供的excel文件导入数据库,有时候文件太大我们就需要做拆分了,下面实现将xlsx文件和xls文件按行数拆分,每个文件都保留标题行。这篇文件接着拆分csv大文件进行说明。

二、后端代码

1、我们需要引入poi的依赖

        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>4.0.1</version>
        </dependency>
        <!-- 07版本以后的格式 -->
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>4.0.1</version>
        </dependency>

2、拆分xls类型的文件方法


(1)参数inputStream为要拆分的文件流


(2)参数fileName为拆分文件名


(3)参数splitSize为拆分后每个文件的最大行数


(4)思路:根据前端传的excel文件流转换为一个Workbook文件,创建Workbook文件目的就是能够更好的操作excel,然后获取总行数,根据传到splitSize计算出需要创建几个excel文件,然后创建需要的若干个空excel放入list集合中,遍历原始excel,遍历时有行,单元格的概念,这个poi都能够操作,原始文件第一行的所有单元格都遍历到每个拆分文件的第一行,其余行随机往拆分文件里面一行一行的写,写到最后,将拆分文件集合中的Workbook文件写入存放拆分文件的目录中,关流。

   /**
     * 拆分xls文件并返回文件夹路径
     * @param inputStream
     * @param fileName
     * @param splitSize
     * @return
     */
    public static String getXlsZipPath(InputStream inputStream, String fileName, int splitSize) {
        StopWatch stopWatch = new StopWatch();
        stopWatch.start();
        Workbook workBook = null;
        try {
            workBook = WorkbookFactory.create(inputStream);
        } catch (Exception e) {
            logger.error("Load excel file error!", e);
            return null;
        }
        try {
            Sheet sheet = workBook.getSheetAt(0);
            Iterator<Row> rowIterator = sheet.rowIterator();
            int totalRows = sheet.getPhysicalNumberOfRows();
            int splitNumber = (int) ((totalRows % splitSize == 0) ? (totalRows / splitSize) : (totalRows / splitSize + 1));
            logger.info("xls文件总行数: {}行  拆分文件个数:{}个", totalRows, splitNumber);
            List<HSSFWorkbook> hssfWorkbooks = new ArrayList<>();
            //创建存放拆分文件的目录,文件夹存在,可能里面有内容,删除所有内容
            File dir = new File(defaultDir + fileName);
            if (dir.exists()) {
                delAllFile(dir.getAbsolutePath());
            }
            dir.mkdirs();
            //创建的拆分文件写入流并放入集合中
            for (int count = 0; count < splitNumber; count++) {
                HSSFWorkbook hssfWorkbook = new HSSFWorkbook();
                hssfWorkbook.createSheet().createRow(0);
                hssfWorkbooks.add(hssfWorkbook);
            }
            int oldRow = 0;
            while (rowIterator.hasNext()) {
                Row row = rowIterator.next();
                if (row.getRowNum() == 0) {
                    oldRow++;
                    Iterator<Cell> cellIterator = row.cellIterator();
                    int index = 0;
                    while (cellIterator.hasNext()) {
                        Cell next = cellIterator.next();
//                        解决获取excel数据的方法与实际类型不符
                        next.setCellType(CellType.STRING);
                        String value = next.getStringCellValue();
                        for (int count = 0; count < splitNumber; count++) {
                            HSSFRow row1 = hssfWorkbooks.get(count).getSheetAt(0).getRow(0);
                            row1.createCell(index).setCellValue(value);
                        }
                        index++;
                    }
                }
                if (row.getRowNum() != 0) {
                    Iterator<Cell> cellIterator = row.cellIterator();
                    HSSFWorkbook hssfWorkbook = hssfWorkbooks.get(oldRow % splitNumber);
                    HSSFSheet sheet1 = hssfWorkbook.getSheetAt(0);
                    int index = 0;
                    HSSFRow row1 = sheet1.createRow(sheet1.getLastRowNum() + 1);
                    while (cellIterator.hasNext()) {
                        Cell next = cellIterator.next();
                        next.setCellType(CellType.STRING);
                        String value = next.getStringCellValue();
                        row1.createCell(index++).setCellValue(value);
                    }
                    oldRow++;
                }
            }
            //创建拆分文件并关流
            for (int i = 0; i < hssfWorkbooks.size(); i++) {
                String splitFilePath = defaultDir + fileName + File.separator + fileName + i + ".xlsx";
                File file = new File(splitFilePath);
                file.createNewFile();
                FileOutputStream outputStream = new FileOutputStream(file);
                hssfWorkbooks.get(i).write(outputStream);
                hssfWorkbooks.get(i).close();
            }
        } catch (IOException e) {
            logger.error("拆分xls文件失败  :" + e);
        }
        stopWatch.stop();
        logger.info("xls文件拆分共花费:  " + stopWatch.getTotalTimeMillis() + " ms");
        return defaultDir + fileName + File.separator;
    }

3、拆分xlsx类型的文件方法


(1)参数inputStream为要拆分的文件流


(2)参数fileName为拆分文件名


(3)参数splitSize为拆分后每个文件的最大行数


(4)思路:根据前端传的excel文件流转换为一个Workbook文件,创建Workbook文件目的就是能够更好的操作excel,然后获取总行数,根据传到splitSize计算出需要创建几个excel文件,然后创建需要的若干个空excel放入list集合中,遍历原始excel,遍历时有行,单元格的概念,这个poi都能够操作,原始文件第一行的所有单元格都遍历到每个拆分文件的第一行,其余行随机往拆分文件里面一行一行的写,写到最后,将拆分文件集合中的Workbook文件写入存放拆分文件的目录中,关流。

    /**
     * 拆分xlsx文件并返回文件夹路径
     *
     * @param inputStream
     * @param fileName
     * @param splitSize
     * @return
     */
    public static String getXlsxZipPath(InputStream inputStream, String fileName, int splitSize) {
        StopWatch stopWatch = new StopWatch();
        stopWatch.start();
        Workbook workBook = null;
        try {
            workBook = WorkbookFactory.create(inputStream);
        } catch (Exception e) {
            logger.error("Load excel file error!", e);
            return null;
        }
        try {
            Sheet sheet = workBook.getSheetAt(0);
            Iterator<Row> rowIterator = sheet.rowIterator();
            int totalRows = sheet.getPhysicalNumberOfRows();
            int splitNumber = (int) ((totalRows % splitSize == 0) ? (totalRows / splitSize) : (totalRows / splitSize + 1));
            logger.info("xlsx文件总行数: {}行  拆分文件个数:{}个", totalRows, splitNumber);
            List<XSSFWorkbook> xssfWorkbooks = new ArrayList<>();
            //创建存放拆分文件的目录,文件夹存在,可能里面有内容,删除所有内容
            File dir = new File(defaultDir + fileName);
            if (dir.exists()) {
                delAllFile(dir.getAbsolutePath());
            }
            dir.mkdirs();
            //创建的拆分文件写入流并放入集合中
            for (int count = 0; count < splitNumber; count++) {
                XSSFWorkbook xssfWorkbook = new XSSFWorkbook();
                xssfWorkbook.createSheet().createRow(0);
                xssfWorkbooks.add(xssfWorkbook);
            }
            int oldRow = 0;
            while (rowIterator.hasNext()) {
                Row row = rowIterator.next();
                if (row.getRowNum() == 0) {
                    oldRow++;
                    Iterator<Cell> cellIterator = row.cellIterator();
                    int index = 0;
                    while (cellIterator.hasNext()) {
                        Cell next = cellIterator.next();
                        next.setCellType(CellType.STRING);
                        String value = next.getStringCellValue();
                        for (int count = 0; count < splitNumber; count++) {
                            XSSFRow row1 = xssfWorkbooks.get(count).getSheetAt(0).getRow(0);
                            row1.createCell(index).setCellValue(value);
                        }
                        index++;
                    }
                }
                if (row.getRowNum() != 0) {
                    Iterator<Cell> cellIterator = row.cellIterator();
                    XSSFWorkbook xssfWorkbook = xssfWorkbooks.get(oldRow % splitNumber);
                    XSSFSheet sheet1 = xssfWorkbook.getSheetAt(0);
                    int index = 0;
                    XSSFRow row1 = sheet1.createRow(sheet1.getLastRowNum() + 1);
                    while (cellIterator.hasNext()) {
                        Cell next = cellIterator.next();
                        next.setCellType(CellType.STRING);
                        String value = next.getStringCellValue();
                        row1.createCell(index++).setCellValue(value);
                    }
                    oldRow++;
                }
            }
            //创建拆分文件并关流
            for (int i = 0; i < xssfWorkbooks.size(); i++) {
                String splitFilePath = defaultDir + fileName + File.separator + fileName + i + ".xlsx";
                File file = new File(splitFilePath);
                file.createNewFile();
                FileOutputStream outputStream = new FileOutputStream(file);
                xssfWorkbooks.get(i).write(outputStream);
                xssfWorkbooks.get(i).close();
            }
        } catch (IOException e) {
            logger.error("拆分xlsx文件失败  :" + e);
        }
        stopWatch.stop();
        logger.info("xlsx文件拆分共花费:  " + stopWatch.getTotalTimeMillis() + " ms");
        return defaultDir + fileName + File.separator;
    }

4、这两种方法具体用哪一个需要在使用之前判断传过来的文件类型。

5、上面需要用到的删除文件方法如下

  /***
     * 删除文件夹
     *
     */
    public static void delFolder(String folderPath) {
        try {
            delAllFile(folderPath); // 删除完里面所有内容
            String filePath = folderPath;
            filePath = filePath.toString();
            File myFilePath = new File(filePath);
            myFilePath.delete(); // 删除空文件夹
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    /***
     * 删除指定文件夹下所有文件
     *
     * @param path 文件夹完整绝对路径
     * @return
     */
    public static boolean delAllFile(String path) {
        boolean flag = false;
        File file = new File(path);
        if (!file.exists()) {
            return flag;
        }
        if (!file.isDirectory()) {
            return flag;
        }
        String[] tempList = file.list();
        File temp = null;
        for (int i = 0; i < tempList.length; i++) {
            if (path.endsWith(File.separator)) {
                temp = new File(path + tempList[i]);
            } else {
                temp = new File(path + File.separator + tempList[i]);
            }
            if (temp.isFile()) {
                temp.delete();
            }
            if (temp.isDirectory()) {
                delAllFile(path + "/" + tempList[i]);// 先删除文件夹里面的文件
                delFolder(path + "/" + tempList[i]);// 再删除空文件夹
                flag = true;
            }
        }
        return flag;
    }
目录
相关文章
|
11天前
|
分布式计算 DataWorks Java
DataWorks操作报错合集之在使用MaxCompute的Java SDK创建函数时,出现找不到文件资源的情况,是BUG吗
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
25 0
|
1月前
|
存储 缓存 安全
Java 中 IO 流、File文件
Java 中 IO 流、File文件
|
15天前
|
Java Unix Windows
|
19天前
|
Java 关系型数据库 MySQL
Elasticsearch【问题记录 01】启动服务&停止服务的2类方法【及 java.nio.file.AccessDeniedException: xx/pid 问题解决】(含shell脚本文件)
【4月更文挑战第12天】Elasticsearch【问题记录 01】启动服务&停止服务的2类方法【及 java.nio.file.AccessDeniedException: xx/pid 问题解决】(含shell脚本文件)
55 3
|
18小时前
|
Java 开发者
Java一分钟之-Java IO流:文件读写基础
【5月更文挑战第10天】本文介绍了Java IO流在文件读写中的应用,包括`FileInputStream`和`FileOutputStream`用于字节流操作,`BufferedReader`和`PrintWriter`用于字符流。通过代码示例展示了如何读取和写入文件,强调了常见问题如未关闭流、文件路径、编码、权限和异常处理,并提供了追加写入与读取的示例。理解这些基础知识和注意事项能帮助开发者编写更可靠的程序。
5 0
|
21小时前
|
Java
java导出复杂excel
java导出复杂excel
|
1天前
|
Java
JDK环境下利用记事本对java文件进行运行编译
JDK环境下利用记事本对java文件进行运行编译
8 0
|
3天前
|
Arthas 安全 Java
java服务报错 FileNotFoundException:打开的文件过多
java服务报错 FileNotFoundException:打开的文件过多
13 0
|
7天前
|
Oracle Java 关系型数据库
windows 下 win11 JDK17安装与环境变量的配置(配置简单详细,包含IJ中java文件如何使用命令运行)
本文介绍了Windows 11中安装JDK 17的步骤,包括从官方网站下载JDK、配置环境变量以及验证安装是否成功。首先,下载JDK 17的安装文件,如果没有Oracle账户,可以直接解压缩文件到指定目录。接着,配置系统环境变量,新建`JAVA_HOME`变量指向JDK安装路径,并在`Path`变量中添加。然后,通过命令行(cmd)验证安装,分别输入`java -version`和`javac -version`检查版本信息。最后,作者分享了如何在任意位置运行Java代码,包括在IntelliJ IDEA(IJ)中创建的Java文件,只需去掉包声明,就可以通过命令行直接运行。
|
9天前
|
存储 监控 Java
如何在Java中实现等待文件修改后再读取数据的功能?
如何在Java中实现等待文件修改后再读取数据的功能?
15 0