POI - 读取Excel2003、Excel2007或更高级的兼容性问题

简介:

我们使用POI中的HSSFWorkbook来读取Excel数据。

1
2
3
4
5
6
public  void  test(File file)  throws  IOException {  
         InputStream inp =  new  FileInputStream(file);  
         HSSFWorkbook workbook =  new  HSSFWorkbook(inp);  
           
         // workbook...遍历操作  
     }

上边代码,读取Excel2003(xls)的文件没问题,但是一旦读取的是Excel2007(xlsx)的文件,就会报异常:“The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)

查阅了资料,Excel2007版本的Excel文件需要使用XSSFWorkbook来读取,如下:

1
2
3
4
5
6
public  void  test(File file)  throws  IOException {  
         InputStream inp =  new  FileInputStream(file);  
         XSSFWorkbook workbook =  new  XSSFWorkbook(inp);  
           
         // workbook...遍历操作  
     }

注意:XSSFWorkbook需要额外导入poi-ooxml-3.9-sources.jar和poi-ooxml-schemas-3.9.jar。

这样,Excel2007的导入没问题了,但是导入Excel2003又报异常。


所以,在导入Excel的时候,尽量能判断导入Excel的版本,调用不同的方法。

我想到过使用文件后缀名来判断类型,但是如果有人将xlsx的后缀改为xls时,如果使用xlsx的函数来读取,结果是报错;虽然后缀名对了,但是文件内容编码等都不对。

最后,推荐使用poi-ooxml中的WorkbookFactory.create(inputStream)来创建Workbook,因为HSSFWorkbook和XSSFWorkbook都实现了Workbook接口。代码如下:

1
Workbook wb = WorkbookFactory.create(is);

可想而知,在WorkbookFactory.create()函数中,肯定有做过对文件类型的判断,一起来看一下源码是如何判断的:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
/** 
      * Creates the appropriate HSSFWorkbook / XSSFWorkbook from 
      *  the given InputStream. 
      * Your input stream MUST either support mark/reset, or 
      *  be wrapped as a {@link PushbackInputStream}! 
      */  
     public  static  Workbook create(InputStream inp)  throws  IOException, InvalidFormatException {  
         // If clearly doesn't do mark/reset, wrap up  
         if (! inp.markSupported()) {  
             inp =  new  PushbackInputStream(inp,  8 );  
         }  
           
         if (POIFSFileSystem.hasPOIFSHeader(inp)) {  
             return  new  HSSFWorkbook(inp);  
         }  
         if (POIXMLDocument.hasOOXMLHeader(inp)) {  
             return  new  XSSFWorkbook(OPCPackage.open(inp));  
         }  
         throw  new  IllegalArgumentException( "Your InputStream was neither an OLE2 stream, nor an OOXML stream" );  
     }

可以看到,有根据文件类型来分别创建合适的Workbook对象。是根据文件的头部信息去比对进行判断的,此时,就算改了后缀名,还是一样通不过















本文转自yunlielai51CTO博客,原文链接:http://blog.51cto.com/4925054/1735246,如需转载请自行联系原作者

相关文章
|
7月前
|
API
Poi 中文API文档 「40种操作 Excel文件的姿势」
Poi 中文API文档 「40种操作 Excel文件的姿势」
320 0
|
7月前
|
easyexcel Java 测试技术
读取Excel还用POI?试试这款开源工具EasyExcel
读取Excel还用POI?试试这款开源工具EasyExcel
186 0
|
Java Maven
【Java用法】使用poi写Java代码导出Excel文档的解决方案
【Java用法】使用poi写Java代码导出Excel文档的解决方案
88 0
|
2月前
|
前端开发 JavaScript Java
导出excel的两个方式:前端vue+XLSX 导出excel,vue+后端POI 导出excel,并进行分析、比较
这篇文章介绍了使用前端Vue框架结合XLSX库和后端结合Apache POI库导出Excel文件的两种方法,并对比分析了它们的优缺点。
494 0
|
2月前
|
Java Apache
Apache POI java对excel表格进行操作(读、写) 有代码!!!
文章提供了使用Apache POI库在Java中创建和读取Excel文件的详细代码示例,包括写入数据到Excel和从Excel读取数据的方法。
48 0
|
6月前
|
Java API Spring
集成EasyPoi(一个基于POI的Excel导入导出工具)到Spring Boot项目中
集成EasyPoi(一个基于POI的Excel导入导出工具)到Spring Boot项目中
564 1
|
6月前
|
easyexcel Java API
Apache POI与easyExcel:Excel文件导入导出的技术深度分析
Apache POI与easyExcel:Excel文件导入导出的技术深度分析
|
7月前
【POI】常用excel操作方法
【POI】常用excel操作方法
63 1
|
7月前
|
Java Apache 索引
POI操作大全(动态合并单元格,为单元格生成一个自定义的数据显示格式,自定义公式计算结果生成,读取excel,word文件在生成图片,word指定位置生成图片)
POI操作大全(动态合并单元格,为单元格生成一个自定义的数据显示格式,自定义公式计算结果生成,读取excel,word文件在生成图片,word指定位置生成图片)
993 0
|
7月前
|
Java
POI上传excel的java后台逻辑
POI上传excel的java后台逻辑