使用NPOI导入导出标准Excel

简介: 转自http://www.cnblogs.com/lwme/archive/2011/11/18/npoi_excel_import_export.html 试过很多Excel导入导出方法,都不太理想,无意中逛到oschina时,发现了NPOI,无需Office COM组件且不依赖Office,顿时惊为天人,怀着无比激动的心情写下此文。

转自http://www.cnblogs.com/lwme/archive/2011/11/18/npoi_excel_import_export.html

 

试过很多Excel导入导出方法,都不太理想,无意中逛到oschina时,发现了 NPOI,无需Office COM组件且不依赖Office,顿时惊为天人,怀着无比激动的心情写下此文。

曾使用过的方法

  1. 直接导出html,修改后缀名为.xls,这个方法有点像骗人的把戏,而且不能再导入
  2. 使用Jet OLEDB引擎来进行导入导出,完全使用sql语句来进行操作,缺点能控制的东西非常有限,比如格式就难以控制
  3. 使用Office COM组件进行导入导出,对环境依赖性太强(如“检索 COM 类工厂…”错误);且需要通过打开Excel.exe进程进行操作;虽然可以通过关闭工作表以及Marshal.ReleaseComObject方法来释放资源,但依然避免不了性能差。

关于NPOI

NPOIPOI项目的.NET版本,是由@Tony Qu(http://tonyqus.cnblogs.com/)等大侠基于POI开发的,可以从http://npoi.codeplex.com/下载到它的最新版本。它不使用Office COM组件(Microsoft.Office.Interop.XXX.dll),不需要安装Microsoft Office,支持对Office 97-2003的文件格式,功能比较强大。更详细的说明请看作者的博客或官方网站。

它的以下一些特性让我相当喜欢:

  1. 支持对标准的Excel读写
  2. 支持对流(Stream)的读写 (而Jet OLEDB和Office COM都只能针对文件)
  3. 支持大部分Office COM组件的常用功能
  4. 性能优异 (相对于前面的方法)
  5. 使用简单,易上手

使用NPOI

本文使用的是它当前的最新版本1.2.4,此版本的程序集缩减至2个:NPOI.dllIonic.Zip.dll,直接引用到项目中即可。

对于我们开发者使用的对象主要位于NPOI.HSSF.UserModel空间下,主要有HSSFWorkbookHSSFSheetHSSFRowHSSFCell,对应的接口为位于NPOI.SS.UserModel空间下的IWorkbookISheetIRowICell,分别对应Excel文件、工作表、行、列。

简单演示一下创建一个Workbook对象,添加一个工作表,在工作表中添加一行一列:

01 using NPOI.HSSF.UserModel;
02 using NPOI.SS.UserModel;
03
04 public class NPOIWrite
05 {
06     void CreateSheet()
07     {
08         IWorkbook workbook = new HSSFWorkbook();//创建Workbook对象
09         ISheet sheet = workbook.CreateSheet("Sheet1");//创建工作表
10         IRow row = sheet.CreateRow(0);//在工作表中添加一行
11         ICell cell = row.CreateCell(0);//在行中添加一列
12         cell.SetCellValue("test");//设置列的内容
13     }
14 }

相应的读取代码:

01 using System.IO;
02 using NPOI.HSSF.UserModel;
03 using NPOI.SS.UserModel;
04
05 public class NPOIRead
06 {
07     void GetSheet(Stream stream)
08     {
09         IWorkbook workbook = new HSSFWorkbook(stream);//从流内容创建Workbook对象
10         ISheet sheet = workbook.GetSheetAt(0);//获取第一个工作表
11         IRow row = sheet.GetRow(0);//获取工作表第一行
12         ICell cell = row.GetCell(0);//获取行的第一列
13         string value = cell.ToString();//获取列的值
14     }
15 }

使用NPOI导出

从DataTable读取内容来创建Workbook对象:

01 public static MemoryStream RenderToExcel(DataTable table)
02 {
03     MemoryStream ms = new MemoryStream();
04
05     using (table)
06     {
07         using (IWorkbook workbook = new HSSFWorkbook())
08         {
09             using (ISheet sheet = workbook.CreateSheet())
10             {
11                 IRow headerRow = sheet.CreateRow(0);
12
13                 // handling header.
14                 foreach (DataColumn column in table.Columns)
15                     headerRow.CreateCell(column.Ordinal).SetCellValue(column.Caption);//If Caption not set, returns the ColumnName value
16
17                 // handling value.
18                 int rowIndex = 1;
19
20                 foreach (DataRow row in table.Rows)
21                 {
22                     IRow dataRow = sheet.CreateRow(rowIndex);
23
24                     foreach (DataColumn column in table.Columns)
25                     {
26                         dataRow.CreateCell(column.Ordinal).SetCellValue(row[column].ToString());
27                     }
28
29                     rowIndex++;
30                 }
31
32                 workbook.Write(ms);
33                 ms.Flush();
34                 ms.Position = 0;
35             }
36         }
37     }
38     return ms;
39 }

如果看不惯DataTable,那么DataReader也行:

01 public static MemoryStream RenderToExcel(IDataReader reader)
02 {
03     MemoryStream ms = new MemoryStream();
04
05     using (reader)
06     {
07         using (IWorkbook workbook = new HSSFWorkbook())
08         {
09             using (ISheet sheet = workbook.CreateSheet())
10             {
11                 IRow headerRow = sheet.CreateRow(0);
12                 int cellCount = reader.FieldCount;
13
14                 // handling header.
15                 for (int i = 0; i < cellCount; i++)
16                 {
17                     headerRow.CreateCell(i).SetCellValue(reader.GetName(i));
18                 }
19
20                 // handling value.
21                 int rowIndex = 1;
22                 while (reader.Read())
23                 {
24                     IRow dataRow = sheet.CreateRow(rowIndex);
25
26                     for (int i = 0; i < cellCount; i++)
27                     {
28                         dataRow.CreateCell(i).SetCellValue(reader[i].ToString());
29                     }
30
31                     rowIndex++;
32                 }
33
34                 workbook.Write(ms);
35                 ms.Flush();
36                 ms.Position = 0;
37             }
38         }
39     }
40     return ms;
41 }

以上代码把创建的Workbook对象保存到流中,可以通过以下方法输出到浏览器,或是保存到硬盘中:

01 static void SaveToFile(MemoryStream ms, string fileName)
02 {
03     using (FileStream fs = new FileStream(fileName, FileMode.Create, FileAccess.Write))
04     {
05         byte[] data = ms.ToArray();
06
07         fs.Write(data, 0, data.Length);
08         fs.Flush();
09
10         data = null;
11     }
12 }
13
14 static void RenderToBrowser(MemoryStream ms, HttpContext context, string fileName)
15 {
16     if (context.Request.Browser.Browser == "IE")
17         fileName = HttpUtility.UrlEncode(fileName);
18     context.Response.AddHeader("Content-Disposition", "attachment;fileName=" + fileName);
19     context.Response.BinaryWrite(ms.ToArray());
20 }

使用NPOI导入

需要注意的是,sheet.LastRowNum = sheet.PhysicalNumberOfRows - 1,这里可能存在BUG:当没有数据或只有一行数据时sheet.LastRowNum为0,PhysicalNumberOfRows 表现正常

这里读取流中的Excel来创建Workbook对象,并转换成DataTable:

01 static DataTable RenderFromExcel(Stream excelFileStream)
02 {
03     using (excelFileStream)
04     {
05         using (IWorkbook workbook = new HSSFWorkbook(excelFileStream))
06         {
07             using (ISheet sheet = workbook.GetSheetAt(0))//取第一个表
08             {
09                 DataTable table = new DataTable();
10
11                 IRow headerRow = sheet.GetRow(0);//第一行为标题行
12                 int cellCount = headerRow.LastCellNum;//LastCellNum = PhysicalNumberOfCells
13                 int rowCount = sheet.LastRowNum;//LastRowNum = PhysicalNumberOfRows - 1
14
15                 //handling header.
16                 for (int i = headerRow.FirstCellNum; i < cellCount; i++)
17                 {
18                     DataColumn column = new DataColumn(headerRow.GetCell(i).StringCellValue);
19                     table.Columns.Add(column);
20                 }
21
22                 for (int i = (sheet.FirstRowNum + 1); i <= rowCount; i++)
23                 {
24                     IRow row = sheet.GetRow(i);
25                     DataRow dataRow = table.NewRow();
26
27                     if (row != null)
28                     {
29                         for (int j = row.FirstCellNum; j < cellCount; j++)
30                         {
31                             if (row.GetCell(j) != null)
32                                 dataRow[j] = GetCellValue(row.GetCell(j));
33                         }
34                     }
35
36                     table.Rows.Add(dataRow);
37                 }
38                 return table;
39
40             }
41         }
42     }
43 }

或者是直接生成SQL语句来插入到数据库:

01 public static int RenderToDb(Stream excelFileStream, string insertSql, DBAction dbAction)
02 {
03     int rowAffected = 0;
04     using (excelFileStream)
05     {
06         using (IWorkbook workbook = new HSSFWorkbook(excelFileStream))
07         {
08             using (ISheet sheet = workbook.GetSheetAt(0))//取第一个工作表
09             {
10                 StringBuilder builder = new StringBuilder();
11
12                 IRow headerRow = sheet.GetRow(0);//第一行为标题行
13                 int cellCount = headerRow.LastCellNum;//LastCellNum = PhysicalNumberOfCells
14                 int rowCount = sheet.LastRowNum;//LastRowNum = PhysicalNumberOfRows - 1
15
16                 for (int i = (sheet.FirstRowNum + 1); i <= rowCount; i++)
17                 {
18                     IRow row = sheet.GetRow(i);
19                     if (row != null)
20                     {
21                         builder.Append(insertSql);
22                         builder.Append(" values (");
23                         for (int j = row.FirstCellNum; j < cellCount; j++)
24                         {
25                             builder.AppendFormat("'{0}',", GetCellValue(row.GetCell(j)).Replace("'", "''"));
26                         }
27                         builder.Length = builder.Length - 1;
28                         builder.Append(");");
29                     }
30
31                     if ((i % 50 == 0 || i == rowCount) && builder.Length > 0)
32                     {
33                         //每50条记录一次批量插入到数据库
34                         rowAffected += dbAction(builder.ToString());
35                         builder.Length = 0;
36                     }
37                 }
38             }
39         }
40     }
41     return rowAffected;
42 }

这里的Excel可能没有数据,所以可以加一个方法来检测:

01 public static bool HasData(Stream excelFileStream)
02 {
03     using (excelFileStream)
04     {
05         using (IWorkbook workbook = new HSSFWorkbook(excelFileStream))
06         {
07             if (workbook.NumberOfSheets > 0)
08             {
09                 using (ISheet sheet = workbook.GetSheetAt(0))
10                 {
11                     return sheet.PhysicalNumberOfRows > 0;
12                 }
13             }
14         }
15     }
16     return false;
17 }

结尾

好吧,不说啥了,放代码:点击下载

作者:囧月
出处:http://lwme.cnblogs.com/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

目录
相关文章
|
3月前
|
数据格式 UED
记录一次NPOI库导出Excel遇到的小问题解决方案
【11月更文挑战第16天】本文记录了使用 NPOI 库导出 Excel 过程中遇到的三个主要问题及其解决方案:单元格数据格式错误、日期格式不正确以及合并单元格边框缺失。通过自定义单元格样式、设置数据格式和手动添加边框,有效解决了这些问题,提升了导出文件的质量和用户体验。
320 3
|
8月前
|
Java 数据库 数据安全/隐私保护
Java操作Excel文件导入导出【内含有 jxl.jar 】
Java操作Excel文件导入导出【内含有 jxl.jar 】
103 0
|
6月前
|
开发框架 算法 .NET
C#使用MiniExcel导入导出数据到Excel/CSV文件
C#使用MiniExcel导入导出数据到Excel/CSV文件
152 0
|
8月前
|
Java easyexcel
java开发excel导入导出工具类基于EasyExcel
java开发excel导入导出工具类基于EasyExcel
368 1
|
8月前
|
Java API Spring
集成EasyPoi(一个基于POI的Excel导入导出工具)到Spring Boot项目中
集成EasyPoi(一个基于POI的Excel导入导出工具)到Spring Boot项目中
642 1
|
8月前
|
前端开发 Java 开发工具
如何在Spring Boot框架下实现高效的Excel服务端导入导出?
ArtifactId:是项目的唯一标识符,在实际开发中一般对应项目的名称,就是项目根目录的名称。 Group Id,Artfact Id是保证项目唯一性的标识,一般来说如果项目打包上传至maven这样的包管理仓库中。在搜索你的项目时,Group Id,Artfact Id是必要的条件。 Version:版本号,默认0.0.1-SNAPSHOT。SNAPSHOT代表不稳定的版本,与之相对的有RELEASE。 Project type:工程的类型,maven工程还是gradle工程。 Language:语言(Java,Kotlin,Groovy)。
|
8月前
|
easyexcel Java API
Apache POI与easyExcel:Excel文件导入导出的技术深度分析
Apache POI与easyExcel:Excel文件导入导出的技术深度分析
|
2月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
291 10
|
4月前
|
数据采集 存储 JavaScript
自动化数据处理:使用Selenium与Excel打造的数据爬取管道
本文介绍了一种使用Selenium和Excel结合代理IP技术从WIPO品牌数据库(branddb.wipo.int)自动化爬取专利信息的方法。通过Selenium模拟用户操作,处理JavaScript动态加载页面,利用代理IP避免IP封禁,确保数据爬取稳定性和隐私性。爬取的数据将存储在Excel中,便于后续分析。此外,文章还详细介绍了Selenium的基本设置、代理IP配置及使用技巧,并探讨了未来可能采用的更多防反爬策略,以提升爬虫效率和稳定性。
254 4
|
2月前
|
存储 Java easyexcel
招行面试:100万级别数据的Excel,如何秒级导入到数据库?
本文由40岁老架构师尼恩撰写,分享了应对招商银行Java后端面试绝命12题的经验。文章详细介绍了如何通过系统化准备,在面试中展示强大的技术实力。针对百万级数据的Excel导入难题,尼恩推荐使用阿里巴巴开源的EasyExcel框架,并结合高性能分片读取、Disruptor队列缓冲和高并发批量写入的架构方案,实现高效的数据处理。此外,文章还提供了完整的代码示例和配置说明,帮助读者快速掌握相关技能。建议读者参考《尼恩Java面试宝典PDF》进行系统化刷题,提升面试竞争力。关注公众号【技术自由圈】可获取更多技术资源和指导。

热门文章

最新文章