Open XML操作Excel导入数据
项目中发现使用OleDb(using System.Data.OleDb)相关对象处理Excel导入功能,不是很稳定经常出问题,需要把这个问题解决掉。项目组提出使用OpenXML来处理Excel的导入、导出问题,出于兴趣对OpenXML了解一下,做了简单Demo。
1.Open XML准备
使用Open XML操作Excel需要安装Open XML Format SDK 2.0及其以上版本,其相关对象和接口建立在Open XML SDK CTP 2基础上的,使用前先下载Open XML Format SDK 2.0及其以上版本。SDK默认会安装在C:\Program Files (x86)\Open XML Format SDK\V2.0 (64bit)目录下,lib子目录下的DocumentFormat.OpenXml.dll必须被引用到项目中。Open XML支持Office 2007及其以上版本,Open XML好像升级到2.5版本了,对于Open XML 2.0和2.5其对象和API接口有所不同,请查阅相关文档。把这个小Demo整出来,花了一些时间,主要是对其中的相关对象和API接口使用的不了解。
2.简单Excel zip包介绍
大家应该知道Office 2007都是一些XML文件的压缩包,可以创建一个Office 2007的Excel文件,简单录入几条数据,保存一下。复制一下,做个副本,修改其后缀为zip格式,这样就可以看到Excel的一些相关文件。因需要测试功能,做了简单的Office 2007的文件,修改为zip解压查看相关文件如下图:
其中需要注意的几个文件styles.xml、sharedStrings.xml、workbook.xml、worksheets中各个sheet。
styles.xml:主要用来存放Excel中样式的(包括格式化的数据格式,如日期、货币等等);
sharedStrings.xml:主要存放共享的String数据的,在没有对Excel中相关单元格和数据格式化都可以通过这个文件读取;
workbook.xml:主要存放工作簿中各个工作表的命名和命名空间,在获取各个工作表的名称可以通过寻址找到节点,获取各表名称;
worksheets中各个sheet:主要存放各个工作表的相关数据库
3.简单功能介绍
使用OpenXML操作Excel,将Excel中的数据正确读取出来,保持到数据库。但是碰到一些问题,就是如何读取格式化的数据,把日期、时间、货币进行数据格式化,就不能正确的读取数据,由于不是很了解,花了些时间,在网上查了查相关资料解决了一下。估计不是最优解,如果对这方面了解的大牛,希望能指导一下,提供一些更好的方法。
这里测试了两块,一块把Excel的所有数据按Excel定义的格式转换成DataTable和DataSet;另一块把Excel中数据对照相关数据库实体对象,使用反射进行实体属性赋值,转换失败,则Excel中的数据就有问题。
一块是将Excel的数据全部搬到DataTable或DataSet,不考虑这些数据是来自数据库的几个表,如果业务需要可以对这个DataTable或DataSet操作;
另一块是进行数据库实体对象校验,必须Excel中单元格的数据格式和数据库中字段的存储格式一致,当然也可以根据业务的需要继续添加各种验证,你可以继续丰富、优化代码。
稍加改进了一下,可以支持泛型对象的转换,可以将符合规格的Excel的数据转换成对应的实体对象,即可以映射任何实体对象。那么就可以根据需要转换成DataTable或DataSet,或者对多表数据的转换,可以在此基础上优化,希望对你有帮助。
4.简单实现介绍
实现就是建一个WinForm程序,一个导入按钮,一个DataView呈现数据,一个OpenFileDialog选择文件。两个辅助解析Excel的类,ExcelOper和ExcelOperMatch,一个是不进行校验之间转化为DataTable\DataSet的;一个是需要数据校验的,其中ExcelOperMatch调用ExcelOper写好的两个方法:GetWorkBookPartRows(获取WorkBookPart中所有的行数据)和GetCellValue(获取单元格的值)。其中对于格式化样式不太好处理,测试数据2的样式:
5.简单实现效果
1).测试数据1
2).实现数据1
3).测试数据2
4).实现数据2
5).测试数据3
6).实现数据3
6.示例Demo代码:
1).ExcelOper.cs文件代码
(注意DLL和命名空间的引入:using DocumentFormat.OpenXml.Packaging和using DocumentFormat.OpenXml.Spreadsheet和using System.Diagnostics;)
2).ExcelOperMatch.cs代码
(注意命名空间的引入:using System.Reflection;[稍作改进添加反射实体泛型支持方法,这样就可以将符合规则的Excel数据转换成对应的数据表])
3).WinForm的Button事件代码
4).ExcelOperMatchObject.cs([新增泛型处理Excel的数据,这样可以轻松将Excel的数据转换成数据库表])
5).对于第4点ExcelOperMatchObject类的调用很简单(还是在WinForm的Button事件中调用):
//Excel数据导入,泛型支持与任意实体对象匹配 //这里使用TestPerson实体对象做测试对象,你也可以用多个对象,转换成DataTable或DataSet ExcelOperMatchObject execelOperObject = new ExcelOperMatchObject(); List listTestPersons = execelOperObject.ExcelToObjects("Sheet1", filePath); this.dataGridView1.DataSource = listTestPersons;
7.代码结构
1).ExcelOper.cs文件代码
2).ExcelOperMatch.cs代码
8.参考博客
《用Open XML SDK读取Excel》
《使用OpenXML将Excel内容读取到DataTable中》
《使用 Open XML SDK 2.0 检索 Excel 2010 中单元格的值》
至于性能方面项目组老大测试过,相对不错,你也可以用几十万条数据试一下。
对于数据库数据导出Excel的处理感兴趣的可以看看:《[转载]DataSet导出Excel,比以往的方法导出的Excel外观更加好看》
本文转自SanMaoSpace博客园博客,原文链接:http://www.cnblogs.com/SanMaoSpace/p/3294885.html,如需转载请自行联系原作者