EF大数据批量处理----BulkInsert

2015-06-28 2496

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： <div class="markdown_views"><p></p><div class="toc"><div class="toc"><ul><li><a href="#%E8%BF%99%E4%BA%9B%E6%89%A9%E5%B1%95%E6%96%B9%E6%B3%95%E5%9C%A8%E5%93%AA%E9%87%8C%E6%89%BE">这些扩展方法

这些扩展方法在哪里找
批量添加和EF本身自带的添加性能提高了多少
为什么扩展方法用的时间这么少

之前做项目的时候，做出来的系统的性能不太好，在框架中使用了EntityFramework，于是就在网上查资料，研究如何提高EF的性能。
在这分享一篇博客批量操作提升EntityFramework的性能
里面提供了一个扩展库Entity Framework扩展库，在这里面找到了一些比较好的方法。下面主要介绍其中的一个方法—-批量添加BulkInsert。

这些扩展方法在哪里找？

在VS中新建EF之后，右键解决方案下的引用, 选择管理NuGet程序包,搜索Z.EntityFramework.Extensions并安装。

这里写图片描述

然后在类里面添加引用之后就可以直接点出来。

批量添加和EF本身自带的添加性能提高了多少？

下面咱们就用实例说话:
构造一个10W个studentinfo实例：

            '''定义要添加数据的条数'''
            int customerCount = 100000;

            '''定义一个实体集合'''
            List<studentInfo> customers = new List<studentInfo>();

            '''想集合中添加数据'''
            for (int i = 0; i < customerCount; i++)
            {
                studentInfo customer = new studentInfo()
                {
                    name = "2" + i,
                    sex = "2" + i,
                    studentID = "2" + i,
                    age = "2"
                };
                customers.Add(customer);

                Console.Write(".");
            }

用EF自带的添加方法将数据添加到数据库中，为了计算使用时间，加上StopWatch：

'''开始计时'''
Stopwatch watch = Stopwatch.StartNew();

using (EFTestEntities dbcontext = new EFTestEntities())
            {
                foreach (var entity in customers)
                {
                    dbcontext.studentInfoes.Add(entity);
                }
                dbcontext.SaveChanges();
            }

'''计时结束'''
watch.Stop();

'''输出时间'''
Console.WriteLine(string.Format("{0} customers are created, cost {1} milliseconds.", customerCount, watch.ElapsedMilliseconds));

好了现在运行，等待中……
哎~~实在是没有耐心等待它运行完。
怎么办，减少数据量，先添加1000条：

这里写图片描述

还好，用时6157毫秒，6.157秒；

接着走，把数据量改为10000条：

这里写图片描述

运行完了，共117096毫秒，117.096秒，将近两分钟。实在是没有耐心再测100000条的了，接下来直接测批量添加的方法。

将上面的添加到数据库中的代码换成下面的代码：

dbcontext.BulkInsert(customers);

dbcontext.BulkSaveChanges();

直接上10W条：

这里写图片描述

运行完了，共3592毫秒，3.592秒，真快啊~~

那么20W呢？

这里写图片描述

20W条数据运行完，才花了6346毫秒，6.346秒的时间。比上面的方法添加1000条的数据用的时间差不多，看来EF自带的添加方法慢，是毋庸置疑的了。

为什么扩展方法用的时间这么少？

ＥＦ自带的方法，会增加与数据库的交互次数，一般地，ＥＦ的一个上下文在提交时会打开一个数据连接，然后把转换成的ＳＱＬ语句一条一条的发到数据库端，然后去提交，下面的图片是我用SQL Server Profiler记录的和数据库交互的操作，这只是一小部分，试想，如果你的数据量达到万级别（更不用说百万，千万数据了），那对数据库的压力是很大的

这里写图片描述

而扩展方法运行时与数据库的交互是这样的：

这里写图片描述

批量添加的方法是生成一条SQL语句，和数据库只交互一次。那为什么图片中有多条Insert语句呢，当你使用BulkInsert时，如果数据达到４万之前，那在SQL的解释时，也是很有压力的，有多情况下会超时，当然这与你的数据库服务器有关，但为了性能与安全，将Bulk操作变为分批提交，即将上W的数据进行分解，分用１Ｗ数据量提交一次，这样，对数据库的压力就小一些。

源代码下载：EF扩展方法BulkInsert（批量添加）

参考博客链接

EF大数据批量处理----BulkInsert

这些扩展方法在哪里找？

批量添加和EF本身自带的添加性能提高了多少？

为什么扩展方法用的时间这么少？

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

EF大数据批量处理----BulkInsert

这些扩展方法在哪里找？

批量添加和EF本身自带的添加性能提高了多少？

为什么扩展方法用的时间这么少？

热门文章

最新文章

相关课程

相关电子书