Rafy 框架 - 大批量导入实体

简介:

某些场景下,开发者希望能够大批量地把实体的数据导入到数据库中。虽然使用实体仓库保存实体列表非常方便,但是其内部实现机制是一条一条的保存到数据库,当实体的个数较多时,效率就会很低。所以 Rafy 设计了批量导入插件程序,其内部使用 ADO.NET 及 ODP.NET 中的批量导入机制来把大量数据一次性导入到数据库中。

 

使用方法


步骤
  1. 由于批量导入功能是一个额外的程序集,所以在使用该功能时,需要先使用 NuGet 引用最新版本的 Rafy.Domain.ORM.BatchSubmit 程序集。

  2. 如果准备导入 ORACLE 数据库,则也需要引用 Oracle.ManagedDataAccess(12.1.022 以上版本) 程序集。

  3. 修改需要保存大量实体的代码,例如,原代码如下:

var books = new BookList();
for (int i = 0; i < 1000000; i++)
{
    var book = new Book
    {
        ChapterList =
        {
            new Chapter(),
            new Chapter(),
        }
    };
    books.Add(book);
}

//直接使用实体仓库进行保存。
repo.Save(books);

 

需要把最后一行使用仓库保存实体列表,修改为创建导入器来保存实体列表:

//创建一个批量导入器进行保存。
repo.CreateImporter().Save(books);

 

注意


  • 从上面的代码可以看出,批量导入程序是面向整个聚合的。也就是说,批量导入父实体时,同时也会批量导入父实体下的所有子实体。

  • 批量导入不但支持添加新实体,同时也支持批量更新、批量删除。使用方法与使用仓库保持一致。

  • 对于大批量的数据,使用批量导入,比直接使用仓库来保存实体,速度要快两个数据级左右。

  • 目前批量导入实体的功能,只支持 Oracle 和 SqlServer 两个数据库。

  • 在使用 Oracle 数据库时,还需要在数据库生成完成后,特别地调用以下代码以启用某个聚合实体的批量导入功能,否则导入过程中会抛出异常(原因请见后面的实现原理章节)。代码如下:

Rafy.Domain.ORM.BatchSubmit.Oracle.OracleBatchImporter.EnableBatchSequence(
    RF.Concrete<OriginalDataRepository>()
    );
 

实现原理


下面简要介绍批量导入的原理。

Sql Server

对于 Sql Server 数据库的批量保存:

  • 批量新增数据,是使用 System.Data.SqlClient.SqlBulkCopy 来实现的。

  • 批量更新数据,是使用 System.Data.SqlClient.SqlDataAdapter 来实现的。

  • 批量删除数据,则是直接拼接 SQL 语句,把需要删除的实体的 Id 放到 In 语句中进行删除。例如:

DELETE FROM Books WHERE Id IN (1,3,5,7......);
 
Oracle

对于 Oracle 数据库的批量保存:

  • 新增数据、更新数据都是使用 ODP.NET 中原生的批量导入功能。

    参见:Oracle.ManagedDataAccess.Client.OracleCommand.ArrayBindCount 属性。

     

  • 而删除数据的实现则和 SQLServer 的实现一致,均是拼接 DELETE 语句。

  •  

新增大量实体时,实体的 Id 生成

一般情况下,使用仓库保存一个新增的实体时,仓库会使用数据库本身的机制来为实体生成 Id,在 SQLServer 中是使用 IDENTITY 列,在 ORACLE 中则是使用每个表对应的 SEQUENCE 来生成。但是,批量导入大量新实体时,为了性能上的考虑,则需要一次性为需要保存的所有新实体统一生成 Id。

在 SQLServer 中,可以方便地使用 SQL 语句调整表中 IDENTITY 下一次的值,所以实现比较简单。只需要设置 IDENTITY 下一次的值 + 100000,并使用中间跳过的这些值来作为实体的 Id 即可。

但是在 ORACLE 中,如果去调整 SEQUENCE 的值,则属于 DDL 语句,会隐式自动提交事务,会造成数据的错误。所以我们最终决定:如果在 ORACLE 中要使用批量导入功能,数据表对应的 SEQUENCE 必须以较大的数字为步距(如 ALTER SEQUENCE "SEQ_TABLE_ID" INCREMENT BY 100000 NOCACHE)。这样,在批量导入时,就不再需要增修改 SEQUENCE 的步距,而直接使用中间跳过的这些值作为实体的 Id。这样做也比较方便,但是负面效果则是使用仓库保存单一实体时,两次保存不同实体生成的 Id 会相差 100000,不再是连续的。


本文转自BloodyAngel博客园博客,原文链接:http://www.cnblogs.com/zgynhqf/p/4925242.html,如需转载请自行联系原作者

相关文章
|
算法 安全 量子技术
【Python】蒙特卡洛模拟 | PRNG 伪随机数发生器 | 马特赛特旋转算法 | LCG 线性同余算法 | Python Random 模块
【Python】蒙特卡洛模拟 | PRNG 伪随机数发生器 | 马特赛特旋转算法 | LCG 线性同余算法 | Python Random 模块
871 0
|
存储 数据采集 安全
振弦式轴力计和振弦采集仪组成的监测解决方案
振弦式轴力计和振弦采集仪是两种常用的安全监测设备,可以用于监测桥梁、建筑物等结构体的变形、振动以及轴力等参数,以保证结构安全。下面是由振弦式轴力计和振弦采集仪组成的安全监测解决方案:
振弦式轴力计和振弦采集仪组成的监测解决方案
|
网络协议
一起谈.NET技术,回顾.NET Remoting分布式开发
  记得在下第一次接触.NET Remoting分布式开发是在2003年,那时候是Framework1.0初次亮相之时,Remoting分布式开发是Framework1.0其中一个亮点。经过多年的发展,在2005年,WCF随着Framework2.0首先亮相。
2930 0
|
10月前
|
存储 算法 JavaScript
【动态规划篇】股海擒龙诀:精准狙击股票买卖最佳时机
【动态规划篇】股海擒龙诀:精准狙击股票买卖最佳时机
|
NoSQL JavaScript 前端开发
MongoDB 条件操作符
10月更文挑战第15天
166 1
ARM处理器函数调用时的参数传递
ARM处理器函数调用时的参数传递
|
JavaScript 程序员 应用服务中间件
快速入门Web开发(上) 黑马程序员JavaWeb开发教程(2)
快速入门Web开发(上) 黑马程序员JavaWeb开发教程(2)
157 7
|
弹性计算 Serverless 开发者
Serverless 应用引擎问题之镜像构建失败如何解决
在进行Serverless应用开发和部署时,开发者可能会遇到不同类型的报错信息;本合集着重收录了Serverless环境中常见的报错问题及其解决策略,以助于开发者迅速诊断和解决问题,保证服务的连续性和可用性。
661 2
|
编译器 C++
C++类和对象【2】—— 对象特性(构造函数、析构函数、拷贝构造函数、深浅拷贝、初始化列表、类对象作为成员类、静态成员变量及静态成员函数等。)
C++类和对象【2】—— 对象特性(构造函数、析构函数、拷贝构造函数、深浅拷贝、初始化列表、类对象作为成员类、静态成员变量及静态成员函数等。)
228 0
C++类和对象【2】—— 对象特性(构造函数、析构函数、拷贝构造函数、深浅拷贝、初始化列表、类对象作为成员类、静态成员变量及静态成员函数等。)
|
存储 前端开发 算法
【戏玩算法】05-五分钟8张图带你快速了解[链表]
前面我们讨论了栈和队列这两个数据结构,这篇文章来讨论一下链表这个数据结构。
290 0
【戏玩算法】05-五分钟8张图带你快速了解[链表]