批量 SQL 之 FORALL 语句

简介:     对PL/SQL而言,任何的PL/SQL块或者子程序都是PL/SQL引擎来处理,而其中包含的SQL语句则由PL/SQL引擎发送SQL语句转交到SQL引擎来处理,SQL引擎处理完毕后向PL/SQL引擎返回数据。
    对PL/SQL而言,任何的PL/SQL块或者子程序都是PL/SQL引擎来处理,而其中包含的SQL语句则由PL/SQL引擎发送SQL语句转交到SQL引擎来处
理,SQL引擎处理完毕后向PL/SQL引擎返回数据。Pl/SQL与SQL引擎之间的通信则称之为上下文切换。过多的上下文切换将带来过量的性能负载。
因此为减少性能的FORALL与BULK COLLECT的子句应运而生。即仅仅使用一次切换多次执行来降低上下文切换次数。本文主要描述FORALL子句。

一、FORALL语法描述


    FORALL loop_counter IN bounds_clause            -->注意FORALL块内不需要使用loop, end loop
    SQL_STATEMENT [SAVE EXCEPTIONS];
    
    bounds_clause的形式
    lower_limit .. upper_limit                                     -->指明循环计数器的上限和下限,与for循环类似
    INDICES OF collection_name BETWEEN lower_limit .. upper_limit  -->引用特定集合元素的下标(该集合可能为稀疏)
    VALUES OF colletion_name                                       -->引用特定集合元素的值
    
    SQL_STATEMENT部分:SQL_STATEMENT部分必须是一个或者多个集合的静态或者动态的DML(insert,update,delete)语句。
    SAVE EXCEPTIONS部分:对于SQL_STATEMENT部分导致的异常使用SAVE EXCEPTIONS来保证异常存在时语句仍然能够继续执行。

二、使用 FORALL 代替 FOR 循环提高性能
-->下面的示例使用了FOR循环与FORALL循环操作进行对比,使用FORALL完成同样的功能,性能明显提高
CREATE TABLE t
(
   col_num   NUMBER
  ,col_var   VARCHAR2( 10 )
);

DECLARE
   TYPE col_num_type IS TABLE OF NUMBER            -->声明了两个联合数组
                           INDEX BY PLS_INTEGER;

   TYPE col_var_type IS TABLE OF VARCHAR2( 10 )
                           INDEX BY PLS_INTEGER;

   col_num_tab    col_num_type;
   col_var_tab    col_var_type;
   v_start_time   INTEGER;
   v_end_time     INTEGER;
BEGIN
   FOR i IN 1 .. 5000                    -->使用FOR循环向数组填充元素
   LOOP
      col_num_tab( i ) := i;
      col_var_tab( i ) := 'var_' || i;
   END LOOP;

   v_start_time := DBMS_UTILITY.get_time;  -->获得FOR循环向表t插入数据前的初始时间

   FOR i IN 1 .. 5000                   -->使用FOR循环向表t插入数据
   LOOP
      INSERT INTO t
      VALUES ( col_num_tab( i ), col_var_tab( i ) );
   END LOOP;

   v_end_time  := DBMS_UTILITY.get_time;
   DBMS_OUTPUT.put_line( 'Duration of the FOR LOOP: ' || ( v_end_time - v_start_time ) );
   v_start_time := DBMS_UTILITY.get_time;

   FORALL i IN 1 .. 5000          -->使用FORALL循环向表t插入数据
      INSERT INTO t
      VALUES ( col_num_tab( i ), col_var_tab( i ) );

   v_end_time  := DBMS_UTILITY.get_time;
   DBMS_OUTPUT.put_line( 'Duration of the FORALL STATEMENT: ' || ( v_end_time - v_start_time ) );
   COMMIT;
END;

Duration of the FOR LOOP: 68           -->此处的计时单位为百分之一秒,即0.68s,下同
Duration of the FORALL STATEMENT: 18

PL/SQL procedure successfully completed.
三、SAVE EXCEPTIONS
         对于任意的SQL语句执行失败,将导致整个语句或整个事务会滚。而使用SAVE EXCEPTIONS可以使得在对应的SQL语句异常的情形下,FORALL
仍然可以继续执行。如果忽略了SAVE EXCEPTIONS时,当异常发生,FORALL语句就会停止执行。因此SAVE EXCEPTIONS使得FORALL子句中的DML下
产生的所有异常都将记录在SQL%BULK_EXCEPTIONS的游标属性中。SQL%BULK_EXCEPTIONS属性是个记录集合,其中的每条记录由两个字段组成,

ERROR_INDEX和ERROR_CODE。ERROR_INDEX字段会存储发生异常的FORALL语句的迭代编号,而ERROR_CODE则存储对应异常的ORACLE错误代码。类似于这样:(2,01400),(6,1476)和(10,12899)。存放在%BULK_EXCEPTIONS中的值总是与最近一次FORALL语句执行的结果相关,异常的个数存放在%BULK_EXCEPTIONS的COUNT属性中,%BULK_EXCEPTIONS有效的下标索引范围在1到%BULK_EXCEPTIONS.COUNT之间。

1、%BULK_EXCEPTIONS的用法
CREATE TABLE tb_emp AS              -->创建表tb_emp
   SELECT empno, ename, hiredate
   FROM   emp
   WHERE  1 = 2;

ALTER TABLE tb_emp MODIFY(empno NOT NULL);   -->为表添加约束

DECLARE
   TYPE col_num_type IS TABLE OF NUMBER            -->一共定义了3个联合数组类型
                           INDEX BY PLS_INTEGER;

   TYPE col_var_type IS TABLE OF VARCHAR2( 100 )
                           INDEX BY PLS_INTEGER;

   TYPE col_date_type IS TABLE OF DATE
                            INDEX BY PLS_INTEGER;

   empno_tab      col_num_type;
   ename_tab      col_var_type;
   hiredate_tab   col_date_type;
   v_counter      PLS_INTEGER := 0;
   v_total        INTEGER := 0;
   errors         EXCEPTION;                      -->声明异常
   PRAGMA EXCEPTION_INIT( errors, -24381 );
BEGIN
   FOR rec IN ( SELECT empno, ename, hiredate FROM emp )   -->使用for循环将数据填充到联合数组
   LOOP
      v_counter   := v_counter + 1;
      empno_tab( v_counter ) := rec.empno;
      ename_tab( v_counter ) := rec.ename;
      hiredate_tab( v_counter ) := rec.hiredate;
   END LOOP;

   empno_tab( 2 ) := NULL;                                -->对部分数据进行处理以产生异常
   ename_tab( 5 ) := RPAD( ename_tab( 5 ), 15, '*' );
   empno_tab( 10 ) := NULL;

   FORALL i IN 1 .. empno_tab.COUNT                      -->使用forall将联合数组中的数据插入到表tb_emp
   SAVE EXCEPTIONS
      INSERT INTO tb_emp
      VALUES ( empno_tab( i ), ename_tab( i ), hiredate_tab( i ) );

   COMMIT;

   SELECT COUNT( * ) INTO v_total FROM tb_emp;

   DBMS_OUTPUT.put_line( v_total || ' rows were inserted to tb_emp' );
EXCEPTION
   WHEN errors THEN
      DBMS_OUTPUT.put_line( 'There are ' || SQL%bulk_exceptions.COUNT || ' exceptions' );

      FOR i IN 1 .. SQL%bulk_exceptions.COUNT            -->SQL%bulk_exceptions.COUNT记录异常个数来控制迭代
      LOOP
         DBMS_OUTPUT.
          put_line(
                       'Record '
                    || SQL%bulk_exceptions( i ).error_index
                    || ' caused error '
                    || i
                    || ': '
                    || SQL%bulk_exceptions( i ).error_code
                    || ' '
                    || SQLERRM( -SQL%bulk_exceptions( i ).error_code ) );   -->使用SQLERRM根据错误号抛出具体的错误信息
      END LOOP;
END;

There are 3 exceptions
Record 2 caused error 1: 1400 ORA-01400: cannot insert NULL into ()
Record 5 caused error 2: 12899 ORA-12899: value too large for column  (actual: , maximum: )
Record 10 caused error 3: 1400 ORA-01400: cannot insert NULL into ()

PL/SQL procedure successfully completed.

2、%BULK_ROWCOUNT
	%BULK_ROWCOUNT也是专门为FORALL设计的,用于保存第i个元素第i次insert或update或delete所影响到的行数。如果第i次操作没有行被影
响,则%BULK_ROWCOUNT返回为零值。FORALL语句和%BULK_ROWCOUNT属性使用同样的下标索引。如果FORALL使用下标索引的范围在5到8的话,那么
%BULK_ROWCOUNT的也是5到8。需要注意的是一般情况下,对于insert .. values而言,所影响的行数为1,即%BULK_ROWCOUNT的值为1。而对于
insert .. select方式而言,%BULK_ROWCOUNT的值就有可能大于1。update与delete语句存在0,1,以及大于1的情形。

DECLARE
   TYPE dept_tab_type IS TABLE OF NUMBER;

   dept_tab   dept_tab_type := dept_tab_type( 10, 20, 50 );    -->声明及初始化嵌套表
BEGIN
   FORALL i IN dept_tab.FIRST .. dept_tab.LAST                 -->使用FORALL更新
      UPDATE emp
      SET    sal          = sal * 1.10
      WHERE  deptno = dept_tab( i );

   -- COMMIT;
   FOR i IN 1 .. dept_tab.COUNT                               -->循环输出每次执行SQL语句影响的行数
   LOOP
      DBMS_OUTPUT.put_line( 'Dept no ' || dept_tab( i ) || ' has ' || SQL%bulk_rowcount (i) || ' rows been updated' );
   END LOOP;

   -- Did the 3rd UPDATE statement affect any rows?
   IF SQL%bulk_rowcount (3) = 0 THEN
      DBMS_OUTPUT.put_line( 'The deptno 50 has not child record' );
   END IF;
END;

Dept no 10 has 3 rows been updated
Dept no 20 has 5 rows been updated
Dept no 50 has 0 rows been updated
The deptno 50 has not child record

PL/SQL procedure successfully completed.
四、INDICES OF 选项
    INDICES OF 选项用于处理稀疏集合类型。即当集合(嵌套表或联合数组)中的元素被删除之后,对稀疏集合实现迭代。
-->下面的脚本同前面的示例基本相似,所不同的是使用了delete方式删除其中的部分记录,导致集合变得稀疏。
-->其次在forall子句处使用indices OF方式来控制循环。		
TRUNCATE TABLE tb_emp;

DECLARE
   TYPE col_num_type IS TABLE OF NUMBER
                           INDEX BY PLS_INTEGER;

   TYPE col_var_type IS TABLE OF VARCHAR2( 100 )
                           INDEX BY PLS_INTEGER;

   TYPE col_date_type IS TABLE OF DATE
                            INDEX BY PLS_INTEGER;

   empno_tab      col_num_type;
   ename_tab      col_var_type;
   hiredate_tab   col_date_type;
   v_counter      PLS_INTEGER := 0;
   v_total        INTEGER := 0;
BEGIN
   FOR rec IN ( SELECT empno, ename, hiredate FROM emp )
   LOOP
      v_counter   := v_counter + 1;
      empno_tab( v_counter ) := rec.empno;
      ename_tab( v_counter ) := rec.ename;
      hiredate_tab( v_counter ) := rec.hiredate;
   END LOOP;

   empno_tab.delete( 2 );       -->此处删除了数组中的第二个元素,导致数组变为稀疏型
   ename_tab.delete( 2 );
   hiredate_tab.delete( 2 );

   FORALL i IN indices OF empno_tab   -->此处使用了indices OF empno_tab,则所有未被delete的元素都将进入循环
      INSERT INTO tb_emp
      VALUES ( empno_tab( i ), ename_tab( i ), hiredate_tab( i ) );

   COMMIT;

   SELECT COUNT( * ) INTO v_total FROM tb_emp;

   DBMS_OUTPUT.put_line( v_total || ' rows were inserted to tb_emp' );
END;

13 rows were inserted to tb_emp

PL/SQL procedure successfully completed.
五、VALUES OF 选项
    VALUES OF选项可以指定FORALL语句中循环计数器的值来自于指定集合中元素的值。
    VALUES OF选项使用时有一些限制
          如果VALUES OF子句中所使用的集合是联合数组,则必须使用PLS_INTEGER和BINARY_INTEGER进行索引
          VALUES OF 子句中所使用的元素必须是PLS_INTEGER或BINARY_INTEGER
          当VALUES OF 子句所引用的集合为空,则FORALL语句会导致异常               
TRUNCATE TABLE tb_emp;
				
CREATE TABLE tb_emp_ins_log AS                    -->创建一张与tb_emp结构类似的表tb_emp_ins_log
   SELECT *
   FROM   tb_emp
   WHERE  1 = 0;

ALTER TABLE tb_emp_ins_log MODIFY(ename VARCHAR2(50));   -->修改列ename的长度

DECLARE
   TYPE col_num_type IS TABLE OF tb_emp.empno%TYPE
                           INDEX BY PLS_INTEGER;

   TYPE col_var_type IS TABLE OF VARCHAR2( 100 )
                           INDEX BY PLS_INTEGER;

   TYPE col_date_type IS TABLE OF tb_emp.hiredate%TYPE
                            INDEX BY PLS_INTEGER;

   TYPE ins_log_type IS TABLE OF PLS_INTEGER         -->此处较之前的示例多声明了一个联合数组
                           INDEX BY PLS_INTEGER;     -->用于填充异常记录的元素值

   empno_tab      col_num_type;
   ename_tab      col_var_type;
   hiredate_tab   col_date_type;
   ins_log_tab    ins_log_type;
   v_counter      PLS_INTEGER := 0;
   v_total        INTEGER := 0;
   errors         EXCEPTION;
   PRAGMA EXCEPTION_INIT( errors, -24381 );
BEGIN
   FOR rec IN ( SELECT empno, ename, hiredate FROM emp )
   LOOP
      v_counter   := v_counter + 1;
      empno_tab( v_counter ) := rec.empno;
      ename_tab( v_counter ) := rec.ename;
      hiredate_tab( v_counter ) := rec.hiredate;
   END LOOP;

   ename_tab( 2 ) := RPAD( ename_tab( 2 ), 15, '*' );    -->使记录2与记录5的ename列长度变长而产生异常
   ename_tab( 5 ) := RPAD( ename_tab( 5 ), 15, '*' );
   empno_tab( 6 ) := NULL;                          -->使第6条记录的empno为NULL值,由于表tb_emp的empno不允许为NULL而产生异常

   FORALL i IN 1 .. empno_tab.COUNT
   SAVE EXCEPTIONS
      INSERT INTO tb_emp
      VALUES ( empno_tab( i ), ename_tab( i ), hiredate_tab( i ) );

   COMMIT;
EXCEPTION
   WHEN errors THEN
      FOR i IN 1 .. SQL%bulk_exceptions.COUNT
      LOOP
         ins_log_tab( i ) := SQL%bulk_exceptions( i ).error_index;   -->异常记录的索引值将填充ins_log_type联合数组
      END LOOP;                                    -->此处的结果是ins_log_tab(1)=2,  ins_log_tab(2)=5,  ins_log_tab(2)=6

      FORALL i IN VALUES OF ins_log_tab   -->使用VALUES OF子句为ins_log_type联合数组中的元素值
         INSERT INTO tb_emp_ins_log
         VALUES ( empno_tab( i ), ename_tab( i ), hiredate_tab( i ) );  -->因此values中的i分别为2和5

      COMMIT;
END;

PL/SQL procedure successfully completed.

-->异常的记录被插入到表tb_emp_ins_log
select * from tb_emp_ins_log;

     EMPNO ENAME                                              HIREDATE
---------- -------------------------------------------------- ---------
      7369 Henry**********                                    17-DEC-80
      7566 JONES**********                                    02-APR-81
           MARTIN                                             28-SEP-81
六、INDICES OF 与 VALUES OF 的综合运用
-->下面的例子来自Oracle		http://docs.oracle.com/cd/B19306_01/appdev.102/b14261/tuning.htm
-- Create empty tables to hold order details

CREATE TABLE valid_orders
(
   cust_name   VARCHAR2( 32 )
  ,amount      NUMBER( 10, 2 )
);

CREATE TABLE big_orders AS
   SELECT *
   FROM   valid_orders
   WHERE  1 = 0;

CREATE TABLE rejected_orders AS
   SELECT *
   FROM   valid_orders
   WHERE  1 = 0;

DECLARE
   -- Make collections to hold a set of customer names and order amounts.
   SUBTYPE cust_name IS valid_orders.cust_name%TYPE;

   TYPE cust_typ IS TABLE OF cust_name;

   cust_tab             cust_typ;

   SUBTYPE order_amount IS valid_orders.amount%TYPE;

   TYPE amount_typ IS TABLE OF NUMBER;

   amount_tab           amount_typ;

   -- Make other collections to point into the CUST_TAB collection.
   TYPE index_pointer_t IS TABLE OF PLS_INTEGER;

   big_order_tab        index_pointer_t := index_pointer_t( );
   rejected_order_tab   index_pointer_t := index_pointer_t( );

   PROCEDURE setup_data IS
   BEGIN
      -- Set up sample order data, including some invalid orders and some 'big' orders.
      cust_tab    :=
         cust_typ( 'Company1','Company2','Company3','Company4','Company5' );
      amount_tab  :=
         amount_typ( 5000.01,0,150.25,4000.00,NULL );
   END;
BEGIN
   setup_data( );
   DBMS_OUTPUT.put_line( '--- Original order data ---' );

   FOR i IN 1 .. cust_tab.LAST
   LOOP
      DBMS_OUTPUT.put_line( 'Customer #' || i || ', ' || cust_tab( i ) || ': $' || amount_tab( i ) );
   END LOOP;

   -- Delete invalid orders (where amount is null or 0).
   FOR i IN 1 .. cust_tab.LAST
   LOOP
      IF amount_tab( i ) IS NULL OR amount_tab( i ) = 0 THEN
         cust_tab.delete( i );
         amount_tab.delete( i );
      END IF;
   END LOOP;

   DBMS_OUTPUT.put_line( '--- Data with invalid orders deleted ---' );

   FOR i IN 1 .. cust_tab.LAST
   LOOP
      IF cust_tab.EXISTS( i ) THEN
         DBMS_OUTPUT.put_line( 'Customer #' || i || ', ' || cust_tab( i ) || ': $' || amount_tab( i ) );
      END IF;
   END LOOP;

   -- Because the subscripts of the collections are not consecutive, use
   -- FORALL...INDICES OF to iterate through the actual subscripts,
   -- rather than 1..COUNT
   FORALL i IN indices OF cust_tab
      INSERT INTO valid_orders( cust_name, amount )
      VALUES ( cust_tab( i ), amount_tab( i ) );

   -- Now process the order data differently
   -- Extract 2 subsets and store each subset in a different table
   setup_data( );                    -- Initialize the CUST_TAB and AMOUNT_TAB collections again.

   FOR i IN cust_tab.FIRST .. cust_tab.LAST
   LOOP
      IF amount_tab( i ) IS NULL OR amount_tab( i ) = 0 THEN
         rejected_order_tab.EXTEND;                          -- Add a new element to this collection
         -- Record the subscript from the original collection
         rejected_order_tab( rejected_order_tab.LAST ) := i;
      END IF;

      IF amount_tab( i ) > 2000 THEN
         big_order_tab.EXTEND;                            -- Add a new element to this collection
         -- Record the subscript from the original collection
         big_order_tab( big_order_tab.LAST ) := i;
      END IF;
   END LOOP;

   -- Now it's easy to run one DML statement on one subset of elements,
   -- and another DML statement on a different subset.
   FORALL i IN VALUES OF rejected_order_tab
      INSERT INTO rejected_orders
      VALUES ( cust_tab( i ), amount_tab( i ) );

   FORALL i IN VALUES OF big_order_tab
      INSERT INTO big_orders
      VALUES ( cust_tab( i ), amount_tab( i ) );

   COMMIT;
END;

--- Original order data ---
Customer #1, Company1: $5000.01
Customer #2, Company2: $0
Customer #3, Company3: $150.25
Customer #4, Company4: $4000
Customer #5, Company5: $
--- Data with invalid orders deleted ---
Customer #1, Company1: $5000.01
Customer #3, Company3: $150.25
Customer #4, Company4: $4000

PL/SQL procedure successfully completed.

SELECT cust_name "Customer", amount "Valid order amount" FROM valid_orders;

Customer                         Valid order amount
-------------------------------- ------------------
Company1                                    5000.01
Company3                                     150.25
Company4                                       4000

SELECT cust_name "Customer", amount "Big order amount" FROM big_orders;

Customer                         Big order amount
-------------------------------- ----------------
Company1                                  5000.01
Company4                                     4000

SELECT cust_name "Customer", amount "Rejected order amount" FROM rejected_orders;

Customer                         Rejected order amount
-------------------------------- ---------------------
Company2                                             0
Company5

--Author: Robinson Cheng
--Blog : http://blog.csdn.net/robinson_0612
     
--	上面的例子对订单进行分类,并将其保存到三张不同类型的表中。
--	1、首先定义了两个嵌套表cust_tab,amount_tab用于保存原始数据,setup_data( )则用来初始化数据。
--	2、第一个for循环用于输出所有的订单,第二个for循环则用来将删除amount_tab中为NULL或0值的记录。
--	3、第三个for循环则用来输出经过删除之后剩余的记录,使用exists方法判断。
--	4、使用forall子句将所有有效的记录插入到valid_orders,注意此时使用了indices of,因此此时的两个嵌套表已为稀疏表。
--	5、在这之后,使用setup_data( )重新初始化数据。
--	6、将无效订单的下标记录到rejected_order_tab嵌套表,将amount > 2000订单的下标记录到big_order_tab。
--	7、使用VALUES OF 子句将两个嵌套表中对应下表的记录插入到对应的表中。
七、更多参考

批量 SQL 之 BULK COLLECT 子句

PL/SQL 集合的初始化与赋值
PL/SQL 联合数组与嵌套表
PL/SQL 变长数组
PL/SQL --> PL/SQL记录

SQL tuning 步骤

高效SQL语句必杀技

父游标、子游标及共享游标

绑定变量及其优缺点

dbms_xplan之display_cursor函数的使用

dbms_xplan之display函数的使用

执行计划中各字段各模块描述

使用 EXPLAIN PLAN 获取SQL语句执行计划

启用 AUTOTRACE 功能

函数使得索引列失效

Oracle 绑定变量窥探

Oracle 自适应共享游标                      
目录
相关文章
|
SQL XML Oracle
Mybatis动态SQL语句查询,实现一个参数 可查询多个字段。
Mybatis动态SQL语句查询,实现一个参数 可查询多个字段。
566 0
Mybatis动态SQL语句查询,实现一个参数 可查询多个字段。
|
7月前
|
SQL Oracle 关系型数据库
mysql和oracle 命令行执行sql文件 数据库执行sql文件 执行sql语句
mysql和oracle 命令行执行sql文件 数据库执行sql文件 执行sql语句
87 0
|
SQL 存储 缓存
一文搞懂MySQL中一条SQL语句是如何执行的
一文搞懂MySQL中一条SQL语句是如何执行的
|
SQL 存储 关系型数据库
MySQL的第一篇文章——了解数据库、简单的SQL语句
MySQL的第一篇文章——了解数据库、简单的SQL语句
|
SQL Python
Pandas与SQL的数据操作语句对照
Pandas与SQL的数据操作语句对照
173 0
Pandas与SQL的数据操作语句对照
|
SQL 数据库 Python
Python 数据库Insert语句脚本生成工具(SQL Server)
Python 数据库Insert语句脚本生成工具(SQL Server)
394 0
Python 数据库Insert语句脚本生成工具(SQL Server)
|
SQL 程序员 开发工具
【Sql Server】基础之分组查询重复出现多条记录的SQL语句,以及group by和having、min函数运用
基础之分组查询重复出现多条记录的SQL语句,以及group by和having、min函数运用
556 0
【Sql Server】基础之分组查询重复出现多条记录的SQL语句,以及group by和having、min函数运用
SQL 查询表中每门课程成绩最好的前n名学生 优于group by语句的方法
SQL 查询表中每门课程成绩最好的前n名学生 优于group by语句的方法
SQL 查询表中每门课程成绩最好的前n名学生 优于group by语句的方法
|
SQL 数据库 数据安全/隐私保护
使用SQL语句 查询电话号码 加密显示
使用SQL语句 查询电话号码 加密显示
345 0
使用SQL语句 查询电话号码 加密显示
|
SQL 存储 安全
MYSQL数据库初窥门径, SQL语句地熟练使用, 图形化界面提高效率
MYSQL数据库初窥门径, SQL语句地熟练使用, 图形化界面提高效率
MYSQL数据库初窥门径, SQL语句地熟练使用, 图形化界面提高效率