Oracle -- 字符集编码'GBK'库数据导入到'UFT-8'库中 大量报错 ORA-12899 解决方案

简介:

需求:
其他项目要求将某环境(字符集编码 'GBK')某用户数据导入到 (字符集编码 'UFT-8')库中.

注释说明:

      编码格式转换要注意VARCHAR2的字段类型.
           --GBK  :VARCHAR2汉字占2字节,英文1字节 -->ORACLE 默认GBK编码格式
           --UTF-8:VARCHAR2汉字占3字节,英文1字节 -->SELECT USERENV('LANGUAGE') FROM DUAL 或者/V$NLS_PARAMETERS查看ORACLE编码格式
        所以源库中VARCHAR2类型字段的数据导入到UTF- 8(VARCHAR2 (N*1.5))有可能超过GBK VARCHAR2(N)的N长度

      有2个方案 可避免有可能导入的时候报错 'ORA-12899: 列 "TAB"."COLUMN" 的值太大 (实际值: 7, 最大值: 6)' :
           1)批量将环境(字符集编码'GBK')VARCHAR2类型DDATA_LENGTH全部改成DATA_LENGTH*1.5 
        --> 1.5表示:UTF-8汉字存3字节/GBK汉字存2字节  -->根据user_tab_columns查询写批量alter table...即可
           2)校验类型为VARCHAR2的字段, LENGTHB(字段的最大值)*1.5是否超过VARCHAR2(N)中的N,若超过,将更改表结构ALTER ..为字段的最大数据*1.5..否则报错
        --> 方案2 寓意 ==>  MAX(LENGTHB(COLUMN_NAME)*1.5 是否大于 VARCHAR2(N)里的N值

--> 如下重点介绍和存储校验:

-->--> 2字符集编码间就汉字存储的字节不同,所以可以只考虑汉字部分进行判断
               -->--> 用LENGTH(‘STRING’)!=LENGTHB(‘STRING’)来判断字符串是否含有中文
         -->--> 介绍相关函数:
                --LENGTH FUNCTIONS RETURN THE LENGTH OF CHAR.
                --LENGTH CALCULATES LENGTH USING CHARACTERS AS DEFINED BY THE INPUT CHARACTER SET.  -- 所占字节长度‘单位是字符’
                --LENGTHB USES BYTES INSTEAD OF CHARACTERS.    --文章用到.... 所占字节长度‘单位是字节’
                --LENGTHC USES UNICODE COMPLETE CHARACTERS.
                --LENGTH2 USES UCS2 CODE POINTS.
                --LENGTH4 USES UCS4 CODE POINTS.

 --校验存储....
 --简意:类型为VARCHAR2的字段, LENGTHB(字段的最大值)*1.5是否超过VARCHAR2(N)中的N,若超过,将更改表结构ALTER ..
  CREATE OR REPLACE PROCEDURE CHANGE_VARCHAR2(USERNAME VARCHAR2 ) IS
  --USERNAME 传入要判断的用户
  P_OWNER       VARCHAR2 (4000 );
  P_TABLE_NAME  VARCHAR2 (4000 );
  P_COLUMN_NAME VARCHAR2 (4000 );
  P_DATA_LENGTH NUMBER (30 );
  P_SQL         VARCHAR2 (4000 );
  MAX_NUM       NUMBER (20 ); ---要是写成VARCHAR2(2000),发现他没有比对,只是将只改成最大,其实就是跳过了比对
  P_SQL_SQL     VARCHAR2 (4000 );

  --创建游标(包含:TABLE_NAME, COLUMN_NAME, DATA_LENGTH)
  CURSOR C_CONS IS
    SELECT OWNER, TABLE_NAME, COLUMN_NAME, DATA_LENGTH
      FROM DBA_TAB_COLUMNS UTC
     WHERE UTC.OWNER = UPPER (USERNAME)
       AND UTC.DATA_TYPE = 'VARCHAR2'
       AND UTC.TABLE_NAME NOT IN
           ( SELECT TABLE_NAME
              FROM DBA_EXTERNAL_TABLES E
             WHERE E.OWNER = UPPER (USERNAME)) --筛选掉临时表
       AND UTC.TABLE_NAME NOT LIKE 'BIN%' ; --筛选掉回收站表
  -- 编辑存储的用户要有查询DBA_TAB_COLUMNS/DBA_EXTERNAL_TABLES权限;
  -- 没权限会报错:’ERROR: PL/SQL: ORA-00942: 表或视图不存在’
  -- 或者用USER_TAB_COLUMNS/USER_EXTERNAL_TABLES视图避免权限问题..
  -- 授权命令:GRANT SELECT ON DBA_TAB_COLUMNS TO 用户;
  -- 授权命令:GRANT SELECT ON DBA_EXTERNAL_TABLES TO 用户;
BEGIN
  FOR P_C_CONS IN C_CONS LOOP
    P_OWNER       := P_C_CONS.OWNER;
    P_TABLE_NAME  := P_C_CONS.TABLE_NAME;
    P_COLUMN_NAME := P_C_CONS.COLUMN_NAME;
    P_DATA_LENGTH := P_C_CONS.DATA_LENGTH;
    P_SQL         := 'SELECT ROUND((CASE WHEN NVL((MAX(LENGTHB(' ||
                     P_COLUMN_NAME || ')' ||
                     ')*1.5 ),0) =0 THEN 1 ELSE (MAX(LENGTHB(' ||
                     P_COLUMN_NAME || ')' || ')*1.5 ) END))  FROM  ' ||
                     P_OWNER || '.' || P_TABLE_NAME || ' WHERE LENGTH(' ||
                     P_COLUMN_NAME || ')!=LENGTHB(' || P_COLUMN_NAME || ')' ; --查询LENGTHB(字段的最大值)*1.5
 
    --CASE WHEN 加判断是因为 字段可能存在空数据 (报错信息:ORA-06535: EXECUTE IMMEDIATE 中的语句字符串为 NULL 或长度为零)
    --ROUND 若字段存的数据都是NUMBER 且都为1个数字,上面的SQL会为 将列改为1.5(报错:DATA TYPE INCORRECT) 所以四舍五入下..
 
    --DBMS_OUTPUT.PUT_LINE(P_SQL);    -- 若出现问题,打印信息,利于检验为题
    EXECUTE IMMEDIATE P_SQL
      INTO MAX_NUM;
    --DBMS_OUTPUT.PUT_LINE(MAX_NUM);
    IF MAX_NUM > P_DATA_LENGTH /*OR MAX_NUM = P_DATA_LENGTH*/
    --如果LENGTHB(字段的最大值)*1.5的结果 大于 VARCHAR2(N)中的N ,执行alter table改字段长度到(LENGTHB(字段的最大值)*1.5)
     THEN
      P_SQL_SQL := 'ALTER TABLE ' || P_TABLE_NAME || ' MODIFY(' ||
                   P_COLUMN_NAME || ' VARCHAR2(' || MAX_NUM || ')) ' ;
      --DBMS_OUTPUT.PUT_LINE(P_SQL_SQL);  -- 若出现问题,打印信息,利于检验为题
      EXECUTE IMMEDIATE P_SQL_SQL;
    ELSE
      RETURN ;
    END IF ;
  END LOOP ;
END CHANGE_VARCHAR2;

--使用步骤:
--   编辑存储..-->调用存储(Call change_varchar2(username => 'u1' );或者begin...等)

大家是否有疑问,为什么只判断varchar2 不判断char 和nvarchar等类型么?
实验 :--字符集编码'GBK' 库中 字段类型为CHAR/NVARCHAR2导入到字符集编码'UTF-8'情况 :

SQL > SELECT USERENV( 'LANGUAGE' ) FROM DUAL;
USERENV ('LANGUAGE' )
----------------------------------------------------
SIMPLIFIED CHINESE_CHINA.ZHS16GBK
 
SQL > CREATE TABLE T_1(CHA CHAR ( 2 ),NVARCHAR NVARCHAR2 ( 3 ));
 
Table created
SQL > INSERT INTO T_1 (CHA, NVARCHAR) VALUES ( '11' , '111' );
 
1 row inserted
SQL > INSERT INTO T_1 (CHA, NVARCHAR) VALUES ( 'AA' , '111' );
 
1 row inserted
SQL > INSERT INTO T_1 (CHA, NVARCHAR) VALUES ( '中' , '中中中' );
 
1 row inserted
 
SQL > commit ;
 
Commit complete
 
SQL > SELECT * FROM t_1;
 
CHA NVARCHAR
--- --------
11   111
AA  111
中  中中中
 
SQL >
--再在字符集编码'UTF-8'情况
SQL > SELECT USERENV( 'LANGUAGE' ) FROM DUAL;
 
USERENV ('LANGUAGE' )
----------------------------------------------------
SIMPLIFIED CHINESE_CHINA.AL32UTF8
 
SQL > create table T_1 as select * from sys.T_1@DB_GBK;
 
Table created
 
SQL > SELECT * FROM t_1;
 
CHA    NVARCHAR
------ --------
11      111
AA     111
中     中中中
SQL >

本文转自ICT时空 dbasdk博客,原文链接:Oracle -- 字符集编码'GBK'库数据导入到'UFT-8'库中 大量报错 ORA-12899 解决方案 ,如需转载请自行联系原博主。

相关文章
|
1月前
|
存储 自然语言处理 Oracle
Oracle数据库字符集概述及修改方式
【8月更文挑战第15天】Oracle 数据库字符集定义了数据的编码方案,决定可存储的字符类型及其表示方式。主要作用包括数据存储、检索及跨系统传输时的正确表示。常见字符集如 AL32UTF8 支持多语言,而 WE8MSWIN1252 主用于西欧语言。修改字符集风险高,可能导致数据问题,需事先备份并评估兼容性。可通过 ALTER DATABASE 语句直接修改或采用导出-导入数据的方式进行。完成后应验证数据完整性。此操作复杂,须谨慎处理。
|
24天前
|
SQL 运维 Oracle
【迁移秘籍揭晓】ADB如何助你一臂之力,轻松玩转Oracle至ADB的数据大转移?
【8月更文挑战第27天】ADB(Autonomous Database)是由甲骨文公司推出的自动化的数据库服务,它极大简化了数据库的运维工作。在从传统Oracle数据库升级至ADB的过程中,数据迁移至关重要。
36 0
|
1月前
|
数据采集 Oracle 关系型数据库
实时计算 Flink版产品使用问题之怎么实现从Oracle数据库读取多个表并将数据写入到Iceberg表
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
28天前
|
SQL 监控 Oracle
Oracle数据误删不用怕,跟我来学日志挖掘
Oracle数据误删不用怕,跟我来学日志挖掘
20 0
|
28天前
|
SQL Oracle 关系型数据库
Oracle误删数据怎么恢复?
Oracle误删数据怎么恢复?
29 0
|
1月前
|
SQL Oracle Java
实时计算 Flink版产品使用问题之采集Oracle数据时,为什么无法采集到其他TABLESPACE的表
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
1月前
|
分布式计算 Oracle 关系型数据库
实时计算 Flink版产品使用问题之获取Oracle的数据时无法获取clob类型的数据,该怎么办
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
2月前
|
SQL 存储 Oracle
TDengine 3.3.2.0 发布:新增 UDT 及 Oracle、SQL Server 数据接入
**TDengine 3.3.2.0 发布摘要** - 开源与企业版均强化性能,提升WebSocket、stmt模式写入与查询效率,解决死锁,增强列显示。 - taos-explorer支持geometry和varbinary类型。 - 企业版引入UDT,允许自定义数据转换。 - 新增Oracle和SQL Server数据接入。 - 数据同步优化,支持压缩,提升元数据同步速度,错误信息细化,支持表名修改。 - 扩展跨平台支持,包括麒麟、Euler、Anolis OS等。
84 0
|
2天前
|
Oracle 关系型数据库 数据库
数据库数据恢复—Oracle数据库文件出现坏块的数据恢复案例
打开oracle数据库报错“system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。 数据库没有备份,无法通过备份去恢复数据库。用户方联系北亚企安数据恢复中心并提供Oracle_Home目录中的所有文件,急需恢复zxfg用户下的数据。 出现“system01.dbf需要更多的恢复来保持一致性”这个报错的原因可能是控制文件损坏、数据文件损坏,数据文件与控制文件的SCN不一致等。数据库恢复工程师对数据库文件进一步检测、分析后,发现sysaux01.dbf文件损坏,有坏块。 修复并启动数据库后仍然有许多查询报错,export和data pump工具使用报错。从数据库层面无法修复数据库。
数据库数据恢复—Oracle数据库文件出现坏块的数据恢复案例
|
9天前
|
Oracle 安全 关系型数据库
Oracle数据恢复—Oracle数据库误删除的数据恢复方法探讨
删除Oracle数据库数据一般有以下2种方式:delete、drop或truncate。下面针对这2种删除oracle数据库数据的方式探讨一下oracle数据库数据恢复方法(不考虑全库备份和利用归档日志)。

相关实验场景

更多

推荐镜像

更多