infobright中导入数据避免特殊字符问题

简介: infobright中导入数据避免特殊字符问题

目前在用的是社区版的infobright,不支持DML功能,只能用LOAD DATA方式导入数据。

如果元数据中有特殊控制字符,导入过程中经常会报错,很是恼火。应对策略有两种方法:

  1. 设置Reject File
    导入之前,设定 @BH_REJECT_FILE_PATH 和 @BH_ABORT_ON_COUNT 就可以忽略多少条导入失败的记录,并且将这些记录保存在指定文件
    /** when the number of rows rejected reaches 10, abort process **/
    set @BH_REJECT_FILE_PATH = '/tmp/reject_file';
    set @BH_ABORT_ON_COUNT = 10;

    BH_ABORT_ON_COUNT 设定为 -1 的话,表示永不忽略。
    也可以设置 BH_ABORT_ON_THRESHOLD 选项,该选项表示有最多多少百分比的数据允许被忽略,因此该选项的值是小数格式,例如 BH_ABORT_ON_THRESHOLD = 0.03(表示3%)

  2. 导出时指定结束符
    此外,还可以在导出数据时制定结束符,并且设定忽略哪些转义字符(\、"、' 等字符),例如:

select fields_list... into outfile '/tmp/outfile.csv' fields terminated by '||' ESCAPED BY '\\' lines terminated by '\r\n' from mytable;

  1. 或者,将行间隔符设定为其他特殊标识,例如:
    select fields_list... into outfile '/tmp/outfile.csv' fields terminated by '||' ESCAPED BY '\\' lines terminated by '$$$$$' from mytable;
    当然了,这种情况下,实际数据行中就不能存在 "$$$$$" 这个值了,否则会被当成换行标识。
            </div>
相关文章
|
前端开发 UED
长轮询(Long Polling)的缺点有哪些?
【10月更文挑战第8天】
476 2
|
移动开发 Java Windows
Java 匹配\r 和 \n 的正则表达式如何编写
【10月更文挑战第19天】Java 匹配\r 和 \n 的正则表达式如何编写
907 3
|
存储 SQL Java
jvm性能调优实战 - 27亿级数据量的实时分析引擎,为啥频繁发生Full GC
jvm性能调优实战 - 27亿级数据量的实时分析引擎,为啥频繁发生Full GC
376 0
|
运维 调度 开发者
深入解析 Cron 表达式:定时任务的时间艺术
大家好,今天我们将一起来深入了解 Cron 表达式,这是计划任务中不可或缺的时间表达式。无论你是一名开发者、运维工程师还是对定时任务感兴趣的读者,本文都将帮助你理解 Cron 表达式的基本结构、常用格式以及如何编写自定义的定时任务。也为大家提供了一个在线cron表达式生成的工具,让我们开始探索这项定时任务的时间艺术吧!
1631 0
深入解析 Cron 表达式:定时任务的时间艺术
|
XML NoSQL Java
SpringSession的源码解析(生成session,保存session,写入cookie全流程分析)
上一篇文章主要介绍了如何使用SpringSession,其实SpringSession的使用并不是很难,无非就是引入依赖,加下配置。但是,这仅仅只是知其然,要知其所以然,我们还是需要深入源码去理解。
1099 0
SpringSession的源码解析(生成session,保存session,写入cookie全流程分析)
|
弹性计算 固态存储 大数据
阿里云服务器CPU处理器Intel Xeon(Cascade Lake) Platinum 8269CY
阿里云服务器ECS实例CPU处理器Intel Xeon(Cascade Lake) Platinum 8269CY
1738 0
 阿里云服务器CPU处理器Intel Xeon(Cascade Lake) Platinum 8269CY
|
弹性计算 监控 关系型数据库
serverless 入门与实践 | 动手实践1: 基于Serverless 数据库 RDS 和函数计算一键部署相册应用
serverless 入门与实践 | 动手实践1: 基于Serverless 数据库 RDS 和函数计算一键部署相册应用
482 0
serverless 入门与实践 | 动手实践1: 基于Serverless 数据库 RDS 和函数计算一键部署相册应用
|
存储 C语言
C语言程序环境和预处理(一)
C语言程序环境和预处理
220 0
|
网络协议 测试技术 数据安全/隐私保护
cmd:基本使用
cmd:基本使用
256 0
|
新零售 大数据 云计算
二二复制公排开发功能丨二二复制公排系统开发(开发原理)丨二二复制公排源码详细
 新零售的另一个新层次是互联网+技术(大数据、云计算、移动支付等)它可以连接线上和线下,实现全面覆盖,并通过技术提高零售能力。使企业能够更清晰地获得消费者的形象,同时刺激消费者的消费,创造更好的消费者体验。

热门文章

最新文章