infobright中导入数据避免特殊字符问题

简介: infobright中导入数据避免特殊字符问题

目前在用的是社区版的infobright,不支持DML功能,只能用LOAD DATA方式导入数据。

如果元数据中有特殊控制字符,导入过程中经常会报错,很是恼火。应对策略有两种方法:

  1. 设置Reject File
    导入之前,设定 @BH_REJECT_FILE_PATH 和 @BH_ABORT_ON_COUNT 就可以忽略多少条导入失败的记录,并且将这些记录保存在指定文件
    /** when the number of rows rejected reaches 10, abort process **/
    set @BH_REJECT_FILE_PATH = '/tmp/reject_file';
    set @BH_ABORT_ON_COUNT = 10;

    BH_ABORT_ON_COUNT 设定为 -1 的话,表示永不忽略。
    也可以设置 BH_ABORT_ON_THRESHOLD 选项,该选项表示有最多多少百分比的数据允许被忽略,因此该选项的值是小数格式,例如 BH_ABORT_ON_THRESHOLD = 0.03(表示3%)

  2. 导出时指定结束符
    此外,还可以在导出数据时制定结束符,并且设定忽略哪些转义字符(\、"、' 等字符),例如:

select fields_list... into outfile '/tmp/outfile.csv' fields terminated by '||' ESCAPED BY '\\' lines terminated by '\r\n' from mytable;

  1. 或者,将行间隔符设定为其他特殊标识,例如:
    select fields_list... into outfile '/tmp/outfile.csv' fields terminated by '||' ESCAPED BY '\\' lines terminated by '$$$$$' from mytable;
    当然了,这种情况下,实际数据行中就不能存在 "$$$$$" 这个值了,否则会被当成换行标识。
相关文章
|
6月前
|
关系型数据库 MySQL 区块链
将excel表格数据导入Mysql新建表中
将excel表格数据导入Mysql新建表中
|
4月前
|
关系型数据库 MySQL 数据库
MySQL设计规约问题之索引的命名规则是什么
MySQL设计规约问题之索引的命名规则是什么
|
SQL 关系型数据库 MySQL
MySql查询不区分大小写解决方案
MySql查询不区分大小写解决方案
342 0
|
关系型数据库 MySQL 大数据
【大数据系列之MySQL】(二十):Navicat将表中数据导出到本地csv格式文件
【大数据系列之MySQL】(二十):Navicat将表中数据导出到本地csv格式文件
480 0
【大数据系列之MySQL】(二十):Navicat将表中数据导出到本地csv格式文件
|
6月前
|
自然语言处理 关系型数据库 分布式数据库
配置 jieba结巴分词 for PolarDB 实现数据库高性能文本分词搜索
背景PolarDB 的云原生存算分离架构, 具备低廉的数据存储、高效扩展弹性、高速多机并行计算能力、高速数据搜索和处理; PolarDB与计算算法结合, 将实现双剑合璧, 推动业务数据的价值产出, 将数据变成生产力.本文将介绍PolarDB结合jieba分词, 实现高效率的中文分词以及中文分词搜索....
160 0
|
存储 缓存 算法
7.Mysql数据库表引擎与字符集
7.Mysql数据库表引擎与字符集
7.Mysql数据库表引擎与字符集
|
SQL 移动开发
infobright中导入数据避免特殊字符问题
infobright中导入数据避免特殊字符问题
|
SQL 关系型数据库 MySQL
PolarDB-X 1.0-用户指南-数据导入导出-使用mysqldump导入导出数据
PolarDB-X支持MySQL官方数据导出工具mysqldump。本文围绕PolarDB-X数据导入导出的几种常见场景对操作步骤和注意事项进行说明。mysqldump命令的详细说明请参见MySQL 官方文档。 mysqldump适合小数据量(低于1000万)的离线导入导出。如果需要完成更大数据量或者实时的数据迁移任务,请参见数据传输服务。
489 0
|
SQL 关系型数据库 MySQL
四十二、导出数据
四十二、导出数据
153 0
|
SQL 分布式计算 Oracle
数据库必知词汇:Sqoop
Apache Sqoop是一个用于在Apache Hadoop和关系数据库等结构化数据存储之间高效传输大容量数据的开源工具。主要用于在Hadoop(Hive)与传统的数据库间进行数据的传递,可以将一个关系型数据库(例如 :MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。此外,对于某些NoSQL数据库Sqoop也提供了连接器。
488 0