关于数据导入,教你几招

简介: 我们知道,数据库是存放数据的仓库。日常我们使用数据库也是为了存储数据,和数据库打交道总免不了要进行数据导入工作。工作中也可能遇到各种不同的数据导入需求,本篇文章主要分享下数据导入相关的小技巧,希望你能学到几招。

1.弄清需求是关键


在进行数据导入前,我们首先要清楚想要做什么,要达到什么效果。最好也要清楚导入的数据量有多大,这样对导入时间也有个评估。


其次,对要导入的文件内容也要有大概了解,比如现在有一个 sql 脚本需要执行,那么你要先看下文件内容,是否存在建表语句、若原表存在该怎么处理、数据冲突又要怎么处理等等,这些都要有个预估。


2.几种数据导入场景


下面我们分场景来讨论下如何进行数据导入:


导入 sql 文件


这种场景还是比较常见的,sql 文件中一般是 insert 语句。执行 sql 文件可以使用 mysql 命令行或 source 执行,例如:mysql -uroot -pxxx testdb < /tmp/testdb.sql ,使用 Navicat 等图形化工具也可以执行 sql 文件,这里建议执行 sql 文件最好是通过命令行来执行,特别是比较大的 sql 文件,使用命令行执行速度更快。


在导入 sql 文件前,要先进入数据库看下表信息,原表是否存在数据,如果是增量导入的话,自增 ID 最好不要指定,有唯一索引的字段要额外注意,如果是清空原表进行导入的话,最好事先进行备份下。


导入 Excel 或 CSV 文件


有时候我们也需要将 Excel 表导入数据库中,相对于 sql 文件,导入 Excel 文件显得更加复杂些,因为 sql 文件中的 insert 语句是数据库能直接识别的,而导入 Excel 文件则需要借助其他工具。


例如我们可以借助 Navicat 的导入向导来导入 Excel 文件,首先要在数据库中创建对应的表,字段顺序及类型要与数据相匹配,为了导入顺利,可以先不创建索引并允许字段为空。之后就可以借助导入向导选择 Excel 文件进行导入了,如果首行是标题的话,记得忽略首行。


image.png

image.png


不过,使用 Navicat 导入 Excel 文件只适用于数据量比较小的情况,如果数据量比较大且字段比较复杂的情况下,那就要进行改造处理了,比如可以使用 LOAD DATA 或者借助程序脚本进行处理后再导入。


总结:


本篇文章简单介绍了数据导入的几种场景及方法。作为工作中会遇到的场景,多学几招还是有必要的。关于数据导入,最重要的还是能够成功导入,无论用那种方法只要能完成需求即可。当然进行导入的前提是不影响现有业务,特别是导入前进行的删除操作,一定要小心,我们导入数据是为了完成需求而不是制造新的麻烦。

目录
相关文章
|
8天前
|
SQL 数据采集 消息中间件
DataWork数据处理问题之新数据任务结束如何解决
DataWork数据处理是指使用DataWorks平台进行数据开发、数据处理和数据治理的活动;本合集将涵盖DataWork数据处理的工作流程、工具使用和问题排查,帮助用户提高数据处理的效率和质量。
40 1
|
8天前
|
数据库
R语言highfrequency高频金融数据导入
R语言highfrequency高频金融数据导入
|
8天前
|
关系型数据库 MySQL 数据库
Mysql基础第三十二天,数据库维护
Mysql基础第三十二天,数据库维护
65 0
|
9月前
|
SQL 存储 分布式数据库
如何同时兼顾多维分析和快速查询的需求?Kudu来帮忙!彭文华
如何同时兼顾多维分析和快速查询的需求?Kudu来帮忙!彭文华
|
SQL 数据库
数据库sql去重操作 + 人大金仓案例
一般在增量导入数据后,表中会出现冗余的数据,因此对于表的去重操作主要分为两种:去重查询以及删除重复数据
|
数据库
数据库实验二:数据查询中难题、易错题合集
数据库实验二:数据查询中难题、易错题合集
123 0
数据库实验二:数据查询中难题、易错题合集
|
数据可视化 数据挖掘 BI
【氚云】还在用Excel表格做数据分析?两步打造数据大脑
还在用Excel表格做数据分析?两步打造数据大脑
464 0
【氚云】还在用Excel表格做数据分析?两步打造数据大脑
|
存储 消息中间件 SQL
看场景、重实操,实时数仓不是“纸上谈兵”
Hologres产品负责人合一谈谈他眼中的实时数仓!
1850 4
看场景、重实操,实时数仓不是“纸上谈兵”
|
SQL 关系型数据库 MySQL
深聊MySQL,从入门到入坟之:如何优化数据导入?
深聊MySQL,从入门到入坟之:如何优化数据导入?
165 0
深聊MySQL,从入门到入坟之:如何优化数据导入?
|
前端开发 大数据 关系型数据库
一次做数据报表的踩坑经历,让我领略了数据同步增量和全量的区别
嗨喽,大家好,我是创作新人,新时代新的农民工小赵,在今年的七月结束了大学生活,目前在一家大数据公司做开发。对于初入职场的同学来说,在实际的工作开发中会遇到各种各样问题,将问题沉淀、输出、总结,才会让后面的路走的越来越轻松。那么,接下来我会通过以下几个方面进行分享。
一次做数据报表的踩坑经历,让我领略了数据同步增量和全量的区别