【每日打卡】应届生、跳槽者必看JAVA面试题-数据库篇(一)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 【每日打卡】应届生、跳槽者必看JAVA面试题-数据库篇(一)

image.png

  • 秋招将至,特意收集了最新的面试题目,坚持每日学习、打卡,Offer自然来!
  • 题目会持续更新,且保证有质量,期待你的参与,一起打卡,一起进步!

image.png

一: Mysql的存储引擎分类


 InnoDB: 支持事务,行锁及无锁读提高了并发的效率,为了数据的完整性,支持外键



 MyISAM: 不支持事务和外键,表级别锁,优势在于访问速度快,一般用于只读或者以读为主的数据场景。



 Memory: 在内存中存储所有数据,应用于对非关键数据的快速查询,默认使用HASH索引,但是服务关闭,数据会消失。



 CSV: 它的表是以逗号分隔的文本文件,可以允许以CSV格式导入导出,以相同的格式与脚本和应用进行交互,所有列必须不能为null,不支持索引,可以对数据文件直接编辑,保存文本文件内容


 NDB: 又叫NDBCLUSTER – 这种集群数据引擎适用于需要最高程度的正常运行和可用性的应用,但是MySql5.6暂不支持



 设置存储引擎方式: create table 表名()engine=innodb/myisam



二: InnoDB和MyISAM的区别


 (一) InnoDB的特点:



 1、支持事务处理、ACID事务特性;



 2、实现了SQL标准的四种隔离级别;



 3、支持行级锁和外键约束;



 4、可以利用事务日志进行数据恢复。



 5、锁级别为行锁,行锁优点是适用于高并发的频繁表修改,高并发是性能优于 MyISAM。缺点是系统消耗较大。



 6、索引不仅缓存自身,也缓存数据,相比 MyISAM 需要更大的内存。



 (二) MyISAM的特点:



 1、锁级别为表锁,表锁优点是开销小,加锁快;缺点是锁粒度大,发生锁冲动概率较高,容纳并发能力低,这个引擎适合查询为主的业务。



 2、此引擎不支持事务,也不支持外键。



 3、INSERT和UPDATE操作需要锁定整个表;



 3、它存储表的行数,于是SELECT COUNT(*) FROM TABLE时只需要直接读取已经保存好的值而不需要进行全表扫描。



 (三) 适用场景



 MyISAM适合: (1)做很多count 的计算;(2)插入不频繁,查询非常频繁;(3)没有事务。



 InnoDB适合: (1)可靠性要求比较高,或者要求事务;(2)表更新和查询都相当的频繁,并且表锁定的机会比较大的情况。



三: 如何选择Mysql的存储引擎


 根据系统的业务要求选择,首先要了解索引的特点



 InnoDB: 如果对数据的完整性要求比较高,且除了插入和查询外,还存在着许多更新和删除操作的,适用于选择InnoDB,InnoDB也是Mysql现在默认的存储引擎。



 MyISAM: 以只读或者插入操作为主,很少的更新和删除操作的,并且对数据完整性要求不高的可以选择。



四: 数据库语句的执行顺序


 (一): 执行顺序



 from -> on -> join -> where -> group by -> having -> count(聚合函数) -> select -> distinct -> order by -> limit



 (二): 执行步骤解释:



 (1)、from: 表示数据的来源



 (2)、on: 表示数据的关联表,执行完后生成一个临时表t1,提供给下一步的操作使用



 (3)、join: 将join表的数据补充到on执行完成的临时表t1中,如: left join则将坐标剩余的数据添加到临时表t1中,如果join超过3个,则重复on…join之间的步骤。



 (4)、where: 根据携带的条件,从临时表中筛选出符合条件的数据,并生成临时表t2。



 (5)、groub by: 根据携带的条件,将临时表t2进行相应的数据分组,并形成临时表t3,如果语句包含了group by则它后面的字段必须出现在select中或者出现在聚合函数中,否则会报SQL语法错误。



 (6)、having: 筛选分组后临时表t3的数据,得到临时表t4。



 (7)、count等聚合函数: 对临时表进行指定字段的聚合函数操作,形成临时表t5。



 (8)、select: 从临时表筛选出需要返回的数据,形成临时表t6。



 (9)、distinct: 对临时表t6进行指定的去重筛选,形成临时表t7。



 (10)、order by: 对临时表t7排序,形成临时表t8。



 (11)、limit: 筛选返回的数据条数



 想要了解更多的执行过程的问题,可以查看之前专门解析执行过程的文章: 你真的懂使用Group by?



五: Mysql和PostGreSQL有什么区别?


 回答思路:


 面试官询问这个问题,原因可能是你在自己的简历中有描述使用到两种不同的数据,主要考察两个方面。



 一个是考察你在工作中是否善于思考,一般数据库的选型都是公司的架构师或者组长选择,你可能只是一名组员,只需要负责使用即可,但是,如果你能够主动去思考为什么会选择使用这个数据库而不是使用其他数据库,了解两者的一些差别,这个会很给面试官添加印象分,证明你在平常的工作中是善于去思考的。



 第二个考察的方面,是看你是否能够结合项目或者公司现在有的业务去讲解使用当前数据库的一些利弊,这同样也是一个加分项,毕竟技术的选型最后还是要考虑业务的支撑,因此,这个问题主要从这两方面回答会有很不错的效果。



 第一方面:



   1、Mysql中text类型有不同的限制(既:small text middle text…),但是Pg没有这种限制。



   2、MySQL 里需要 utf8mb4 才能显示 emoji 的坑, Pg 就没这个坑。



   3、MySQL 不支持 OVER 子句, 而 Pg 支持. OVER 子句能简单的解决 “每组取 top 5” 的这类问题。



   4、pg支持更多的数据类型如:jsonb array等,对地理信息处理扩展更好的支持,有更多的数据源。



   5、在高并发读写,负载逼近极限下,PG的性能指标仍可以维持双曲线甚至对数曲线,到顶峰之后不再下降,而 MySQL 明显出现一个波峰后下滑



 第二方面:



 可以结合项目的一些业务场景来回答体现使用这种数据库的优势。如使用PostgreSQL,回答如下。



 因为这个项目的技术选型是由我们公司架构师进行选择的,但是,我也通过项目和公司的业务了解到一些选择PG数据库的好处,我们的公司主要项目是公安的相关系统,系统中涉及到很多地理位置信息数据的处理,PG数据库对地理信息的存储和拓展都有很好的支持,这也是我们项目中选择PG数据库的一个原因等等。



六: 事务的隔离级别和存在的问题


 (一): Read Uncommited(读未提交)



   1、定义: 可以读取到其他没有提交的事务的内容。



   2、并发情况下存在的问题: 脏读,不可重复读,幻读



 (二): Read Committed(读已提交)



   1、定义: 可以读取到其他提交的事务的内容。



   2、并发情况下存在的问题: 不可重复读,幻读



 (三): Repeatbale Read(可重复读)



   1、定义: 同一个事务下可以重复读取,数据都一样。



   2、并发情况下存在的问题: 幻读(采用多版本并发控制(MVCC)机制解决幻读问题。)



 (四): serialized(串行化)



   1、可读,不可写。像java中的锁,写数据必须等待另一个事务结束。



   2、不存在问题



七: 事务并发情况下出现的问题和解决方案


 (一): 出现的问题:



    1、更新丢失: 并发事务时,可能出现多个事务同时更新同一条记录,导致前一个事务更新的被后面事务的更新覆盖。



    2、脏读: 一个事务读取到另一个事务没有提交的数据



    3、不可重复读: 在同一个事务中,前后读取的相同的条件下的数据不一样(在并发情况下另外一个事务对数据进行了修改)



    4、幻读: 同一个事务下,前后读取的数据不一样(在并发情况下,另外的事务对数据进行了删除或者增加的操作)



 (二): 解决方案:



    1、更新丢失更新问题可以通过应用层来解决,如加锁。



    2、脏读、不可重复读、幻读通过数据库提供的隔离机制进行处理,实现隔离机制的方法如下: 加读写锁,一致性快照读即MVCC。



八: 数据库范式的理解


 1、第一范式: 每个列都不能再拆分



 2、第二范式: 在第一范式的基础上,非主键列完全依赖于主键,而不能依赖于主键的一部分。



 举例:

    如关系模型(职工号,姓名,职称,项目号,项目名称)中,职工号->(依赖)姓名,职工号->职称,而项目号->项目名称(项目名称依赖于项目号,但是项目号并不是这个关系模型中的主键)。显然依赖关系不满足第二范式,常用的解决办法是拆分表格,比如拆分为职工信息表和项目信息表。



  3、第三范式: 在第二范式的基础上,非主键列只依赖于主键,不依赖于其他非主键(不存在传递依赖)



 举例:

  如:Student表(学号,姓名,年龄,性别,所在院校,院校地址,院校电话)这样一个表结构,就存在上述关系。 学号–> 所在院校 --> (院校地址,院校电话)。我们应该拆开来,如下:

(学号,姓名,年龄,性别,所在院校)–(所在院校,院校地址,院校电话)



 总结:


    第一范式:具有原子性



    第二范式:主键列与非主键列遵循完全函数依赖关系



    第三范式:非主键列之间没有传递函数依赖关系



九: 数据库中的约束种类


  1、NOT NULL 非空约束



  2、UNIQUE: 空间内容不能重复、一个表可以存在多个



  3、PRIMARY KEY: 一个表只能存在一个,且不能重复,不能为空



  4、FOREIGN KEY: 用于关联表链接得字段,防止非法数据插入外键列



  5、CHECK: 用于控制字段得值范围



十: SQL中得五种关联查询


  1、交叉查询(笛卡尔积 cross join)



  2、内连接(Inner join)



  3、外连接(left join/right join)



  4、联合查询(union/union all)



  5、全连接(full join) - MYSQL不支持



十一: mysql中得exist和in的区别


 (一): 含义



    mysql中的in语句是把外表和内表作hash 连接,而exists语句是对外表作loop循环,每次loop循环再对内表进行查询。



 (二): 特点



    1、如果查询的两个表大小相当,那么用in和exists差别不大。



    2、如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in。



    3、not in 和not exists:如果查询语句使用了not in,那么内外表都进行全表扫描,没有用到索引;而not extsts的子查询依然能用到表上的索引。所以无论那个表大,用not exists都比not in要快。



十二: 为什么varchar默认长度是255


 1、mysql要求varchar一个行的定义长度不能超过65535bytes,这个大小包括了字段占用的空间在内,text和blob等大字段除外(注: 单行最大限制指的就是一张表中所有字段的所设置的长度总和不得超过65535字节)



 2、InnoDB存储引擎的表索引的前缀长度最长是: 767字节,如果需要创建索引,不能超过这个长度。而utf-8编码时: 255 * 3(一个字符占3个字节) = 765字节,恰恰是能够建立索引的最大值。单列索引的长度的限制(5.6里面默认不能超过767bytes,5.7不超过3072bytes)



 3、总结: varchar(255)不是最优的字符长度,最优的需要按照具体情况来,但是这个长度可以保证你能少出错的一个不错的默认值。

image.png

  最后,感谢大家的阅读,必看面试题系列会持续更新的,如果觉的文章对你有帮助,不要忘记一键三连哦,你的支持是我创建更多优质文章的动力,非常感谢


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2月前
|
关系型数据库 MySQL Java
【IDEA】java后台操作mysql数据库驱动常见错误解决方案
【IDEA】java后台操作mysql数据库驱动常见错误解决方案
106 0
|
1月前
|
XML Java 数据库连接
性能提升秘籍:如何高效使用Java连接池管理数据库连接
在Java应用中,数据库连接管理至关重要。随着访问量增加,频繁创建和关闭连接会影响性能。为此,Java连接池技术应运而生,如HikariCP。本文通过代码示例介绍如何引入HikariCP依赖、配置连接池参数及使用连接池高效管理数据库连接,提升系统性能。
62 5
|
1月前
|
JSON Java 关系型数据库
Java更新数据库报错:Data truncation: Cannot create a JSON value from a string with CHARACTER SET 'binary'.
在Java中,使用mybatis-plus更新实体类对象到mysql,其中一个字段对应数据库中json数据类型,更新时报错:Data truncation: Cannot create a JSON value from a string with CHARACTER SET 'binary'.
56 4
Java更新数据库报错:Data truncation: Cannot create a JSON value from a string with CHARACTER SET 'binary'.
|
1月前
|
SQL Java 数据库连接
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率。本文介绍了连接池的工作原理、优势及实现方法,并提供了HikariCP的示例代码。
54 3
|
2月前
|
Java 关系型数据库 MySQL
如何用java的虚拟线程连接数据库
本文介绍了如何使用Java虚拟线程连接数据库,包括设置JDK版本、创建虚拟线程的方法和使用虚拟线程连接MySQL数据库的示例代码。
65 6
如何用java的虚拟线程连接数据库
|
1月前
|
存储 Java 关系型数据库
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践,包括连接创建、分配、复用和释放等操作,并通过电商应用实例展示了如何选择合适的连接池库(如HikariCP)和配置参数,实现高效、稳定的数据库连接管理。
66 2
|
1月前
|
Java 数据库连接 数据库
如何构建高效稳定的Java数据库连接池,涵盖连接池配置、并发控制和异常处理等方面
本文介绍了如何构建高效稳定的Java数据库连接池,涵盖连接池配置、并发控制和异常处理等方面。通过合理配置初始连接数、最大连接数和空闲连接超时时间,确保系统性能和稳定性。文章还探讨了同步阻塞、异步回调和信号量等并发控制策略,并提供了异常处理的最佳实践。最后,给出了一个简单的连接池示例代码,并推荐使用成熟的连接池框架(如HikariCP、C3P0)以简化开发。
55 2
|
1月前
|
Java 数据库连接 数据库
优化之路:Java连接池技术助力数据库性能飞跃
在Java应用开发中,数据库操作常成为性能瓶颈。频繁的数据库连接建立和断开增加了系统开销,导致性能下降。本文通过问题解答形式,深入探讨Java连接池技术如何通过复用数据库连接,显著减少连接开销,提升系统性能。文章详细介绍了连接池的优势、选择标准、使用方法及优化策略,帮助开发者实现数据库性能的飞跃。
33 4
|
1月前
|
Java 数据库连接 数据库
深入探讨Java连接池技术如何通过复用数据库连接、减少连接建立和断开的开销,从而显著提升系统性能
在Java应用开发中,数据库操作常成为性能瓶颈。本文通过问题解答形式,深入探讨Java连接池技术如何通过复用数据库连接、减少连接建立和断开的开销,从而显著提升系统性能。文章介绍了连接池的优势、选择和使用方法,以及优化配置的技巧。
41 1
|
1月前
|
Java 数据库连接 数据库
Java连接池在数据库性能优化中的重要作用。连接池通过预先创建和管理数据库连接,避免了频繁创建和关闭连接的开销
本文深入探讨了Java连接池在数据库性能优化中的重要作用。连接池通过预先创建和管理数据库连接,避免了频繁创建和关闭连接的开销,显著提升了系统的响应速度和吞吐量。文章介绍了连接池的工作原理,并以HikariCP为例,展示了如何在Java应用中使用连接池。通过合理配置和优化,连接池技术能够有效提升应用性能。
57 1