词法分析
主要是通过DFA有限状态机进行词素分析,并且返回相关的token和token对应的值,供语法分析阶段使用。而语句里面实际上主要是这4个词素show/engine/innodb/status
token(终结符包含)SHOW/ENGINE_SYM /STATUS_SYM,在符号表中包含:
- {SYM("SHOW", SHOW)},
- {SYM("ENGINE", ENGINE_SYM)},
- {SYM("STATUS", STATUS_SYM)},
而词素innodb为标识符IDENT。其次可以查看Lex_hash::get_hash_symbol函数观察语法分析中如何查阅的符号表返回token的。及如下:
#0 Lex_hash::get_hash_symbol (this=0x842a410 <Lex_hash::sql_keywords>, s=0xad36f88 "show engine innodb status", len=4) at /newdata/mysql-8.0.23/sql/sql_lex_hash.cc:75 #1 0x00000000037b144b in find_keyword (lip=0x7fffbc564a58, len=4, function=false) at /newdata/mysql-8.0.23/sql/sql_lex.cc:875 #2 0x00000000037b2b80 in lex_one_token (yylval=0x7fffbc562ef0, thd=0xad326c0) at /newdata/mysql-8.0.23/sql/sql_lex.cc:1480
语法分析:
然后就是进入语法分析,这里用到是yacc/bsion,语法分析主要是采用LALR,最右推导,自底向上通过终结符(token)不断的移入/归约,进行语法的验证,最终生成AST抽象语法树,那么重点就是找到相应的规则和action,其匹配规则流程如下:
start_entry sql_statement simple_statement_or_begin simple_statement show_engine_status_stmt: SHOW ENGINE_SYM engine_or_all STATUS_SYM { $$ = NEW_PTN PT_show_engine_status(@$, $3); } ;
最终规则show_engine_status_stmt的action主要是构造PT_show_engine_status类,其他已经是终结符,而engine_or_all为非终结符,继续匹配规则最后为IDENT为标识符直接输入到$3,我们这里就是字符串innodb
- PT_show_engine_status <-继承 PT_show_engine_base <-继承PT_show_base <-继承 Parse_tree_root
这个节点就是语法树的根节点,没有其他节点了,因为这属于简单的命令。其中对于每种类型的语句通常有一个对应的类型的根节点,都继承来自Parse_tree_root类然后对语法树进行实例化,也就是和具体执行函数关联,其中PT_show_engine_status包含私有成员,
Sql_cmd_show_engine_status m_sql_cmd
而其继承关系如下:
- Sql_cmd_show_engine_status <-继承 Sql_cmd_show_noplan <-继承 Sql_cmd_show <-继承 Sql_cmd_select <-继承 Sql_cmd_dml <-继承Sql_cmd
在实例化的时候PT_show_engine_status::make_cmd并没有太多的动作,检查一下引擎是否存在,然后直接return &m_sql_cmd,返回个LEX::m_sql_cmd存放在thd->lex中,也就是把Sql_cmd_show_engine_status的对象放到thd->lex,那么Sql_cmd类实际上就是解析器和执行器之间的桥梁。
执行阶段:
执行阶段由调用从LEX中获取m_sql_cmd,调用执行函数执行,也就是Sql_cmd的纯虚函数virtual bool execute(THD *thd) = 0;由于Sql_cmd_show_noplan进行了重写,调用的是Sql_cmd_show_noplan的execute,然后由于Sql_cmd_show_noplan的execute调用Sql_cmd_show_engine_status::execute_inner,调入了ha_show_status,开始扫描引擎打印信息,当然最终会调入innobase_show_status函数进行打印innodb的各种信息,如下:
#3 0x0000000004f3ba5b in innodb_show_status (hton=0xaa45010, thd=0xad326c0, stat_print=0x3b7e3d0 <stat_print(THD*, char const*, size_t, char const*, size_t, char const*, size_t)>) at /newdata/mysql-8.0.23/storage/innobase/handler/ha_innodb.cc:18275 #4 0x0000000004f3c818 in innobase_show_status (hton=0xaa45010, thd=0xad326c0, stat_print=0x3b7e3d0 <stat_print(THD*, char const*, size_t, char const*, size_t, char const*, size_t)>, stat_type=HA_ENGINE_STATUS) at /newdata/mysql-8.0.23/storage/innobase/handler/ha_innodb.cc:18660 #5 0x0000000003b7e776 in ha_show_status (thd=0xad326c0, db_type=0xaa45010, stat=HA_ENGINE_STATUS) at /newdata/mysql-8.0.23/sql/handler.cc:7577 #6 0x0000000003889646 in Sql_cmd_show_engine_status::execute_inner (this=0xb498fd8, thd=0xad326c0) at /newdata/mysql-8.0.23/sql/sql_show.cc:467 #7 0x0000000003899a5a in Sql_cmd_show_noplan::execute (this=0xb498fd8, thd=0xad326c0) at /newdata/mysql-8.0.23/sql/sql_show.h:186
这个过程只是简单的语句,也就是规则中定义的simple_statement 比如show/analyze/unlock/lock等等,具体可以参考yacc/bsion规则中的定义,感觉就是那种不需要执行计划的语句,这个类型的语句都可以根据这种方法进行分析。
对于select这种语句显然语法分析的结果是将生成AST树后进行实例化后进入优化器进行执行计划生成,肯定要比简单类型的语句复杂得多,后面我们再做分析。
最后
在执行show engine的时候他的状态几乎就是show processlist的starting 状态,如下:因此如果show engine语句在打印innodb信息的时候出现了很慢的情况,show processlist 看到的应该是starting,如下:
这个时候需要借助其他手段进行分析了比如pstack。
Enjoy MySQL:)