本文首发于公众号:Hunter后端
原文链接:MySQL面试必备二之binlog日志
关于 binlog,常被问到几个面试问题如下:
基于上面这些问题,在看完本篇笔记之后,大概就会有一个清晰的认知了。
以下是本篇笔记目录:
注意:以下所有的操作都在 MySQL 8.0 版本实现。
首先介绍一下,对于一个 SQL 语句,它常常被分为以下几种类型:
而 binlog,即 binary log,是 MySQL 的二进制日志文件,这个文件记录了我们所有的 DDL,DML,TCL 等操作,比如表的创建,数据的插入、更新和删除等。
比如我们下面执行的创建数据库、表,插入、更新数据,在 binlog 配置开启的情况下,都会被记录到 binlog 中:
CREATE DATABASE db_test DEFAULT CHARACTER set utf8;
create table users (
id int not null auto_increment primary key,
name varchar(20) not null,
email varchar(100) default ""
);
insert into users (name, email) values("张三", "12345@qq.com"), ("李四", "345123@qq.com");
update users set email = "4123@qq.com" where id=1;
我们可以通过下面的命令查看 binlog 日志是否打开,以及存储的文件夹:
show variables like '%log_bin%';
显示的内容如下:
其主要字段含义分别如下:
log_bin_basename 指向的是 binlog 存储的文件夹,在后面我们查看 binlog 具体内容的时候,会需要进入到这个文件夹进行查看。
我们可以通过下面的命令查看全部的 binlog 文件,在这里,一个 binlog 版本就是一个文件:
show binary logs;
show master logs;
上面这两条命令都可以显示出 binlog 文件,内容显示如下:
binlog 记录的类型有三种,一种是 STATEMENT
,一种是 ROW
,一种是 MIXED
。
在介绍其具体含义前,我们先介绍一下如何查看和修改 binlog 类型,以及查看 binlog 内容。
我们可以通过下面的命令查看 binlog 保存的类型:
SHOW VARIABLES LIKE 'binlog_format';
输出内容如下:
表示 binlog 保存的类型是 ROW
修改 binlog 类型我们到 binlog 文件中修改,这里我们修改 mysqld.cnf,修改 binlog_format 的值,没有这个配置项的话加一行,如下:
binlog_format = STATEMENT
保存之后重启 MySQL,再次查询就可以看到这个参数有变化了:
其含义和示例分别如下:
STATEMENT 类型记录的是执行 SQL 语句的内容,比如 INSERT、UPDATE、DELETE 等语句本身。
比如:
insert into users (name, email) values("张三", "12345@qq.com"), ("李四", "345123@qq.com");
update users set email = "4123@qq.com" where id=1;
在 STATEMENT 类型下,上面这两句 SQL 在 binlog 中记录的就是这几句 SQL 本身。
通过查询 binlog 日志,比如我们下面执行的语句,可以看到输出的 info 那一列有我们刚刚执行的 insert 和 update 语句:
show binlog events in 'binlog.000017';
我们也可以使用 mysqlbinlog 命令在 shell 对这个日志文件进行查看:
mysqlbinlog binlog.000017
就可以看到输出的信息里会包含我们前面执行的两条命令
ROW 类型记录的是执行 SQL 语句前后的变更,会包含变更前后完整数据行的内容。
将 binlog_format 的配置改为 ROW 后,重新执行几条插入或者更新数据的命令,在 MySQL 客户端执行 show binlog events
命令,就可以看到日志记录里有对应的记录,但是这里输出的信息并不全,我们还是可以使用 mysqlbinlog
来查看。
mysqlbinlog binlog.000018
但是可以看到输出的内容里,数据的变化都被处理过:
BEGIN
/*!*/;
# at 323
#240415 1:03:05 server id 1 end_log_pos 386 CRC32 0x0e2e4dda Table_map: `db_test`.`users` mapped to number 93
# has_generated_invisible_primary_key=0
# at 386
#240415 1:03:05 server id 1 end_log_pos 474 CRC32 0xcebf294e Update_rows: table id 93 flags: STMT_END_F
BINLOG '
SQwcZhMBAAAAPwAAAIIBAAAAAF0AAAAAAAEAB2RiX3Rlc3QABXVzZXJzAAMDDw8EPAAsAQQBAQAC
ASHaTS4O
SQwcZh8BAAAAWAAAANoBAAAAAF0AAAAAAAEAAgAD//8AAQAAAAblvKDkuIkLADQxMjNAcXEuY29t
AAEAAAAG5byg5LiJDQAxMTExMTNAcXEuY29tTim/zg==
'/*!*/;
# at 474
#240415 1:03:05 server id 1 end_log_pos 505 CRC32 0xd7ae1d48 Xid = 55
COMMIT/*!*/;
会看不到真实记录的信息,我们直接使用 cat 或者 vim 命令查看文件内容,可以从其中窥得一二,可以看到一些我们修改或者新增的字段内容。
或者我们还是可以使用 mysqlbin,但是加上 -vv 参数,我们可以看到原始执行的 SQL 语句,类似于下面的内容:
BINLOG '
2RAcZhMBAAAAPwAAANUCAAAAAF0AAAAAAAEAB2RiX3Rlc3QABXVzZXJzAAMDDw8EPAAsAQQBAQAC
ASGMO256
2RAcZh4BAAAAPwAAABQDAAAAAF0AAAAAAAEAAgAD/wADAAAABueOi+S6lA4AMTIxMjM0NUBxcS5j
b22PdURn
'/*!*/;
### INSERT INTO `db_test`.`users`
### SET
### @1=3 /* INT meta=0 nullable=0 is_null=0 */
### @2='王五' /* VARSTRING(60) meta=60 nullable=0 is_null=0 */
### @3='1212345@qq.com' /* VARSTRING(300) meta=300 nullable=1 is_null=0 */
MIXED
类型则是 STATEMENT
和 ROW
两种类型的综合,它会根据具体的情况来选择 STATEMENT
或者是 ROW
其中一种类型来进行存储。
比如说涉及函数或者一些比较复杂和无法还原的操作时,就会选择 ROW 格式来存储变更的数据行,如果是一些比较简单的插入、更新或者删除操作,那么则会选择 STATEMENT 格式来进行存储。
关于这三种 binlog 类型的优缺点总结如下:
STATEMENT 记录的 SQL 语句,适用于简单 SQL 语句的场景,比如单条数据的插入、更新、删除等。
优点是 binlog 日志文件相对较小,而且可读性强,因为可以直接查看 SQL 语句了解操作
但同时存在的问题是某些复杂操作可能会出现不一致的情况。
ROW 类型存储的是数据行的变更,会包含变更前后的内容,适用于需要精确记录数据行变更的场景。
优点是可以精确记录数据行的变更情况,避免 STATEMENT 类型可能出现的不一致的问题。
缺点则是因为记录了完整的数据行内容,所以可能导致文件较大,而且可读性较差,比如我们前面使用 -vv 参数才能了解其执行的 SQL 语句。
MIXED 则会根据具体情况自动选择 STATEMENT 或 ROW 类型来记录数据更改。
优点是兼顾了 STATEMENT 和 ROW 两种类型的有点,既可以节约空间,也可以精确记录数据变更。
缺点的话,因为是系统是自动选择类型来记录,所以可能存在选择不够理想的记录方式从而导致一些不一致或者是性能问题。
对于 MySQL 中的操作,我们有时候可能会误操作,导致会意外的更新或者删除一些数据、或者是删除表、删除库等,那么这些操作如何使用 binlog 来进行恢复呢,以下做一个简单的介绍。
在介绍如何恢复数据前,先介绍前面的 binlog 文件保存的机制。
对于 MySQL 而言,一个 binlog 文件内容为从某一刻开始保存的日志记录,当我们使用 sudo service mysql restart
重启操作时,系统会自动为我们新建一个 binlog 日志文件,重启之后的所有数据操作都会被放到新的 binlog 文件里。
除了 MySQL 的手动重启,我们还可以使用 flush logs
操作来手动新建一个 binlog 日志。
下面正式开始介绍如何使用 binlog 恢复数据。
恢复数据的前提就是我们已经打开了 binlog 日志记录配置,而且最好有一个备份库,这个备份库的作用是用于在误操作数据后可以快速从最近的时间点进行恢复。
备份库的内容则是与当前生产库,或者说是目标库落后一定时间间隔的数据,来源可以是我们每天或者更小时间粒度对目标数据库的定时保存。
有了 binlog 日志和备份数据库的基础之后,比如我们误操作更新了大范围的数据,或者删除了某张表,下面便开始恢复数据的步骤。
如果可能的话,应该尽量先停止往 MySQL 对应表的写入操作,避免数据污染操作。
执行 flush logs
操作,重新创建一个 binlog,将误操作确定在某个 binlog 中。
确定备份库的时间点,然后找到包含失误操作的 binlog,导出从备份库的时间点开始一直到发生误操作的时间点前的 binlog。
将这部分 binlog 在备份库重新执行,这样,我们的备份库就可以恢复数据到发生误操作的前一个时间点。
如果我们没有第一步停止写入更新的操作,就可以跳过误操作的 SQL,将发生误操作后的 SQL 语句也导入到备份库,这样备份库就拥有了不发生误操作情况下的全部数据。
将备份库的数据替换到目标库,然后重新开启服务。
以上,就是使用 binlog 进行恢复数据的大致操作,具体图示见下图:
尽管恢复数据在某些情况下是可行的,但是我们仍然要注意尽量避免在生产中直接操作数据库,而应该尽量通过业务代码来实现对数据库的操作。
介绍一下 MySQL 中关于逻辑日志与物理日志的区别。
所谓逻辑日志指的是记录数据库操作的日志,比如 INSERT、UPDATE 等逻辑操作。
而物理日志则是指记录数据的各种存储细节,比如 MySQL 具体某个数据页的写入和修改数据等。
所以,binlog 则属于逻辑日志。
binlog 作为 MySQL 日志的一种,有很多作用,比如前面介绍的数据备份与恢复,还可以用于数据同步,比如主从复制模式下将主库的更改操作操作就是通过 binlog 的方式来同步到从库的。
当然,通过 binlog 本身我们可以还原所有的数据操作,我们也可以针对这部分进行对应的数据统计和分析等。
以上就是本篇笔记关于 binlog 日志的全部内容。
如果想获取更多后端相关文章,可扫码关注阅读: