本章将介绍 TiDB 中的各种超时,为排查错误提供依据。
TiDB 的事务的实现采用了 MVCC(多版本并发控制)机制,当新写入的数据覆盖旧的数据时,旧的数据不会被替换掉,而是与新写入的数据同时保留,并以时间戳来区分版本。TiDB 通过定期 GC 的机制来清理不再需要的旧数据。
默认配置下 TiDB 可以保障每个 MVCC 版本(一致性快照)保存 10 分钟,读取时间超过 10 分钟的事务,会收到报错 GC life time is shorter than transaction duration
。
当用户确信自己需要更长的读取时间时,比如在使用了 Mydumper 做全量备份的场景中(Mydumper 备份的是一致性的快照),可以通过调整 TiDB 中mysql.tidb
表中的 tikv_gc_life_time
的值来调大 MVCC 版本保留时间,需要注意的是 tikv_gc_life_time 的配置是立刻影响全局的,调大它会为当前所有存在的快照增加生命时长,调小它会立即缩短所有快照的生命时长。过多的 MVCC 版本会拖慢 TiKV 的处理效率,在使用 Mydumper 做完全量备份后需要及时把 tikv_gc_life_time 调整回之前的设置。
更多关于 GC 的信息,请参考 GC 机制简介文档。
垃圾回收 (GC) 不会影响到正在执行的事务。但悲观事务的运行仍有上限,有基于事务超时的限制(TiDB 配置文件 [performance] 类别下的 max-txn-ttl
修改,默认为 60 分钟)和基于事务使用内存的限制。
形如 INSERT INTO t10 SELECT * FROM t1
的 SQL 语句,不会受到 GC 的影响,但超过了 max-txn-ttl
的时间后,会由于超时而回滚。
TiDB 还提供了一个系统变量来限制单条 SQL 语句的执行时间,仅对“只读”语句生效:max_execution_time
,它的默认值为 0,表示无限制。max_execution_time
的单位为 ms,但实际精度在 100ms 级别,而非更准确的毫秒级别。
MySQL jdbc 的查询超时设置 setQueryTimeout()
对 TiDB 不起作用。这是因为现实客户端感知超时时,向数据库发送一个 KILL 命令。但是由于 tidb-server 是负载均衡的,为防止在错误的 tidb-server 上终止连接,tidb-server 不会执行这个 KILL。这时就要用 MAX_EXECUTION_TIME
实现查询超时的效果。
TiDB 提供了三个与 MySQL 兼容的超时控制参数:
28800
秒,即空闲超时为 8 小时。在 v5.4 之前,默认值为 0
,即没有时间限制。但在实际生产环境中,空闲连接和一直无限执行的 SQL 对数据库和应用都有不好的影响。你可以通过在应用的连接字符串中配置这两个 session 级的变量来避免空闲连接和执行时间过长的 SQL 语句。例如,设置 sessionVariables=wait_timeout=3600(1 小时)
和 sessionVariables=max_execution_time=300000(5 分钟)
。