[转帖]Titan 配置

titan,配置 · 浏览次数 : 0

小编点评

## Titan 配置 RocksDB 存储引擎 **方法一:使用 TiUP 部署的集群** 1. 执行 `tiup cluster edit-config ${cluster_name}` 命令,开启 Titan。 2. 编辑 TiKV 的配置文件,设置 `rocksdb.titan.enabled: true`。 3. 重新加载配置,并在线滚动重启 TiKV。 **方法二:直接编辑 TiKV 配置文件** 1. 打开 TiKV 配置文件(例如 `tikv.yaml`)。 2. 设置 `rocksdb.titan.enabled: true`。 3. 保存配置文件并重启 TiKV。 **注意** * 在不开启 Titan 功能的情况下,RocksDB 无法读取已经迁移到 Titan 的数据。 * 当打开过 Titan 的 TiKV 实例上错误地关闭了 Titan(误设置 `rocksdb.titan.enabled = false`),启动 TiKV 会失败。 **相关参数介绍** * `max-background-gc`: Titan GC 线程池大小,默认值为 1。 * `min-blob-size`: Titan 中每个 blob 文件的最小大小,默认值为 1KB。 * `blob-file-compression`: Titan 中 blob 文件的缓存大小,默认值为 `lz4`。

正文

https://www.bookstack.cn/read/TiDB-4.0/storage-engine-titan-configuration.md

 

开启 Titan

Titan 对 RocksDB 兼容,也就是说,使用 RocksDB 存储引擎的现有 TiKV 实例可以直接开启 Titan。

  • 方法一:如果使用 TiUP 部署的集群,开启的方法是执行 tiup cluster edit-config ${cluster-name} 命令,再编辑 TiKV 的配置文件。编辑 TiKV 配置文件示例如下:

    1. tikv:
    2. rocksdb.titan.enabled: true

    重新加载配置,同时也会在线滚动重启 TiKV:

    1. tiup cluster reload ${cluster-name} -R tikv

    具体命令,可参考通过 TiUP 修改配置参数

  • 方法二:直接编辑 TiKV 配置文件开启 Titan(生产环境不推荐)。

    1. [rocksdb.titan]
    2. enabled = true

开启 Titan 以后,原有的数据并不会马上移入 Titan 引擎,而是随着前台写入和 RocksDB compaction 的进行,逐步进行 key-value 分离并写入 Titan。可以通过观察 TiKV Details - Titan kv - blob file size 监控面版确认数据保存在 Titan 中部分的大小。

如果需要加速数据移入 Titan,可以通过 tikv-ctl 执行一次全量 compaction,具体参考手动 compact

警告:

在不开启 Titan 功能的情况下,RocksDB 无法读取已经迁移到 Titan 的数据。如果在打开过 Titan 的 TiKV 实例上错误地关闭了 Titan(误设置 rocksdb.titan.enabled = false),启动 TiKV 会失败,TiKV log 中出现 You have disabled titan when its data directory is not empty 错误。如需要关闭 Titan,参考关闭 Titan 一节。

相关参数介绍

使用 TiUP 调整参数,请参考修改配置参数

  • Titan GC 线程数。

    当从 TiKV Details - Thread CPU - RocksDB CPU 监控中观察到 Titan GC 线程长期处于满负荷状态时,应该考虑增加 Titan GC 线程池大小。

    1. [rocksdb.titan]
    2. max-background-gc = 1
  • value 的大小阈值。

    当写入的 value 小于这个值时,value 会保存在 RocksDB 中,反之则保存在 Titan 的 blob file 中。根据 value 大小的分布,增大这个值可以使更多 value 保存在 RocksDB,读取这些小 value 的性能会稍好一些;减少这个值可以使更多 value 保存在 Titan 中,进一步减少 RocksDB compaction。

    1. [rocksdb.defaultcf.titan]
    2. min-blob-size = "1KB"
  • Titan 中 value 所使用的压缩算法。Titan 中压缩是以 value 为单元的。

    1. [rocksdb.defaultcf.titan]
    2. blob-file-compression = "lz4"
  • Titan 中 value 的缓存大小。

    更大的缓存能提高 Titan 读性能,但过大的缓存会造成 OOM。建议在数据库稳定运行后,根据监控把 RocksDB block cache (storage.block-cache.capacity) 设置为 store size 减去 blob file size 的大小,blob-cache-size 设置为 内存大小 * 50% 再减去 block cache 的大小。这是为了保证 block cache 足够缓存整个 RocksDB 的前提下,blob cache 尽量大。

    1. [rocksdb.defaultcf.titan]
    2. blob-cache-size = 0
  • 当一个 blob file 中无用数据(相应的 key 已经被更新或删除)比例超过以下阈值时,将会触发 Titan GC 。

    1. discardable-ratio = 0.5

    将此文件有用的数据重写到另一个文件。这个值可以估算 Titan 的写放大和空间放大的上界(假设关闭压缩)。公式是:

    写放大上界 = 1 / discardable_ratio

    空间放大上界 = 1 / (1 - discardable_ratio)

    可以看到,减少这个阈值可以减少空间放大,但是会造成 Titan 更频繁 GC;增加这个值可以减少 Titan GC,减少相应的 I/O 带宽和 CPU 消耗,但是会增加磁盘空间占用。

  • 以下选项限制 RocksDB compaction 的 I/O 速率,以达到在流量高峰时,限制 RocksDB compaction 减少其 I/O 带宽和 CPU 消耗对前台读写性能的影响。

    当开启 Titan 时,该选项限制 RocksDB compaction 和 Titan GC 的 I/O 速率总和。当发现在流量高峰时 RocksDB compaction 和 Titan GC 的 I/O 和/或 CPU 消耗过大,可以根据磁盘 I/O 带宽和实际写入流量适当配置这个选项。

    1. [rocksdb]
    2. rate-bytes-per-sec = 0

关闭 Titan(实验功能)

通过设置 rocksdb.defaultcf.titan.blob-run-mode 参数可以关闭 Titan。blob-run-mode 可以设置为以下几个值之一:

  • 当设置为 normal 时,Titan 处于正常读写的状态。
  • 当设置为 read-only 时,新写入的 value 不论大小均会写入 RocksDB。
  • 当设置为 fallback 时,新写入的 value 不论大小均会写入 RocksDB,并且当 RocksDB 进行 compaction 时,会自动把所碰到的存储在 Titan blob file 中的 value 移回 RocksDB。

当需要关闭 Titan 时,可以设置 blob-run-mode = "fallback",并通过 tikv-ctl 执行全量 compaction。此后通过监控确认 blob file size 降到 0 以后,可以更改 rocksdb.titan.enabled = false 并重启 TiKV。

警告:

关闭 Titan 是实验性功能,非必要不建议使用。

Level Merge(实验功能)

TiKV 4.0 中 Titan 提供新的算法提升范围查询性能并降低 Titan GC 对前台写入性能的影响。这个新的算法称为 Level Merge。Level Merge 可以通过以下选项开启:

  1. [rocksdb.defaultcf.titan]
  2. level-merge = true

开启 Level Merge 的好处如下:

  • 大幅提升 Titan 的范围查询性能。
  • 减少了 Titan GC 对前台写入性能的影响,提升写入性能。
  • 减少 Titan 空间放大,减少磁盘空间占用(默认配置下的比较)。

相应地,Level Merge 的写放大会比 Titan 稍高,但依然低于原生的 RocksDB。

与[转帖]Titan 配置相似的内容:

[转帖]Titan 配置

https://www.bookstack.cn/read/TiDB-4.0/storage-engine-titan-configuration.md 开启 Titan Titan 对 RocksDB 兼容,也就是说,使用 RocksDB 存储引擎的现有 TiKV 实例可以直接开启 Titan。

[转帖]JMeter学习(二)搭建骨架--JMeter重要组件

https://www.cnblogs.com/tian-yong/p/4460665.html JMeter的属性和变量 JMeter属性统一定义在jmeter.properties文件中。JMeter属性在测试脚本的任何地方都是可见的(全局),通常被用来定义 一些JMeter使用的默认值。例如,

[转帖]

Linux ubuntu20.04 网络配置(图文教程) 因为我是刚装好的最小系统,所以很多东西都没有,在开始配置之前需要做下准备 环境准备 系统:ubuntu20.04网卡:双网卡 网卡一:供连接互联网使用网卡二:供连接内网使用(看情况,如果一张网卡足够,没必要做第二张网卡) 工具: net-to

[转帖]

https://cloud.tencent.com/developer/article/2168105?areaSource=104001.13&traceId=zcVNsKTUApF9rNJSkcCbB 前言 Redis作为高性能的内存数据库,在大数据量的情况下也会遇到性能瓶颈,日常开发中只有时刻

[转帖]ISV 、OSV、 SIG 概念

ISV 、OSV、 SIG 概念 2022-10-14 12:29530原创大杂烩 本文链接:https://www.cndba.cn/dave/article/108699 1. ISV: Independent Software Vendors “独立软件开发商”,特指专门从事软件的开发、生产、

[转帖]Redis 7 参数 修改 说明

2022-06-16 14:491800原创Redis 本文链接:https://www.cndba.cn/dave/article/108066 在之前的博客我们介绍了Redis 7 的安装和配置,如下: Linux 7.8 平台 Redis 7 安装并配置开机自启动 操作手册https://ww

[转帖]HTTPS中间人攻击原理

https://www.zhihu.com/people/bei-ji-85/posts 背景 前一段时间,公司北京地区上线了一个HTTPS防火墙,用来监听HTTPS流量。防火墙上线之前,邮件通知给管理层,我从我老大那里听说这个事情的时候,说这个有风险,然后意外地发现,很多人原来都不知道HTTPS防

[转帖]关于字节序(大小端)的一点想法

https://www.zhihu.com/people/bei-ji-85/posts 今天在一个技术群里有人问起来了,当时有一些讨论(不完全都是我个人的观点),整理一下: 为什么网络字节序(多数情况下)是大端? 早年设备的缓存很小,先接收高字节能快速的判断报文信息:包长度(需要准备多大缓存)、地

[转帖]awk提取某一行某一列的数据

https://www.jianshu.com/p/dbcb7fe2da56 1、提取文件中第1列数据 awk '{print $1}' filename > out.txt 2、提取前2列的文件 awk `{print $1,$2}' filename > out.txt 3、打印完第一列,然后打

[转帖]awk 中 FS的用法

https://www.cnblogs.com/rohens-hbg/p/5510890.html 在openwrt文件 ar71xx.sh中 查询设备类型时,有这么一句, machine=$(awk 'BEGIN{FS="[ \t]+:[ \t]"} /machine/ {print $2}' /