详解GaussDB(DWS)中的行执行引擎

gaussdb,dws · 浏览次数 : 0

小编点评

**行执行引擎详解** **一、概述** GaussDB(DWS)包含三大引擎，一是SQL执行引擎，二是执行引擎，三是存储引擎。其中，执行引擎包含行执行引擎和列执行引擎，负责将数据从存储引擎中读取出来并进行计算处理后返回给客户端。 **二、行执行引擎** **2.1框架** 行执行引擎的框架包括以下部分： * 算子：执行树上的每个节点。 * 连接算子：连接表之间的关系。 * 物化算子：可缓存的元组节点。 * 控制算子：处理特殊情况的节点。 **2.2算子类型** * 扫描算子：扫描表中的数据。 * 连接算子：连接表之间的关系。 * 物化算子：用于缓存元组的节点。 * 控制算子：处理特殊情况的节点。 **三、执行框架总结** * 行执行引擎在整个数据库系统中的位置。 * 框架包括多个算子，负责执行 SQL 语句的执行。 * 每个算子都包含初始化、执行、清理的生命周期。 **四、常见行执行引擎算子** * **扫描算子：**扫描表中的数据，每次获取一条元组作为上层节点的输入。 * **连接算子：**连接表之间的关系。 * **物化算子：**用于缓存元组的节点。 * **控制算子：**处理特殊情况的节点。

正文

本文分享自华为云社区《GaussDB(DWS)行执行引擎详解》，作者：yd_227398895。

1.前言

GaussDB（DWS）包含三大引擎，一是SQL执行引擎，用来解析用户输入的SQL语句，生成执行计划，供执行引擎来执行；二是执行引擎，其中包含了行执行引擎和列执行引擎，执行引擎即查询的执行者，位于优化器和存储引擎之间，负责将数据从存储引擎中读取出来，并根据计划将数据处理加工后返回给客户端，执行引擎的目标是为了更好地利用计算资源，更快地完成计算。三是存储引擎，决定了数据库数据的存取方式，直接影响了数据库的读写性能。

其中行执行引擎应用于行存表中，传统的OLTP（OnLine Transaction Processsing 联机事务处理）场景与功能、业务强相关，数据需要进行频繁的增删改查，这时比较适合使用行存储式。行存储的优势主要有两个方面：首先是点查性能好，在点查场景下可以直接索引到某行数据的元组位置；其次就是更新效率高，行存储在实时并发入库，并发更新方面依然有着比较大的优势。行执行引擎的关键就是：一次处理一行数据，即一tuple，适合数据频繁更新，增删改操作多，且查询结果涉及表的多列的场景。

2.行执行引擎组成

2.1 行执行框架

行执行引擎的执行基本单位是算子，查询计划是以树的形式存在的，算子是执行树上的每个节点。每个算子需要经历初始化，执行，清理的生命周期，执行时包括递归遍历计划树的各个节点，从计划树根节点开始，递归到叶节点来获取一个tuple，经过逐层节点算子的处理，返回一个结果tuple，直到再无tuple。整体算子的执行采用Piepline模式，一次一tuple，控制流从上到下，数据流由下到上，图示实线为控制流，虚线为数据流，使用上层来驱动下层。
控制流和数据流