https://www.jianshu.com/p/6c87cb6cd320
读与写是每个数据库提供的最基本的功能。当数据库中出现第一个进程时,总免不了要将数据从磁盘上加载到内存中,一次数据库的物理I/O由此发生。而这对应着数据库的读事件。通常大多数情况下,数据库中不仅会伴随着大量的读,也会产生大量的写入更新操作,而类似写入更新的操作则需要将修改后的数据写回到磁盘中。
显然,对于读操作来说,总是依据需要读取数据的请求从磁盘上或内存中找到对应满足的数据返回给客户端。也就是说,读操作必定是伴随着客户端会话的请求而出现的。那么,写操作在数据被更新/修改后是如何写回到磁盘中的?
Oracle实例在启动时在内存中划分了一块区域,被称作 SGA(System Global Area,系统全局区)
。其中共有6大内存区域,缓冲数据库中的数据部分的内存区域则称为 Database Buffer Cache(数据库高速缓存区)
。
Database Buffer Cache
主要用来提高数据的访问性能,避免访问数据库过程中出现大量的磁盘读写。可见,Database Buffer Cache 存在的意义不仅在于缓存数据库中读的数据,而且需要提升数据库的写性能。既然如此,数据被修改或更新后也不是立刻会写回到磁盘中的,而应该有一定的规则将数据缓存区中的数据写回到磁盘中。而实现这一机制的,则是 DBWR(Database Writer)
。
DBWR
是Oracle数据库中的一个后台进程,用于将 Database Buffer Cache
中的被修改的数据写回到磁盘中。在数据库中,数据最先从磁盘上读取数据并加载到内存中,此时的数据并没有被任何的用户进程修改过,这种类型的数据称为 Cleaning Data
。而当数据库中的数据被用户进程修改了某些字段的值后,因为数据是在内存中被修改的,修改后的数据(内存中)因为与磁盘上的数据文件中记录的数据已经发生了不同,因此这部分被修改过的数据被称为 Dirty Data
。当内存区域中的 Dirty Data 被 DBWR 进程写入到磁盘上后,数据文件又恢复 Clenaing
状态,这个过程称为 刷脏
。
内存中的数据是无论如何也要写回到磁盘中的,这一点是确定无疑的。但更困难的问题在于以什么样的机制将数据写回到磁盘。
针对这个问题,或许有很多中解决方案。或者写入发生在数据修改的那一刻,或者定时定量将数据写回到磁盘,或者由其他机制(进程)触发写入操作,或许都是可行的方案。
先说说写入发生在数据修改的那一刻的情况,这种情况下数据库中发生一次数据修改后,就需要立刻将数据写回到磁盘中。显然,一旦这么做会在数据库中产生大量的物理写入,而过多的物理I/O会降低数据库的性能,显然,修改即写入无法满足数据库的性能要求,但这种方式或许是保障数据不会丢失的好办法。
接着是定时定量将内存中的数据写回到磁盘中,这种方式也是 DBWR
机制中的一种。与修改即写入不同的是,被修改的数据会在内存中保留一段时间,直到达到数据库后台进程 DBWR 设定(默认)的时间阈值后,一次将内存中被修改的数据块写回到磁盘中。相比修改即写入,定时定量将内存区域被修改的数据块则可以避免可能发生在数据库中的大量物理I/O问题,从而提高数据库的访问性能。
DBWR 后台进程中也是定时定量对 数据库高速缓存区 中的数据进行写回到磁盘操作的。在Oracle中,DBWR 每隔3s启动一次进程将数据写回到磁盘中;另一种情况是当内存中的脏数据块占比达到一定限制后,也会触发 DBWR 进程将脏数据刷回到磁盘中去。
再来说按规则(机制)将内存中的数据写回到磁盘的情况。这种方式类似于定时定量的方式,都是以某一种设定条件作为触发 DBWR 写数据的依据。在Oracle中,则是使用 CKPT
检查点作为触发 DBWR 的条件。
当数据库发生检查点事件时,后台进程 DBWR 会被启动,并将当前内存区域中的脏数据统一写回到磁盘中的数据文件。数据中的检查点回周期性的执行,以此保证内存中的数据可以有效的被写回磁盘。
数据库中 DBWR 进程触发时,会响应启动另一个后台进程-LGWR
,用于将数据库中数据变更的历史记录到日志文件中。并且,DBWR 后台进程在 LGWR 进程写入重做日志期间会保持阻塞状态,当 LGWR 写入日志完成后,DBWR 开始将内存中的数据写入到磁盘中。
在 SGA
内存区中,保存重做日志的区域称为 Redo Log Buffer(重做日志缓存区)
,当需要将数据修改对应的日志记录到日志文件中时,会触发 LGWR 后台进程将缓存区的日志写入到重做日志文件中。
在Oracle数据库中,日志的完整性是十分重要的。绝不仅仅只是记录,当实例异常故障后再恢复时需要应用重做日志文件,将数据库恢复到故障前一刻的状态。只有被写入重做日志中的数据,在内存区域被修改的数据才算是安全的。
与数据何时写回到磁盘一样,数据库日志缓存区的日志也需要根据一定的规则将日志文件记录到重做日志文件中。触发 LGWR 进程写入日志的情况包含以下几种:
当用户进程执行了 rollback(回滚)
或 commit(提交)
事件时,数据库会启动后台的 LGWR 进程,将相应的数据变更的记录记录到联机重做日志文件中;同样,当内存区域的日志缓存区的空间不够用时,也会触发 LGWR 后台进程将日志缓存区的日志写入到重做日志中。
与 DBWR 一样,LGWR 也会每隔3s将日志缓存区的日志写入到重做日志中。
redo log buffer 内存区域的日志占用的空间达到一定限制后(默认超过日志缓存区1/3的空间时),触发 LGWR 后台进程开始将缓存区的日志写入到重做日志中。
最后,LGWR 写日志时会根据日志出现的先后顺序将内存区域的日志顺序的写入到日志文件中,是为了数据库恢复时按照数据被修改的先后顺序应用redo,保证数据的正确性和一致性。