R语言遍历文件夹求取其中所有栅格文件的平均值

· 浏览次数 : 0

小编点评

本文介绍了如何使用 R 语言中的 raster 包来遍历读取多个文件夹下的多张栅格遥感影像，并对每个文件夹中的多张栅格图像分别计算平均值。最终得到多张结果图像，每景结果图像表示一个条带号对应不同成像时间的遥感影像的平均值。文章还提供了详细的代码解释和示例图片。 1. 文章首先介绍了需求背景，有多个文件夹，每个文件夹中含有大量栅格遥感影像，需要计算每个文件夹中所有遥感影像的平均值。 2. 文章讲解了如何使用 R 语言的 raster 包来读取遥感影像和处理数据，包括导入 raster 包、设置结果路径等步骤。 3. 文章详细描述了 for 循环的用法，用于遍历文件夹并处理每个小文件夹中的遥感影像。 4. 文章给出了具体的代码解释，包括如何读取遥感影像、计算平均值、设置 NoData 值以及保存结果图像等。 5. 文章最后通过 cat 函数输出了代码运行进度，以便于查看每个条带号对应的平均值结果图像。通过以上步骤，文章展示了一种在 R 语言中批量处理多张遥感影像并计算平均值的方法，为遥感影像数据处理提供了有益的参考。

正文

本文介绍基于R语言中的raster包，遍历读取多个文件夹下的多张栅格遥感影像，分别批量对每一个文件夹中的多个栅格图像计算平均值，并将所得各个结果栅格分别加以保存的方法。

其中，本文是用R语言来进行操作的；如果希望基于Python语言实现类似的平均值求取操作，大家可以参考Python ArcPy批量计算多时相遥感影像的各像元平均值与Python忽略NoData计算多张遥感影像的像元平均值：whitebox库这两篇文章。

首先，来看一下本文所需实现的需求。如下图所示，现有多个文件夹，其中每一个文件夹内部都含有大量的栅格遥感影像。

其中，上图中的每一个文件夹的命名都是以遥感影像的分幅条带号为依据的。例如，打开第一个名为47RMN的文件夹，其中均为条带号为47RMN（即同一空间范围）、不同成像时间的遥感影像，如下图所示；其中，紫色框内的遥感影像文件名即可看出，这些图像是同一条带号、不同时间的遥感影像数据。

我们要做的，就是分别对每一个文件夹中的全部遥感影像计算平均值，从而得到不同条带号遥感影像的平均值；最终我们将得到多张结果图像，每一景结果图像就是这一条带号、不同成像时间对应的遥感影像的平均值。同时为了方便区分，我们需要将每一景结果图像文件的文件名设置为与条带号有关的内容。

明确了需求，我们即可开始代码的撰写。本文所用到的代码如下所示。

library(raster)
result_path <- r"(E:\02_Project\01_Chlorophyll\Select\Result)"
tif_folder <- list.files(path = r"(E:\02_Project\01_Chlorophyll\Select)", pattern = NULL, all.files = FALSE, full.names = TRUE)
for (folder in tif_folder){
  folder_name <- substr(folder, nchar(folder) - 4, nchar(folder))
  tif_file_name <- list.files(path = folder, pattern = ".tif$", full.names = TRUE, ignore.case = TRUE)
  tif_file_all <- stack(tif_file_name)
  NAvalue(tif_file_all) <- -10000
  tif_mean <- calc(tif_file_all, fun = mean, na.rm = TRUE)
  tif_mean_new <- tif_mean / 100
  # plot(tif_mean_new)
  result_file_name <- file.path(result_path, paste(folder_name, "_mean.tif", sep = ""))
  rf <- writeRaster(tif_mean_new, filename = result_file_name, overwrite = TRUE)
  cat(folder_name, "is completed!", "\n")
}
复制

首先，需要通过library(raster)代码，导入本文所需的R语言raster包；关于这一包的配置，大家可以参考基于R语言的raster包读取遥感影像。接下来，我们需要指定结果存放的路径，并将其放入变量result_path中。

接下来，我们通过list.files()函数，将包含有各个条带号的小文件夹的大文件夹（也就是本文开头第一张图所示的文件夹）加以遍历，将每一个小文件夹的路径存入tif_folder。执行上述前3行代码后，得到的tif_folder结果如下图所示。

可以看到，tif_folder是一个字符串，其中每一个元素都是每一个小文件夹的路径。

接下来的for循环，就是对tif_folder加以遍历，即对每一个小文件夹进行操作。其中，我们首先通过substr()函数，获取当前操作的小文件夹名称，并将其存放于folder_name中；随后，对当前对应的小文件夹加以遍历，取出其中的全部遥感影像文件，并存放于tif_file_name；接下来，就是读取全部遥感影像，并计算其平均值；这里具体的代码解释大家可以参考文章R语言求取大量遥感影像的平均值、标准差：raster库。此外需要注意的是，由于我这里每一景遥感影像原本没有专门设置NoData值，而是用-10000作为其NoData值，因此需要通过NAvalue(tif_file_all) <- -10000这句代码，将值为-10000的像元作为NoData值的像元，防止后期计算平均值时对结果加以干扰。

接下来，我们通过file.path()函数配置一下输出结果的路径——其中，结果遥感影像文件的名称就可以直接以其所对应的条带号来设置，并在条带号后添加一个_mean后缀，表明这个是平均值的结果图像；但此外，这个仅仅是文件的名字，还需要将文件名与路径拼接在一起，才可以成为完整的保存路径，因此需要用到file.path()函数。最后，将结果图像通过writeRaster()函数加以保存即可，这句代码的解释大家同样参考R语言求取大量遥感影像的平均值、标准差：raster库这篇文章即可。

最后，由于我们要处理的文件夹比较多，因此可以通过cat()函数输出一下当前代码的运行进度。

运行上述代码，我们将在指定的结果保存路径中看到每一个条带号对应的平均值结果图像，如下图所示。

至此，大功告成。