Python结合文件名称将多个文件复制到不同路径下

python · 浏览次数 : 0

小编点评

本文介绍了一种基于Python语言的方法，用于对一个文件夹下的大量栅格遥感影像文件进行重命名和整理。通过对文件名中的编号字段进行处理，将带有相同编号的栅格遥感影像文件及其对应的辅助信息文件复制到结果文件夹中，形成多个子文件夹。 1. **需求分析**：文章首先描述了现有的数据结构，即一个文件夹内有大量的tif格式栅格遥感影像文件和.xml、ovr等格式的辅助信息文件。这些文件的文件名中包含一个表示编号的字段，我们希望将这些文件及其辅助信息整合到结果文件夹中。 2. **代码实现**：通过Python编程实现了一个脚本，其中包含以下主要步骤： - 导入os、re和shutil库，用于文件遍历、字符串匹配和文件复制。 - 使用os.listdir()函数遍历待复制的文件。 - 通过文件名分割和正则表达式提取编号字段。 - 检查并创建结果文件夹（如果尚不存在）。 - 使用shutil.copy()函数复制文件及其辅助信息。 3. **文件夹结构**：文章中的代码实现了将文件按照编号分组，并复制到相应编号的子文件夹中。最终结果文件夹中将包含多个子文件夹，每个子文件夹中的文件都与编号对应。总的来说，本文提供了一种有效的方法来管理大量遥感影像数据，使得数据的组织更加清晰和便于查找。

正文

本文介绍基于Python语言，针对一个文件夹下的大量栅格遥感影像文件，基于其各自的文件名，分别创建指定名称的新文件夹，并将对应的栅格遥感影像文件复制到不同的新文件夹下的方法。

首先，我们来看一下本文需要实现的需求。现有一个文件夹，其中有大量.tif格式的栅格遥感影像文件，以及.xml、ovr等格式的遥感影像辅助信息文件，如下图所示。

其中，如上图中紫色框所示，每一景遥感影像文件的文件名称中，都有一个表示其编号的字段；我们希望基于这一编号字段，将带有相同编号字段的栅格遥感影像文件，以及其对应的辅助信息文件，都复制到一个结果文件夹中；这个结果文件夹如下图所示。

其中，结果文件夹内含有多个不同编号的子文件夹，这个编号就是上上图中，栅格遥感影像所带有的编号。例如，我们希望将所有文件名称中带有15字段的栅格遥感影像文件及其辅助信息文件，都复制到结果文件夹中名称为15的子文件夹中，以此类推。

知道了具体需求，我们即可开始代码的撰写。本文所用到的代码如下所示。

# -*- coding: utf-8 -*-
"""
Created on Mon Feb 13 20:25:04 2023

@author: fkxxgis
"""

import os
import re
import shutil

tif_file_path = r"E:\02_Project\01_Chlorophyll\Fishnet\Result"
result_file_path = r"E:\02_Project\01_Chlorophyll\Fishnet\ResultFolder"

file_list = os.listdir(tif_file_path)
for file in file_list:
    file_id_suffix = file.split("_")[2]
    file_id = re.findall("\d+", file_id_suffix)[0]
    if not os.path.exists(os.path.join(result_file_path, file_id)):
        os.makedirs(os.path.join(result_file_path, file_id))
        print("Make " + file_id + " path.")
    shutil.copy(os.path.join(tif_file_path, file), os.path.join(result_file_path, file_id, file))
复制

其中，tif_file_path是存储有原有待复制遥感影像文件的文件夹，result_file_path则表示最终的结果文件夹。

代码的整体思路也非常简单。首先，我们需要导入os、re与shutil等3个Python库，分别实现系统文件遍历、字符串匹配与遥感影像文件的复制。其次，我们通过os.listdir()函数，遍历待复制遥感影像文件对应的文件夹，获取其中的每一个文件；这里的文件既包括.tif格式的栅格遥感影像文件，同时也包括.xml、ovr等格式的遥感影像辅助信息文件。

随后，对每一个文件加以处理。我们基于每一个文件的文件名称的规则，通过split()函数，将其中表示编号的字段以及这一字段之后的内容提取出来；紧接着，基于re.findall()函数，通过字符串匹配的方式，将表示编号的字段（也就是文件名称中的数字部分）提取出来。

接下来，知道了当前文件对应的编号，我们就可以开始复制工作。但是这里需要注意，由于我们需要将每一个文件都放入结果文件夹中的子文件夹，因此需要首先判断当前子文件夹有没有被建立；如果没有创建的话，我们需要创建一下这个子文件夹。这一步骤通过if判断语句及其内部的代码即可实现——通过os.path.exists()函数判断是否存在指定的子文件夹，如果不存在的话就新建这一子文件夹。

随后，就可以开始文件的复制工作了。这一步骤我们通过shutil.copy()函数即可实现。

运行上述代码后，我们即可在结果文件夹中看到各个编号对应的子文件夹，并在子文件夹中看到这一编号对应的全部文件。如下图所示，可以看到结果文件夹中，名称为15的子文件夹内，包含的就是文件名称中带有15字段的所有遥感影像文件及其对应的辅助信息文件。

至此，大功告成。