Python结合文件名称将多个文件复制到不同路径下

python · 浏览次数 : 0

小编点评

本文介绍了一种基于Python语言的方法,用于对一个文件夹下的大量栅格遥感影像文件进行重命名和整理。通过对文件名中的编号字段进行处理,将带有相同编号的栅格遥感影像文件及其对应的辅助信息文件复制到结果文件夹中,形成多个子文件夹。 1. **需求分析**:文章首先描述了现有的数据结构,即一个文件夹内有大量的tif格式栅格遥感影像文件和.xml、ovr等格式的辅助信息文件。这些文件的文件名中包含一个表示编号的字段,我们希望将这些文件及其辅助信息整合到结果文件夹中。 2. **代码实现**:通过Python编程实现了一个脚本,其中包含以下主要步骤: - 导入os、re和shutil库,用于文件遍历、字符串匹配和文件复制。 - 使用os.listdir()函数遍历待复制的文件。 - 通过文件名分割和正则表达式提取编号字段。 - 检查并创建结果文件夹(如果尚不存在)。 - 使用shutil.copy()函数复制文件及其辅助信息。 3. **文件夹结构**:文章中的代码实现了将文件按照编号分组,并复制到相应编号的子文件夹中。最终结果文件夹中将包含多个子文件夹,每个子文件夹中的文件都与编号对应。 总的来说,本文提供了一种有效的方法来管理大量遥感影像数据,使得数据的组织更加清晰和便于查找。

正文

  本文介绍基于Python语言,针对一个文件夹下的大量栅格遥感影像文件,基于其各自的文件名,分别创建指定名称的新文件夹,并将对应的栅格遥感影像文件复制到不同的新文件夹下的方法。

  首先,我们来看一下本文需要实现的需求。现有一个文件夹,其中有大量.tif格式的栅格遥感影像文件,以及.xmlovr等格式的遥感影像辅助信息文件,如下图所示。

image

  其中,如上图中紫色框所示,每一景遥感影像文件的文件名称中,都有一个表示其编号的字段;我们希望基于这一编号字段,将带有相同编号字段的栅格遥感影像文件,以及其对应的辅助信息文件,都复制到一个结果文件夹中;这个结果文件夹如下图所示。

  其中,结果文件夹内含有多个不同编号子文件夹,这个编号就是上上图中,栅格遥感影像所带有的编号。例如,我们希望将所有文件名称中带有15字段的栅格遥感影像文件及其辅助信息文件,都复制到结果文件夹中名称为15子文件夹中,以此类推。

  知道了具体需求,我们即可开始代码的撰写。本文所用到的代码如下所示。

# -*- coding: utf-8 -*-
"""
Created on Mon Feb 13 20:25:04 2023

@author: fkxxgis
"""

import os
import re
import shutil

tif_file_path = r"E:\02_Project\01_Chlorophyll\Fishnet\Result"
result_file_path = r"E:\02_Project\01_Chlorophyll\Fishnet\ResultFolder"

file_list = os.listdir(tif_file_path)
for file in file_list:
    file_id_suffix = file.split("_")[2]
    file_id = re.findall("\d+", file_id_suffix)[0]
    if not os.path.exists(os.path.join(result_file_path, file_id)):
        os.makedirs(os.path.join(result_file_path, file_id))
        print("Make " + file_id + " path.")
    shutil.copy(os.path.join(tif_file_path, file), os.path.join(result_file_path, file_id, file))

  其中,tif_file_path是存储有原有待复制遥感影像文件的文件夹,result_file_path则表示最终的结果文件夹。

  代码的整体思路也非常简单。首先,我们需要导入osreshutil3Python库,分别实现系统文件遍历、字符串匹配与遥感影像文件的复制。其次,我们通过os.listdir()函数,遍历待复制遥感影像文件对应的文件夹,获取其中的每一个文件;这里的文件既包括.tif格式的栅格遥感影像文件,同时也包括.xmlovr等格式的遥感影像辅助信息文件

  随后,对每一个文件加以处理。我们基于每一个文件的文件名称的规则,通过split()函数,将其中表示编号的字段以及这一字段之后的内容提取出来;紧接着,基于re.findall()函数,通过字符串匹配的方式,将表示编号的字段(也就是文件名称中的数字部分)提取出来。

  接下来,知道了当前文件对应的编号,我们就可以开始复制工作。但是这里需要注意,由于我们需要将每一个文件都放入结果文件夹中的子文件夹,因此需要首先判断当前子文件夹有没有被建立;如果没有创建的话,我们需要创建一下这个子文件夹。这一步骤通过if判断语句及其内部的代码即可实现——通过os.path.exists()函数判断是否存在指定的子文件夹,如果不存在的话就新建这一子文件夹。

  随后,就可以开始文件的复制工作了。这一步骤我们通过shutil.copy()函数即可实现。

  运行上述代码后,我们即可在结果文件夹中看到各个编号对应的子文件夹,并在子文件夹中看到这一编号对应的全部文件。如下图所示,可以看到结果文件夹中,名称为15子文件夹内,包含的就是文件名称中带有15字段的所有遥感影像文件及其对应的辅助信息文件

  至此,大功告成。

与Python结合文件名称将多个文件复制到不同路径下相似的内容:

Python结合文件名称将多个文件复制到不同路径下

本文介绍基于Python语言,针对一个文件夹下的大量栅格遥感影像文件,基于其各自的文件名,分别创建指定名称的新文件夹,并将对应的栅格遥感影像文件复制到不同的新文件夹下的方法~

Django容易被遗忘却无比重要的框架默认文件介绍及使用方法

**在Python Web开发领域,Django框架的地位犹如璀璨的明星,其全面、高效和安全的特性使其在全球范围内广受欢迎。本文将全面解析Django框架的默认文件,并深入探讨每个文件及其组成的意义和用途,透彻展示这个强大框架的文件结构和设计原理。** 首先,让我们看一下创建一个新的Django项目

核对不同文件夹所含内容的差异并提取缺失内容:Python代码

本文介绍基于Python语言,以一个大文件夹作为标准,对另一个大文件夹所包含的子文件夹或文件加以查漏补缺,并将查漏补缺的结果输出的方法~

Python按条件筛选、剔除表格数据并绘制剔除前后的直方图

本文介绍基于Python语言,读取Excel表格文件数据,以其中某一列数据的值为标准,对于这一列数据处于指定范围的所有行,再用其他几列数据的数值,加以数据筛选与剔除;同时,对筛选前、后的数据分别绘制若干直方图,并将结果数据导出保存为一个新的Excel表格文件的方法~

Python依据遥感影像的分幅筛选出对应的栅格文件

本文介绍基于Python语言,结合已知研究区域中所覆盖的全部遥感影像的分幅条带号,从大量的遥感影像文件中筛选落在这一研究区域中的遥感影像文件的方法~

Python 调整PDF页面尺寸大小

在处理PDF文件时,我们可能会遇到这样的情况:原始PDF文档不符合我们的阅读习惯,或者需要适配不同显示设备等。这时,我们就需要及时调整PDF文档中的页面尺寸,以满足不同应用场景的需求。 利用Python语言的高效性和灵活性,再结合Spire.PDF for Python 库的强大功能,我们可以通过P

21.1 使用PEfile分析PE文件

PeFile模块是`Python`中一个强大的便携式第三方`PE`格式分析工具,用于解析和处理`Windows`可执行文件。该模块提供了一系列的API接口,使得用户可以通过`Python`脚本来读取和分析PE文件的结构,包括文件头、节表、导入表、导出表、资源表、重定位表等等。此外,PEfile模块还可以帮助用户进行一些恶意代码分析,比如提取样本中的字符串、获取函数列表、重构导入表、反混淆等等。PE

Python处理CSV文件

python处理CSV文件 CSV文件 CSV (comma-separated values)文件是一种文本文件格式,允许以表格结构保存数据。这是一种流行的格式,用于从数据库和电子表格导出和导入数据,CSV 文件中的每条数据都用逗号 (,) 分隔,例如,第一行数据可以选择用作标题,标明其下方的每一

10分钟掌握Python缓存

全文速览 python的不同缓存组件的使用场景和使用样例 cachetools的使用 项目背景 代码检查项目,需要存储每一步检查的中间结果,最终把结果汇总并写入文件中 在中间结果的存储中 可以使用context进行上下文的传递,但是整体对代码改动比较大,违背了开闭原则 也可以利用缓存存储,处理完成之

[转帖]python字符串如何删除后几位

https://www.python51.com/jc/15070.html 1、首先在jupyter notebook中新建一个空白的python文件: 2、然后定义一个字符串,用字符串截取的方式打印出排除最后三个字符的结果,这里的“s[:-3]”的意思就是从字符串取第0个字符至倒数第三个字符的前