【pandas小技巧】--修改列的名称

pandas,技巧,修改,名称 · 浏览次数 : 223

小编点评

**重命名 pandas 数据中列的名称** 重命名 pandas 数据中列的名称是一种常见的数据预处理任务，可以帮助我们使数据更加清晰和易于理解。 **方法：** 1. **rename 函数**：使用 `rename` 函数更改列名，接收两个参数：旧列名和新列名。 ```python df.rename({ "col name": "col_name", "#num@$\": "num" }, axis=1) ``` 2. **columns 属性**：使用 `columns` 属性更改列名，接收一个列表。 ```python df.columns = ["col_name", "num", "坐标A", "坐标B"] ``` 3. **replace 方法**：使用 `replace` 方法替换列名，接受正则表达式作为匹配模式。 ```python df.columns = df.columns.str.replace(" \", "_") df.columns = df.columns.str.replace("[#@$]\", '') ``` **其他技巧：** * 使用 `regex=True` 参数进行正则表达式替换。 * 在合并数据时给不同数据来源的数据的列名上加一个前缀或后缀。

正文

重命名 pandas 数据中列的名称是一种常见的数据预处理任务。
这通常是因为原始数据中的列名称可能不够清晰或准确。例如，列名可能包含空格、大写字母、特殊字符或拼写错误。

使用 pandas 的 rename函数可以帮助我们更改列名，从而使数据更加清晰和易于理解。
此外，重命名列名还可以确保您的代码在维护和共享时更加易于交流和重用。

1. 列名中的特殊字符

比如如下测试数据：

import pandas as pd

df = pd.DataFrame(
    {
        "col name": ["name1", "name2", "name3"],
        "#num@$": [1, 1, 2],
        "坐标A": [1.2, 1.3, 2.3],
        "坐标B": [2.3, 3.3, 5.7],
    },
)
df

1.1. rename函数

使用rename函数消除列名中的空格和特殊符号：

df.rename({"col name": "col_name", "#num@$": "num"}, axis=1)

需要修改的列名不多时，用这种方式比较直观。

1.2. columns属性

使用columns修改列名时，需要设置所有的列名，哪怕不需要修改的列名也要列出来。

df.columns = ["col_name", "num", "坐标A", "坐标B"]
df

当需要修改的列名比较多，或者所有列名都需要修改时，用这种方式。

1.3. replace方法

df.columns = df.columns.str.replace(" ", "_")
df.columns = df.columns.str.replace("[#@$]", "", regex=True)
df

这种方式还支持通过正则表达式的方式替换，适合复杂替换的场景。
使用正则替换时，设置参数：regex=True

2. 列名的前缀

当遇到来自不同系统的同类数据时，合并之后会发现很多同样的列名，难以区分。
比如：

df1 = pd.DataFrame(
    {
        "坐标X": [1.2, 1.3, 2.3],
        "坐标Y": [2.3, 3.3, 5.7],
    },
)
df2 = pd.DataFrame(
    {
        "坐标X": [2.2, 3.3, 7.3],
        "坐标Y": [1.3, 4.3, 3.7],
    },
)

df = pd.concat([df1, df2], axis=1)
df

这时，我们可以在合并前给不同数据来源的数据的列名上加一个前缀（add_prefix）。

df1 = df1.add_prefix("A_")
df2 = df2.add_prefix("B_")

df = pd.concat([df1, df2], axis=1)
df

3. 列名的后缀

除了添加前缀，也可以用添加后缀的方式（add_suffix）来区分不同数据源的数据。

df1 = df1.add_suffix("_A")
df2 = df2.add_suffix("_B")

df = pd.concat([df1, df2], axis=1)
df

【pandas小技巧】--修改列的名称

小编点评

正文

1. 列名中的特殊字符

1.1. rename函数

1.2. columns属性

1.3. replace方法

2. 列名的前缀

3. 列名的后缀

与【pandas小技巧】--修改列的名称相似的内容：

【pandas小技巧】--修改列的名称

【pandas小技巧】--日期相关处理

【pandas小技巧】--数据转置

【pandas小技巧】--统计值作为新列

【pandas小技巧】--category类型补充

【pandas小技巧】--DataFrame的显示参数

【pandas小技巧】--DataFrame的显示样式

【pandas小技巧】--花哨的DataFrame

【pandas小技巧】--目录（完结）

【pandas小技巧】--创建测试数据

# 热门排行