[python] 基于PyWaffle库绘制华夫饼图

python,pywaffle · 浏览次数 : 0

小编点评

The provided context describes how to generate a waffle chart using the `Waffle` library in Python. Here's a summary of the key points: **1. Defining the Waffle Parameters:** - `rows` parameter specifies the number of rows in the figure. - `values` parameter contains the data values for each data point. - `title` parameter specifies the title of the figure. - Other parameters like `cmap_name`, `rounding_rule`, `figsize`, and legend settings are also defined. **2. Creating the Waffle Chart:** - `Waffle.make_waffle()` function is used to create the waffle chart. - It takes various arguments including `ax` (axis to plot on), `rows`, `columns`, and data values. - The function returns a figure object with the created waffle chart. **3. Adding Text and Legends:** - `fig.text()` function is used to add text at specific coordinates. - `fig.legend()` function is used to add legend with icons. - Legend labels are set with `handle` parameter. **4. Styling the Waffle Chart:** - `fig.suptitle()` sets the title of the entire figure. - `fig.text()` and `fig.legend()` have additional options for styling the chart. **5. Setting Font and Size:** - `fig.text()` sets the font and size of text. - `fig.suptitle()` sets the font and size of the title. **6. Example Usage:** The code provides an example with several parameters and customization options for creating a waffle chart. **Additional Notes:** - `figure()` class is imported from `matplotlib.patches` for creating custom shapes. - `unicode-table` in the `matplotlib` module provides a list of characters and icons. - The code uses the `font_size` and `icon_size` parameters to set different sizes for text and icons. By understanding these steps, you can generate and customize your own waffle charts using the `Waffle` library in Python.

正文

华夫饼图Waffle chart是一种独特而直观的图表,用于表示分类数据。它采用网格状排列的等大小方格或矩形,每个方格或矩形分配不同的颜色或阴影来表示不同的类别。这种可视化方法有效地传达了每个类别在整个数据集中的相对比例。本文介绍如何使用基于Python的PyWaffle库绘制华夫饼图。PyWaffle开源仓库地址见:PyWaffle,PyWaffle官方文档见:PyWaffle-docs。本文代码下载地址:Python-Study-Notes.

PyWaffle安装方式如下:

pip install -U pywaffle

# PyWaffle库依赖于matplotlib绘制图片
import matplotlib.pyplot as plt
from pywaffle import Waffle

1 使用简介

1.1 基本使用

1.1.1 基础绘图

PyWaffle库通过其Waffle类提供了一种便捷的方式来创建华夫饼图。每个类别的方格占比可以通过参数values进行设置,数据可以是列表、字典和Pandas.DataFrame结构。然后可以使用rows和columns参数来定制行数和列数。只需要指定其中一个参数,另一个参数可以根据values的总和推断出来。

# 新建绘图图像
fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    # columns=10,
    values=[30, 16, 4]
)
# 保存结果
# fig.savefig("plot.png", bbox_inches="tight")
plt.show()

png

如果value参数输入的是比例值,则必须设置rows和columns属性来定义值的显示方式。

fig = plt.figure(
    FigureClass=Waffle,
    rows=2,
    columns=5,
    values=[0.2, 0.5, 0.3]
)
plt.show()

png

如果values总和与rows*columns的结果不一致,Waffle类将values解释为各部分的相对比例。

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    columns=5,
    values=[30, 16, 4]
)
plt.show()

png

当字典传递给values时,键将用作标签并显示在图例中,注意图例会默认显示。

plt.figure(
    FigureClass=Waffle,
    rows=5,
    values={'Cat': 30, 'Dog': 16, 'Bird': 4},
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1), 'frameon': False} # 修改图例
)
plt.show()

png

不显示图例。

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values={'Cat': 30, 'Dog': 16, 'Bird': 4},
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1), 'frameon': False} # 修改图例
)

# 移除legend
fig.axes[0].get_legend().remove()

plt.show()

png

1.1.2 类别比例设置

如果values的总和与rows*columns的结果不一致,Waffle类将解释values为各部分的相对比例。如下所示各个类别方块数输出为小数,小数位的取舍会导致不同的展示效果:

# nearest, ceil or floor

import numpy as np

target = {'Cat': 48, 'Dog': 46, 'Bird': 3, 'Fish': 9}

values = np.array(list(target.values()))

values_ratio = values /sum(values)
# 华夫饼图结构
row = 2
col = 5
# 各个类别方块数
values_ratio * row *col
array([4.52830189, 4.33962264, 0.28301887, 0.8490566 ])

为此,Waffle类通过rounding_rule参数来处理小数位取舍问题。rounding_rule可选值为nearest(默认), ceil或floor。具体如下:

nearest

nearest表示将方块的数值四舍五入到最接近的整数。

# 各个类别方块数
np.round(values_ratio * row *col, 0).astype(int)
array([5, 4, 0, 1])
np.round(values_ratio*10,0).astype(int)

plt.figure(
    FigureClass=Waffle,
    rows=2,
    columns=5,
    values=target,
    rounding_rule='nearest', # 默认值
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1), 'frameon': False} # 修改图例
)
plt.show()

png

ceil

ceil表示将方块的数值向上舍入到最接近的整数。然而,在nearest和ceil模式下,方块的总和可能会超过华夫饼图的预设长度,超出预设长度的方块将不会显示。这也意味着,输入类别位置越靠后,其方块显示的数值越可能不准确。

# 各个类别方块数
np.ceil(values_ratio * row *col).astype(int)
array([5, 5, 1, 1])
np.round(values_ratio*10,0).astype(int)

plt.figure(
    FigureClass=Waffle,
    rows=2,
    columns=5,
    values=target,
    rounding_rule='ceil', # 默认值
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1), 'frameon': False} # 修改图例
)
plt.show()

png

floor

floor表示将方块的数值向下舍入到最接近的整数,由于这种舍入方式的特性,绘制的方块数可少于预设的数量。

# 各个类别方块数
np.floor(values_ratio * row *col).astype(int)
array([4, 4, 0, 0])
np.round(values_ratio*10,0).astype(int)

plt.figure(
    FigureClass=Waffle,
    rows=2,
    columns=5,
    values=target,
    rounding_rule='floor', # 默认值
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1), 'frameon': False} # 修改图例
)
plt.show()

png

如果想要在华夫饼图中完整显示所有类别,但又不希望方块数量过多,一种有效的方法是只设定rows或columns中的一个参数,然后将每个类别的数值除以最小类别的数值,以确保最少类别的方块数量为1,同时将其他类别的数值显示为相对于最少类别的比例。

target_ = target.copy()
# 找到最小值
min_value = min(target_.values())

# 更新字典中每个键对应的值
target_ = {key: int(value / min_value) for key, value in target.items()}
print(target_)
{'Cat': 16, 'Dog': 15, 'Bird': 1, 'Fish': 3}
np.round(values_ratio*10,0).astype(int)

plt.figure(
    FigureClass=Waffle,
    rows=4,
    values=target_,
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1), 'frameon': False} # 修改图例
)
plt.show()

png

1.2 样式设置

1.2.1 展示效果设置

标题、标签和图例

data = {'Cat': 30, 'Dog': 16, 'Bird': 4}
fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    columns=10,
    values = data,
    title={
        'label': 'Example plot',
        'loc': 'center',
        'fontdict': {
            'fontsize': 20
        }
    },
    labels=[f"{k} ({int(v / sum(data.values()) * 100)}%)" for k, v in data.items()],
    legend={
        #'labels': [f"{k} ({v}%)" for k, v in data.items()],  # labels可以在legend中设置
        'loc': 'lower left',
        'bbox_to_anchor': (0, -0.2),
        'ncol': len(data),
        'framealpha': 0,
        'fontsize': 12
    },
    # 设置颜色条,支持Pastel1, Pastel2, Paired, Accent, Dark2, Set1, Set2, Set3, tab10, tab20, tab20b, tab20c
    cmap_name="Accent",
    facecolor='#DDDDDD',  # 绘图背景色

    # 也可以单独设置颜色
    # colors=["#232066", "#983D3D", "#DCB732", "F12F34"]

)

png

方块宽高比设置

参数block_aspect_ratio通过更改块的宽度与块的高度之比来控制方块的形状。默认block_aspect_ratio为1,也就是每个方块都是正方形。

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[30, 16, 4],
    block_aspect_ratio=1.618
)

png

方块间距控制

参数interval_ratio_x和interval_ratio_y分别负责调节块之间的水平和垂直间距。具体来说,interval_ratio_x代表了块之间的水平间距与块宽度的比率,而interval_ratio_y则反映了块之间的垂直间距与块高度的比率。

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[30, 16, 4],
    interval_ratio_x=1,
    interval_ratio_y=0.5
)

png

起始方块绘图位置

starting_location用于设置起始方块的位置。这个参数可输入包括 "NW(西北角、左上角)"、"SW(默认值,西南角,右下角)"、"NE(东北角,右上角)" 和 "SE(东南角,右下角)"。

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[30, 16, 4],
    starting_location='SE'
)

png

绘图方向

默认情况下PyWaffle逐列绘制方块,因此类别是按水平方向排列绘制的,如果按行绘制方块,则设置vertical参数为True。

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[30, 16, 4],
    vertical=True
)

png

类别方块排列方式

block_arranging_style参数用于控图中各类别方块的排列方式,具体如下:

  • normal: 默认方式,方块会按照常规的网格模式进行排列。
  • new-line: 每个类别的方块都会从新的一行开始排列。这意味着,如果你有多个类别,每行只有一个类别的图标。
  • snake: 方块会按照“蛇形”或“之字形”的模式进行排列。
# new-line排列
fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[12, 22, 20, 4],
    vertical=True,
    block_arranging_style='new-line'
)

png

# snake排列
fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[12, 22, 20, 4],
    block_arranging_style='snake'
)

png

1.2.2 绘图框架自定义

子图绘制

PyWaffle可以通过添加子图的方式,实现在同一张图中显示多个华夫饼图。以下是示例:

import pandas as pd
# 创建一个产量表格
data = pd.DataFrame(
    {
        'labels': ['Car', 'Truck', 'Motorcycle'],
        'Factory A': [44183, 12354, 3246],
        'Factory B': [29198, 7678, 2556],
        'Factory C': [9013, 4079, 996],
    },
).set_index('labels')
fig = plt.figure(
    FigureClass=Waffle,
    plots={
        311: { # 311数字对应于 matplotlib中subplot 的位置编码方式,311表示一个三行一列的布局中的第一个子图
            'values': data['Factory A'] / 1000,   # 将实际数字转换为合理的块数
            'labels': [f"{k} ({v})" for k, v in data['Factory A'].items()],
            'legend': {'loc': 'upper left', 'bbox_to_anchor': (1.05, 1), 'fontsize': 8},
            'title': {'label': 'Vehicle Production of Factory A', 'loc': 'left', 'fontsize': 12}
        },
        312: {
            'values': data['Factory B'] / 1000,
            'labels': [f"{k} ({v})" for k, v in data['Factory B'].items()],
            'legend': {'loc': 'upper left', 'bbox_to_anchor': (1.2, 1), 'fontsize': 8},
            'title': {'label': 'Vehicle Production of Factory B', 'loc': 'left', 'fontsize': 12}
        },
        313: {
            'values': data['Factory C'] / 1000,
            'labels': [f"{k} ({v})" for k, v in data['Factory C'].items()],
            'legend': {'loc': 'upper left', 'bbox_to_anchor': (1.3, 1), 'fontsize': 8},
            'title': {'label': 'Vehicle Production of Factory C', 'loc': 'left', 'fontsize': 12}
        },
    },
    rows=5,   # 应用于所有子图的外部参数,与下面相同
    cmap_name="Paired", 
    rounding_rule='ceil', 
    figsize=(5, 5)
)

fig.suptitle('Vehicle Production by Vehicle Type', fontsize=14, fontweight='bold')
# 说明1个方块代表多少车辆
fig.supxlabel('1 block = 1000 vehicles', fontsize=8, ha='right')
Text(0.5, 0.01, '1 block = 1000 vehicles')

png

现有轴绘图

Pywaffle提供Waffle.make_waffle方法来在现有的matplotlib轴上绘图,而不需要重新初始化Waffle实例。

fig = plt.figure()
ax = fig.add_subplot(111)


ax.set_title("Axis Title", loc= "right")
ax.set_aspect(aspect="equal")

Waffle.make_waffle(
    ax=ax,  # 利用现有绘图对象
    rows=5, 
    columns=10, 
    values=[30, 16, 4], 
    title={"label": "Waffle Title", "loc": "left"}
)

png

此外可以利用make_waffle与已定义坐标轴来显示多个数据结果。

import matplotlib.patches as mpatches 

data = {  
    2021: [175, 139, 96],  
    2022: [232, 187, 126],  
    2023: [345, 278, 195],  
    2024: [456, 389, 267]  
}  
  
df = pd.DataFrame(data,index=['cat', 'dog', 'cow'])  
  
number_of_bars = len(df.columns)
colors = ["darkred", "red", "darkorange"]

# Init the whole figure and axes
fig, axs = plt.subplots(nrows=1,
                        ncols=number_of_bars,
                        figsize=(8,6),)

# Iterate over each bar and create it
for i,ax in enumerate(axs):
    
    col_name = df.columns[i]
    values = df[col_name]/1000
    Waffle.make_waffle(
        ax=ax, 
        rows=20,
        columns=5,
        values=values,
        title={"label": col_name, "loc": "left"},
        colors=colors,
        vertical=True,
        font_size=12
    )
    
fig.suptitle('Animal Type Data Display',
             fontsize=14, fontweight='bold')

legend_labels = df.index
legend_elements = [mpatches.Patch(color=colors[i],
                                  label=legend_labels[i]) for i in range(len(colors))]

fig.legend(handles=legend_elements,
           loc="upper right",
           title="Animal Types",
           bbox_to_anchor=(1.04, 0.5),
           framealpha = 0,
           fontsize=12)
plt.subplots_adjust(right=0.85)
plt.show()

png

添加其他matplotlib绘图组件

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[30, 16, 4]
)
fig.text(
    x=0.5,
    y=0.5,
    s="hello world!",
    ha="center",
    va="center",
    rotation=30,
    fontsize=40,
    color='black',
    alpha=0.3,
    bbox={
        'boxstyle': 'square', 
        'lw': 3, 
        'ec': 'gray', 
        'fc': (0.9, 0.9, 0.9, 0.5), 
        'alpha': 0.3
    }
)
Text(0.5, 0.5, 'hello world!')

png

1.2.3 方格样式变换

Pywaffle支持字符和图标来变换方格样式。

字符

Pywaffe允许一个或多个Unicode字符来替换华夫饼图中方格的样式。可用的Unicode字符见:unicode-table

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[30, 16, 4],
    colors=["#4C8CB5", "#B7CBD7", "#C0C0C0"],
    characters='😊Ã', # 使用两个Unicode字符来展示
    font_size=24
)

png

图标

Pywaffe允许fontawesome中的图标来替换华夫饼图中方格的样式。注意,如果是Windows系统,需要matplotlib 3.5.2及以下版本才能支持该功能。Linux系统对matplotlib版本没有限制。

import matplotlib
# 查看matplotlib版本
matplotlib.__version__
'3.8.3'

图标设置方式如下:

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[30, 16, 4],
    colors=["#FD5C46", "#9DDF3D", "#AFFBC1"],  # 设置颜色
    icons='person', # 设置icon
    font_size= 30 # 图表大小
)

png

为每个类别设置对应的图标的方式如下所示:

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values={'Cat': 30, 'Dog': 16, 'Cow': 4},
    colors=["#000077", "#139900", "#771234"],
    icons=['cat', 'dog', 'cow'],
    font_size=20,
    icon_legend=True, # 替换legend的标签为icon
    legend={
        'labels': ['CAT', 'DOG', 'COW'], 
        'loc': 'upper left', 
        'bbox_to_anchor': (1, 1),
        'frameon': False,
    }
)

png

进一步设置图标的样式,注意并非每个FontAwesome都拥有不同的图标样式,因此在编写代码时务必进行检查。

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=[30, 16, 4],
    colors=["#FFA500", "#4384FF", "#C0C0C0"],
    icons=['sun', 'cloud-showers-heavy', 'font-awesome'],
    icon_size=20,
    icon_style=['regular', 'solid', 'brands'],
    icon_legend=False,
    legend={
        'labels': ['Sun', 'Shower', 'Flag'], 
        'loc': 'upper left', 
        'bbox_to_anchor': (1, 1)
    }
)

png

2 参考

与[python] 基于PyWaffle库绘制华夫饼图相似的内容:

[python] 基于PyWaffle库绘制华夫饼图

华夫饼图Waffle chart是一种独特而直观的图表,用于表示分类数据。它采用网格状排列的等大小方格或矩形,每个方格或矩形分配不同的颜色或阴影来表示不同的类别。这种可视化方法有效地传达了每个类别在整个数据集中的相对比例。本文介绍如何使用基于Python的PyWaffle库绘制华夫饼图。PyWaff

【Python】基于动态规划和K聚类的彩色图片压缩算法

引言 当想要压缩一张彩色图像时,彩色图像通常由数百万个颜色值组成,每个颜色值都由红、绿、蓝三个分量组成。因此,如果我们直接对图像的每个像素进行编码,会导致非常大的数据量。为了减少数据量,我们可以尝试减少颜色的数量,从而降低存储需求。 1.主要原理 (一)颜色聚类(Color Clustering):

python轻量级性能工具-Locust

Locust基于python的协程机制,打破了线程进程的限制,可以能够在一台测试机上跑高并发 性能测试基础 1.快慢:衡量系统的处理效率:响应时间 2.多少:衡量系统的处理能力:单位时间内能处理多少个事务(tps) 性能测试根据测试需求最常见的分为下面三类 1 负载测试load testing 不断

Python按条件筛选、剔除表格数据并绘制剔除前后的直方图

本文介绍基于Python语言,读取Excel表格文件数据,以其中某一列数据的值为标准,对于这一列数据处于指定范围的所有行,再用其他几列数据的数值,加以数据筛选与剔除;同时,对筛选前、后的数据分别绘制若干直方图,并将结果数据导出保存为一个新的Excel表格文件的方法~

核对不同文件夹所含内容的差异并提取缺失内容:Python代码

本文介绍基于Python语言,以一个大文件夹作为标准,对另一个大文件夹所包含的子文件夹或文件加以查漏补缺,并将查漏补缺的结果输出的方法~

基于Python和TensorFlow实现BERT模型应用

本文分享自华为云社区《使用Python实现深度学习模型:BERT模型教程》,作者: Echo_Wish。 BERT(Bidirectional Encoder Representations from Transformers)是Google提出的一种用于自然语言处理(NLP)的预训练模型。BERT

Python遥感影像叠加分析:基于一景数据提取另一数据

本文介绍基于Python中GDAL模块,实现基于一景栅格影像,对另一景栅格影像的像元数值加以叠加提取的方法。 本文期望实现的需求为:现有一景表示6种不同植被类型的.tif格式栅格数据,以及另一景与前述栅格数据同区域的、表示植被参数的.tif格式栅格数据;我们希望基于前者中的植被类型数据,分别提取6种

Python结合文件名称将多个文件复制到不同路径下

本文介绍基于Python语言,针对一个文件夹下的大量栅格遥感影像文件,基于其各自的文件名,分别创建指定名称的新文件夹,并将对应的栅格遥感影像文件复制到不同的新文件夹下的方法~

Python依据遥感影像的分幅筛选出对应的栅格文件

本文介绍基于Python语言,结合已知研究区域中所覆盖的全部遥感影像的分幅条带号,从大量的遥感影像文件中筛选落在这一研究区域中的遥感影像文件的方法~

将大量文件的拓展名中大写字母改为小写:Python实现

本文介绍基于Python语言,基于一个大文件夹,遍历其中的多个子文件夹,对于每一个子文件夹中的大量文件,批量将其文件的名称或后缀名中的字母由大写修改为小写的方法~