Power Query中的分组依据,类似于Excel中的分类汇总功能,可以按照某一分类对某列数据或某几列数据进行去重操作和聚合计算(求和、计数、求平均、非重复行计数等),并在去重的过程中将其他数据列按照用户指定的方式,
对其进行聚合以便生成与依据列相对应的数据。在实际工作中,当我们遇到原始数据下沉维度大,导致数据行数过多时,我们也可以考虑通过分组依据,来收缩我们的统计维度。灵活的根据数据需求,去聚合我们的数据,以便后期的
数据分析,是我们处理数据时,必须掌握的一个能力。
下面我们就来举一个例子,来试试分组依据的功能。
这是一个虚拟的商品销售表,数据维度有,商品、区域、订单状态、门店属性,以及销售金额。
我们现在有一个目标是需要商品、门店属性下的销售额
首先,需要导入数据源进入pq,这里就不做演示了。
在主页选项卡下,有分组依据按钮,点击即可进入。
分组依据:选择以哪个数据列作为分组条件
新列名:用于承载聚合操作结果的新列名名称,自定义命名即可,但不能和现有的列名重复
操作:指定具体的聚合操作方法,主要可选有求和、平均值、中值、最大值、最小值、对行进行计数、非重复行计数以及所有行
柱:指定用于进行聚合计算的数据列,若操作是针对计数,那么柱选项无须填写
这里我们需要统计的是门店属性,商品的销售金额,所以分别对应选择即可。
最后输出下面结果。
尽管简单的界面操作,即可完成聚合操作,但是实际的应用中,我们需要对自己的数据源有一定的了解,再进行维度的聚合。根据自己实际的数据需求,去整合数据。
以上就是本次的分享,我是simone,期待下次的相遇。
详细视频可以B站搜索,ms_excel博主,看leila的视频翻译课,powerquery从入门到精通。 后续也会根据自己工作来更新这部分的实际用法。