#Python 文本包含函数,pandas库 Series.str.contains 函数

python,文本,包含,函数,pandas,series,str,contains · 浏览次数 : 243

小编点评

**代码示例:** ```python import pandas as pd # 数据源 source_data = r"E:/360MoveData/Users/B/Desktop/pandas_test.xlsx" # 筛选条件 t1 = source_data["门店属性"].str.contains("直营") t2 = source_data["订单状态"].str.contains("已完成") # 根据筛选条件返回成表 result = source_data[t1 & t2] # 输出成表 print(result.to_excel("output_data.xlsx")) ``` **示例输出:** ``` 门店属性 订单状态 销售金额门店属性 0 直营 已完成 1000 直营 1 直营 已完成 2000 直营 2 已完成 已完成 3000 已完成 ``` **说明:** * `str.contains()` 函数用于检查字符串中是否包含指定的字符或正则表达式。 * `t1 & t2` 是两个筛选条件的逻辑和运算。 * `na = False` 表示如果匹配失败,将返回 False。 * `regex = True` 表示默认正则表达式模式。 * `loc` 方法用于根据特定的列名筛选数据。

正文

一:基础的函数组成

’’‘Series.str.contains(pat,case = True,flags = 0,na = nan,regex = True)’’'
测试pattern或regex是否包含在Series或Index的字符串中。

返回布尔值系列或索引,具体取决于给定模式或正则表达式是否包含在系列或索引的字符串中。

pat : str类型
字符序列或正则表达式。

case : bool,默认为True
如果为True,区分大小写。

flags : int,默认为0(无标志)
标志传递到re模块,例如re.IGNORECASE。

na : 默认NaN
填写缺失值的值。

regex : bool,默认为True
如果为True,则假定pat是正则表达式。

如果为False,则将pat视为文字字符串。

二:示例应用

2.1 数据源展示

模拟一个奶茶销售表,包含商品名称,订单状态,销售金额,门店属性四个维度。

 

 

 2.2 条件筛选(多列)

假设需求:目前需要直营门店、已完成状态的销售表

#模块导入
import pandas as pd 
import numpy as np
#路径设置
source_data = r"E:/360MoveData/Users/B/Desktop/pandas_test.xlsx"
out_put = r"E:/360MoveData/Users/B/Desktop/output_data.xlsx"
#筛选条件设置
t1 = data1["门店属性"].str.contains("直营")
t2 = data1["订单状态"].str.contains("已完成")
#根据筛选条件返回成表
result = data1[t1&t2]
#输出成表
print(result)
#导出
result.to_excel(out_put)

 输出结果,如下。

 

 

 通过函数我们可以同时控制多个列的筛选条件,并输出成表。

2.3 文本筛选(同一列)

仍旧使用前文的数据源

现在我们假设需求:商品品名中含有"奶茶",或者"果茶"的商品销售表

首先,我们来试试上一种方式,可以看到,这里的输出并不是我们想要的表

 

这里,我们换一个方式来实现。

data1.loc[data1["商品"].str.contains("奶茶|果茶",na = False),"订单判断"] = "目标订单"

  

 

 可以看到,商品这一列中含有奶茶、果茶的商品被标记了。

3:总结

利用str.contains,我们可以筛选同一列,不同列的数据,对于活动清洗、订单清洗等数据清洗环节,可以更快的标记对应的订单。

我是simone,期待下次的分享。

 

 

  

与#Python 文本包含函数,pandas库 Series.str.contains 函数相似的内容:

#Python 文本包含函数,pandas库 Series.str.contains 函数

一:基础的函数组成 ’’‘Series.str.contains(pat,case = True,flags = 0,na = nan,regex = True)’’'测试pattern或regex是否包含在Series或Index的字符串中。 返回布尔值系列或索引,具体取决于给定模式或正则表达式是

21.1 使用PEfile分析PE文件

PeFile模块是`Python`中一个强大的便携式第三方`PE`格式分析工具,用于解析和处理`Windows`可执行文件。该模块提供了一系列的API接口,使得用户可以通过`Python`脚本来读取和分析PE文件的结构,包括文件头、节表、导入表、导出表、资源表、重定位表等等。此外,PEfile模块还可以帮助用户进行一些恶意代码分析,比如提取样本中的字符串、获取函数列表、重构导入表、反混淆等等。PE

深入理解 python 虚拟机:原来虚拟机是这么实现闭包的

在本篇文章当中主要从虚拟机层面讨论函数闭包是如何实现的,所谓闭包就是将函数和环境存储在一起的记录。这里有三个重点一个是函数,一个是环境(简单说来就是程序当中变量),最后一个需要将两者组合在一起所形成的东西,才叫做闭包。

< Python全景系列-4 > 史上最全文件类型读写库大盘点!什么?还包括音频、视频?

介绍史上最全PYTHON文件类型读写库大盘点!包含常用和不常用的大量文件格式!文本、音频、视频应有尽有!废话不多说!走起来!

【玩转鲲鹏DevKit系列】何如快速迁移有源码应用

本文分享自华为云社区《【玩转鲲鹏DevKit系列】何如快速迁移有源码应用》,作者:华为云社区精选 。 源码(也称源程序)是程序员编写的计算机程序的文本形式,不同的编程语言有不同的语法和规则,常见类型包含解释型语言(JAVA/Python 等 )编译型语言(C/C++/GO等)、汇编语言等。程序员可以

【转帖】python 安装whl文件

前言 WHL文件是以Wheel格式保存的Python安装包,Wheel是Python发行版的标准内置包格式。在本质上是一个压缩包,WHL文件中包含了Python安装的py文件和元数据,以及经过编译的pyd文件,这样就使得它可以在不具备编译环境的条件下,安装适合自己python版本的库文件。 如果要查

掌握Python文件操作:从基础到高阶的全方位探索

**在本篇博客中,我们将全面、深入地探讨Python中的文件操作。文件操作在Python编程中是不可或缺的一部分,它包含了打开、读取、写入和关闭文件等各种操作。我们将从基础的文件操作讲解到高级的文件处理技巧,以及如何优雅地使用Python进行文件操作。每一部分我们都会分享一些独特的用法,并且附有具体

一篇文章掌握Python中多种表达式的使用:算术表达式、字符串表达式、列表推导式、字典推导式、_集合推导式、_生成器表达式、逻辑表达式、函数调用表达式

Python 中的表达式可以包含各种元素,如变量、常量、运算符、函数调用等。以下是 Python 表达式的一些分类及其详细例子: 1. 算术表达式 算术表达式涉及基本的数学运算,如加、减、乘、除等。 # 加法表达式 sum = 3 + 5 # 结果为 8 # 乘法表达式 product = 4 *

Python 将PowerPoint (PPT/PPTX) 转为HTML

PPT是传递信息、进行汇报和推广产品的重要工具。然而,有时我们需要将这些精心设计的PPT演示文稿发布到网络上,以便于更广泛的访问和分享。本文将介绍如何使用Python将PowerPoint文档转换为网页友好的HTML格式。包含两个简单示例: Python 将PowerPoint文档转为HTML格式

核对不同文件夹所含内容的差异并提取缺失内容:Python代码

本文介绍基于Python语言,以一个大文件夹作为标准,对另一个大文件夹所包含的子文件夹或文件加以查漏补缺,并将查漏补缺的结果输出的方法~