Python中过滤字符串列表的方法


Posted in Python onDecember 22, 2020

Python使用列表数据类型在顺序索引中存储多个数据。它的工作方式类似于其他编程语言的数字数组。filter()方法是Python的一种非常有用的方法。可以使用filter()方法从Python中的任何字符串、列表或字典中过滤一个或多个数值。它根据任何特定条件过滤数据。当条件返回true时,它将存储数据,而返回false时将丢弃数据。本文通过使用不同的示例展示了如何在Python中过滤列表中的字符串数据。您必须使用Python 3+来测试本文的示例。

使用另一个列表过滤字符串列表

本示例说明了如何在不使用任何方法的情况下过滤字符串列表中的数据。 字符串列表在此使用另一个列表进行过滤。 在此,声明了两个列表变量,名称分别为list1和list2。 使用list1的值过滤list2的值。 该脚本会将list2的每个值的第一个单词与list1的值进行匹配,并打印list1中不存在的那些值。

#coding=utf-8
# 声明两个列表变量
list1 = ['Python', 'PHP', 'Java', 'Bash']
list2 = ['JavaScript是客户端脚本语言',
    'PHP是服务器端脚本语言',
     'Java是一种编程语言',
    'Kotlin是一种静态编程语言']

# 根据第一个列表过滤第二个列表
filter_data = [x for x in list2 if
       all(y not in x for y in list1)]

# 在过滤前和过滤后打印列表数据
print("第一个列表的内容:", list1)
print("第二个列表的内容:", list2)
print("过滤后的第二个列表的内容:", filter_data)

运行脚本。 在此,list1不包含单词“Kotlin”。 输出将仅包含list2中的一个值,即 ['Kotlin是一种静态编程语言']。

如何在Python中过滤字符串列表

输出如下:

第一个列表的内容: ['Python', 'PHP', 'Java', 'Bash']
第二个列表的内容: ['JavaScript是客户端脚本语言', 'PHP是服务器端脚本语言', 'Java是一种编程语言', 'Kotlin是一种静态编程语言']
过滤后的第二个列表的内容: ['Kotlin是一种静态编程语言']

使用另一个列表和自定义函数过滤字符串列表

本示例说明如何使用另一个列表和自定义过滤器功能过滤字符串列表。 该脚本包含两个名为list1和list2的列表变量。 自定义过滤器功能将找出两个列表变量的公共值。

# 声明两个列表变量
list1 = ['100', '67', '39', '505', '122', '287', '399']
list2 = ['70', '100', '308', '415', '362', '230']

# 声明一个函数来过滤第一个列表中的数据
def Filter(list1, list2):
  return [n for n in list1 if
      any(m in n for m in list2)]

# 在过滤器之前和之后打印列表数据
print("list1的的内容:", list1)
print("list2的的内容:", list2)
print("过滤后的数据",Filter(list1, list2))

运行脚本。 两个列表变量中都存在100的值。 运行脚本后,将生成以下输出。

list1的的内容: ['100', '67', '39', '505', '122', '287', '399']
list2的的内容: ['70', '100', '308', '415', '362', '230']
过滤后的数据 ['100']

使用正则表达式过滤字符串列表

通过使用前两个示例中的all()和any()方法来过滤列表。 在此示例中,使用正则表达式从列表中过滤数据。 正则表达式是一种模式,通过该模式可以搜索或匹配任何数据。 Python中使用're'模块在脚本中应用正则表达式。 在此,使用主题代码声明列表。 正则表达式用于过滤以“ CSE”开头的主题代码。 正则表达式模式中使用'^'符号在文本的开头进行搜索。

# 导入re模块以使用正则表达式
import re

# 声明列表包含科目编号
sublist = ['IDC-108', 'OKY-309', 'IDC-709', 'PHP-102', 'MIO-801']

# 声明过滤功能
def Filter(datalist):
  # 根据列表中的正则表达式搜索数据
  return [val for val in datalist
    if re.search(r'^IDC', val)]

# 打印过滤器数据
print(Filter(sublist))

运行脚本。 子列表变量包含两个以“IDC”开头的值。 运行脚本后,将显示以下输出。

['IDC-108', 'IDC-709']

使用lamda表达式过滤字符串列表

本示例说明了使用lamda表达式从字符串列表中过滤数据。 在这里,名为search_word的列表变量用于从名为text的文本变量中过滤内容。 通过使用split()方法,基于空间将文本内容转换为名为text_word的列表。 lamda表达式将忽略text_word中存在于search_word中的那些值,并通过添加空格将过滤后的值存储在变量中。

# 声明一个包含linuxidc_word中关键词的列表
linuxidc_word = ["系统", "linuxidc", "Python", "Kotlin"]

# 定义文本,从列表中搜索单词
text = "Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!"

# 根据空格分割文本并将单词存储在列表中
text_word = text.split()

# 使用lambda表达式过滤数据
filter_text = ' '.join((filter(lambda val: val not in linuxidc_word, text_word)))

# 在过滤前和过滤后打印文本
print("\n过滤前的文本:\n", text)
print("过滤后的文本:\n", filter_text)

运行脚本。 运行脚本后,将显示以下输出。

过滤前的文本:
Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!
过滤后的文本:
Linux公社 是专业的 Linux 门户网站,实时发布 最新 资讯!

使用filter()方法过滤字符串列表

filter()方法接受两个参数。 第一个参数采用函数名称或“ None”,第二个参数采用列表变量的名称作为值。 filter()方法如果返回true,则从列表中存储这些数据,否则将丢弃该数据。 在此,第一个参数值不指定任何值。 所有不为false的值将从列表中检索为已过滤数据。

#声明混合数据列表
listData = ['linuxidc', 90, 9, 'com', 100, False, 22, True, '1']

# 使用None和列表调用filter()方法
filteredData = filter(None, listData)

#过滤数据后打印列表
print('过滤后的列表:')
for val in filteredData:
  print(val)

运行脚本。该列表只包含一个false值,在过滤后的数据中将省略该false值。

总结:

当您需要从列表中搜索和检索特定值时, 过滤非常有用。我希望上面的例子能帮助读者理解从字符串列表中过滤数据的方法。

作者: wyh草样

出处:https://www.cnblogs.com/wyh0923/p/14166552.html

以上就是Python中过滤字符串列表的方法的详细内容,更多关于Python中过滤字符串列表的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python通过yield实现数组全排列的方法
Mar 18 Python
Python中的defaultdict模块和namedtuple模块的简单入门指南
Apr 01 Python
python根据京东商品url获取产品价格
Aug 09 Python
Python字典及字典基本操作方法详解
Jan 30 Python
利用Django-environ如何区分不同环境
Aug 26 Python
python通过TimedRotatingFileHandler按时间切割日志
Jul 17 Python
python实现文件批量编码转换及注意事项
Oct 14 Python
调用其他python脚本文件里面的类和方法过程解析
Nov 15 Python
Pandas实现DataFrame按行求百分数(比例数)
Dec 27 Python
python爬虫开发之urllib模块详细使用方法与实例全解
Mar 09 Python
Python pysnmp使用方法及代码实例
Aug 24 Python
Python基于callable函数检测对象是否可被调用
Oct 16 Python
python中@property的作用和getter setter的解释
Dec 22 #Python
地图可视化神器kepler.gl python接口的使用方法
Dec 22 #Python
Python实现Word文档转换Markdown的示例
Dec 22 #Python
python爬虫利用selenium实现自动翻页爬取某鱼数据的思路详解
Dec 22 #Python
Django中ORM的基本使用教程
Dec 22 #Python
python通用数据库操作工具 pydbclib的使用简介
Dec 21 #Python
Python 多进程原理及实现
Dec 21 #Python
You might like
几个php应用技巧
2008/03/27 PHP
php排序算法(冒泡排序,快速排序)
2012/10/09 PHP
PHP数据集构建JSON格式及新数组的方法
2012/11/07 PHP
destoon官方标签大全
2014/06/20 PHP
PHP 实现base64编码文件上传出现问题详解
2020/09/01 PHP
使用Javascript和DOM Interfaces来处理HTML
2006/10/09 Javascript
用javascript实现给出的盒子的序列是否可连为一矩型
2007/08/30 Javascript
javascript 静态对象和构造函数的使用和公私问题
2010/03/02 Javascript
JQuery遍历json数组的3种方法
2014/11/08 Javascript
jQuery检测鼠标左键和右键点击的方法
2015/03/17 Javascript
Boostrap入门准备之border box
2016/05/09 Javascript
JS判断图片是否加载完成方法汇总(最新版)
2016/05/13 Javascript
javascript实现起伏的水波背景效果
2016/05/16 Javascript
javascript self对象使用详解
2016/10/18 Javascript
javascript笔记之匿名函数和闭包
2017/02/06 Javascript
gulp加批处理(.bat)实现ng多应用一键自动化构建
2017/02/16 Javascript
JavaScript使用Ajax上传文件的示例代码
2017/08/10 Javascript
JavaScript高阶教程之“==”隐藏下的类型转换
2019/04/11 Javascript
websocket4.0+typescript 实现热更新的方法
2019/08/14 Javascript
小程序分享链接onShareAppMessage的具体用法
2020/05/22 Javascript
[02:43]DOTA2英雄基础教程 半人马战行者
2014/01/13 DOTA
[33:33]完美世界DOTA2联赛PWL S2 FTD.C vs SZ 第二场 11.27
2020/11/30 DOTA
python实现的重启关机程序实例
2014/08/21 Python
Python中的类与对象之描述符详解
2015/03/27 Python
Python 登录网站详解及实例
2017/04/11 Python
利用python脚本如何简化jar操作命令
2019/02/24 Python
python set内置函数的具体使用
2019/07/02 Python
Python使用psutil获取进程信息的例子
2019/12/17 Python
Tensorflow设置显存自适应,显存比例的操作
2020/02/03 Python
纯CSS3打造属于自己的“小黄人”
2016/03/14 HTML / CSS
New Balance美国官网:运动鞋和健身服装
2017/04/11 全球购物
MUGLER官方网站:蒂埃里·穆勒香水
2019/11/26 全球购物
100%羊绒:NakedCashmere
2020/08/26 全球购物
求职推荐信范文
2013/12/01 职场文书
优秀实习自我鉴定
2013/12/04 职场文书
行政秘书工作自我鉴定
2014/09/15 职场文书