Python中过滤字符串列表的方法


Posted in Python onDecember 22, 2020

Python使用列表数据类型在顺序索引中存储多个数据。它的工作方式类似于其他编程语言的数字数组。filter()方法是Python的一种非常有用的方法。可以使用filter()方法从Python中的任何字符串、列表或字典中过滤一个或多个数值。它根据任何特定条件过滤数据。当条件返回true时,它将存储数据,而返回false时将丢弃数据。本文通过使用不同的示例展示了如何在Python中过滤列表中的字符串数据。您必须使用Python 3+来测试本文的示例。

使用另一个列表过滤字符串列表

本示例说明了如何在不使用任何方法的情况下过滤字符串列表中的数据。 字符串列表在此使用另一个列表进行过滤。 在此,声明了两个列表变量,名称分别为list1和list2。 使用list1的值过滤list2的值。 该脚本会将list2的每个值的第一个单词与list1的值进行匹配,并打印list1中不存在的那些值。

#coding=utf-8
# 声明两个列表变量
list1 = ['Python', 'PHP', 'Java', 'Bash']
list2 = ['JavaScript是客户端脚本语言',
    'PHP是服务器端脚本语言',
     'Java是一种编程语言',
    'Kotlin是一种静态编程语言']

# 根据第一个列表过滤第二个列表
filter_data = [x for x in list2 if
       all(y not in x for y in list1)]

# 在过滤前和过滤后打印列表数据
print("第一个列表的内容:", list1)
print("第二个列表的内容:", list2)
print("过滤后的第二个列表的内容:", filter_data)

运行脚本。 在此,list1不包含单词“Kotlin”。 输出将仅包含list2中的一个值,即 ['Kotlin是一种静态编程语言']。

如何在Python中过滤字符串列表

输出如下:

第一个列表的内容: ['Python', 'PHP', 'Java', 'Bash']
第二个列表的内容: ['JavaScript是客户端脚本语言', 'PHP是服务器端脚本语言', 'Java是一种编程语言', 'Kotlin是一种静态编程语言']
过滤后的第二个列表的内容: ['Kotlin是一种静态编程语言']

使用另一个列表和自定义函数过滤字符串列表

本示例说明如何使用另一个列表和自定义过滤器功能过滤字符串列表。 该脚本包含两个名为list1和list2的列表变量。 自定义过滤器功能将找出两个列表变量的公共值。

# 声明两个列表变量
list1 = ['100', '67', '39', '505', '122', '287', '399']
list2 = ['70', '100', '308', '415', '362', '230']

# 声明一个函数来过滤第一个列表中的数据
def Filter(list1, list2):
  return [n for n in list1 if
      any(m in n for m in list2)]

# 在过滤器之前和之后打印列表数据
print("list1的的内容:", list1)
print("list2的的内容:", list2)
print("过滤后的数据",Filter(list1, list2))

运行脚本。 两个列表变量中都存在100的值。 运行脚本后,将生成以下输出。

list1的的内容: ['100', '67', '39', '505', '122', '287', '399']
list2的的内容: ['70', '100', '308', '415', '362', '230']
过滤后的数据 ['100']

使用正则表达式过滤字符串列表

通过使用前两个示例中的all()和any()方法来过滤列表。 在此示例中,使用正则表达式从列表中过滤数据。 正则表达式是一种模式,通过该模式可以搜索或匹配任何数据。 Python中使用're'模块在脚本中应用正则表达式。 在此,使用主题代码声明列表。 正则表达式用于过滤以“ CSE”开头的主题代码。 正则表达式模式中使用'^'符号在文本的开头进行搜索。

# 导入re模块以使用正则表达式
import re

# 声明列表包含科目编号
sublist = ['IDC-108', 'OKY-309', 'IDC-709', 'PHP-102', 'MIO-801']

# 声明过滤功能
def Filter(datalist):
  # 根据列表中的正则表达式搜索数据
  return [val for val in datalist
    if re.search(r'^IDC', val)]

# 打印过滤器数据
print(Filter(sublist))

运行脚本。 子列表变量包含两个以“IDC”开头的值。 运行脚本后,将显示以下输出。

['IDC-108', 'IDC-709']

使用lamda表达式过滤字符串列表

本示例说明了使用lamda表达式从字符串列表中过滤数据。 在这里,名为search_word的列表变量用于从名为text的文本变量中过滤内容。 通过使用split()方法,基于空间将文本内容转换为名为text_word的列表。 lamda表达式将忽略text_word中存在于search_word中的那些值,并通过添加空格将过滤后的值存储在变量中。

# 声明一个包含linuxidc_word中关键词的列表
linuxidc_word = ["系统", "linuxidc", "Python", "Kotlin"]

# 定义文本,从列表中搜索单词
text = "Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!"

# 根据空格分割文本并将单词存储在列表中
text_word = text.split()

# 使用lambda表达式过滤数据
filter_text = ' '.join((filter(lambda val: val not in linuxidc_word, text_word)))

# 在过滤前和过滤后打印文本
print("\n过滤前的文本:\n", text)
print("过滤后的文本:\n", filter_text)

运行脚本。 运行脚本后,将显示以下输出。

过滤前的文本:
Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!
过滤后的文本:
Linux公社 是专业的 Linux 门户网站,实时发布 最新 资讯!

使用filter()方法过滤字符串列表

filter()方法接受两个参数。 第一个参数采用函数名称或“ None”,第二个参数采用列表变量的名称作为值。 filter()方法如果返回true,则从列表中存储这些数据,否则将丢弃该数据。 在此,第一个参数值不指定任何值。 所有不为false的值将从列表中检索为已过滤数据。

#声明混合数据列表
listData = ['linuxidc', 90, 9, 'com', 100, False, 22, True, '1']

# 使用None和列表调用filter()方法
filteredData = filter(None, listData)

#过滤数据后打印列表
print('过滤后的列表:')
for val in filteredData:
  print(val)

运行脚本。该列表只包含一个false值,在过滤后的数据中将省略该false值。

总结:

当您需要从列表中搜索和检索特定值时, 过滤非常有用。我希望上面的例子能帮助读者理解从字符串列表中过滤数据的方法。

作者: wyh草样

出处:https://www.cnblogs.com/wyh0923/p/14166552.html

以上就是Python中过滤字符串列表的方法的详细内容,更多关于Python中过滤字符串列表的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python模拟鼠标拖动操作的方法
Mar 11 Python
使用Python的Flask框架构建大型Web应用程序的结构示例
Jun 04 Python
解析Python中的__getitem__专有方法
Jun 27 Python
Python进阶_关于命名空间与作用域(详解)
May 29 Python
Tensorflow 自带可视化Tensorboard使用方法(附项目代码)
Feb 10 Python
python+opencv实现霍夫变换检测直线
Oct 23 Python
基于django传递数据到后端的例子
Aug 16 Python
Django上线部署之IIS的配置方法
Aug 22 Python
基于Python fminunc 的替代方法
Feb 29 Python
python 图像插值 最近邻、双线性、双三次实例
Jul 05 Python
python3 循环读取excel文件并写入json操作
Jul 14 Python
python实现跨年表白神器--你值得拥有
Jan 04 Python
python中@property的作用和getter setter的解释
Dec 22 #Python
地图可视化神器kepler.gl python接口的使用方法
Dec 22 #Python
Python实现Word文档转换Markdown的示例
Dec 22 #Python
python爬虫利用selenium实现自动翻页爬取某鱼数据的思路详解
Dec 22 #Python
Django中ORM的基本使用教程
Dec 22 #Python
python通用数据库操作工具 pydbclib的使用简介
Dec 21 #Python
Python 多进程原理及实现
Dec 21 #Python
You might like
PHP 分页类(模仿google)-面试题目解答
2009/09/13 PHP
php 二维数组时间排序实现代码
2016/11/19 PHP
PHP读取文本文件并逐行输出该行使用最多的字符与对应次数的方法
2016/11/25 PHP
在IE上直接编辑网页内容的js代码(IE地址栏js)
2009/04/27 Javascript
javascript new 需不需要继续使用
2009/07/02 Javascript
js实现兼容IE和FF的上下层的移动
2015/05/04 Javascript
深入探秘jquery瀑布流的实现
2016/01/30 Javascript
深入解析JavaScript框架Backbone.js中的事件机制
2016/02/14 Javascript
Jquery ui datepicker设置日期范围,如只能隔3天【实现代码】
2016/05/04 Javascript
javascript使用 concat 方法对数组进行合并的方法
2016/09/08 Javascript
jQuery之动画效果大全
2016/11/09 Javascript
Node.js+ES6+dropload.js实现移动端下拉加载实例
2017/06/01 Javascript
phantomjs导出html到pdf的方法总结
2017/10/19 Javascript
Vue封装Swiper实现图片轮播效果
2018/02/06 Javascript
Vue-cli Eslint在vscode里代码自动格式化的方法
2018/02/23 Javascript
JavaScript函数、闭包、原型、面向对象学习笔记
2018/09/06 Javascript
vue实现的树形结构加多选框示例
2019/02/02 Javascript
深入理解javascript中的this
2021/02/08 Javascript
简单介绍Python中的JSON模块
2015/04/08 Python
Python EOL while scanning string literal问题解决方法
2020/09/18 Python
Python解析树及树的遍历
2016/02/03 Python
Python利用QQ邮箱发送邮件的实现方法(分享)
2017/06/09 Python
Python加密方法小结【md5,base64,sha1】
2017/07/13 Python
解决DataFrame排序sort的问题
2018/06/07 Python
python+openCV调用摄像头拍摄和处理图片的实现
2019/08/06 Python
Python函数参数定义及传递方式解析
2020/06/10 Python
Python 捕获代码中所有异常的方法
2020/08/03 Python
Python常用扩展插件使用教程解析
2020/11/02 Python
美国护肤咨询及美容产品电商:Askderm
2017/02/24 全球购物
幼儿园消防安全制度
2014/01/26 职场文书
2014年端午节演讲稿范文
2014/05/23 职场文书
个人批评与自我批评发言稿
2014/09/28 职场文书
师范生见习报告范文
2014/11/03 职场文书
颐和园导游词
2015/01/30 职场文书
党风廉政教育心得体会2016
2016/01/22 职场文书
Django利用AJAX技术实现博文实时搜索
2021/05/06 Python