Python中过滤字符串列表的方法


Posted in Python onDecember 22, 2020

Python使用列表数据类型在顺序索引中存储多个数据。它的工作方式类似于其他编程语言的数字数组。filter()方法是Python的一种非常有用的方法。可以使用filter()方法从Python中的任何字符串、列表或字典中过滤一个或多个数值。它根据任何特定条件过滤数据。当条件返回true时,它将存储数据,而返回false时将丢弃数据。本文通过使用不同的示例展示了如何在Python中过滤列表中的字符串数据。您必须使用Python 3+来测试本文的示例。

使用另一个列表过滤字符串列表

本示例说明了如何在不使用任何方法的情况下过滤字符串列表中的数据。 字符串列表在此使用另一个列表进行过滤。 在此,声明了两个列表变量,名称分别为list1和list2。 使用list1的值过滤list2的值。 该脚本会将list2的每个值的第一个单词与list1的值进行匹配,并打印list1中不存在的那些值。

#coding=utf-8
# 声明两个列表变量
list1 = ['Python', 'PHP', 'Java', 'Bash']
list2 = ['JavaScript是客户端脚本语言',
    'PHP是服务器端脚本语言',
     'Java是一种编程语言',
    'Kotlin是一种静态编程语言']

# 根据第一个列表过滤第二个列表
filter_data = [x for x in list2 if
       all(y not in x for y in list1)]

# 在过滤前和过滤后打印列表数据
print("第一个列表的内容:", list1)
print("第二个列表的内容:", list2)
print("过滤后的第二个列表的内容:", filter_data)

运行脚本。 在此,list1不包含单词“Kotlin”。 输出将仅包含list2中的一个值,即 ['Kotlin是一种静态编程语言']。

如何在Python中过滤字符串列表

输出如下:

第一个列表的内容: ['Python', 'PHP', 'Java', 'Bash']
第二个列表的内容: ['JavaScript是客户端脚本语言', 'PHP是服务器端脚本语言', 'Java是一种编程语言', 'Kotlin是一种静态编程语言']
过滤后的第二个列表的内容: ['Kotlin是一种静态编程语言']

使用另一个列表和自定义函数过滤字符串列表

本示例说明如何使用另一个列表和自定义过滤器功能过滤字符串列表。 该脚本包含两个名为list1和list2的列表变量。 自定义过滤器功能将找出两个列表变量的公共值。

# 声明两个列表变量
list1 = ['100', '67', '39', '505', '122', '287', '399']
list2 = ['70', '100', '308', '415', '362', '230']

# 声明一个函数来过滤第一个列表中的数据
def Filter(list1, list2):
  return [n for n in list1 if
      any(m in n for m in list2)]

# 在过滤器之前和之后打印列表数据
print("list1的的内容:", list1)
print("list2的的内容:", list2)
print("过滤后的数据",Filter(list1, list2))

运行脚本。 两个列表变量中都存在100的值。 运行脚本后,将生成以下输出。

list1的的内容: ['100', '67', '39', '505', '122', '287', '399']
list2的的内容: ['70', '100', '308', '415', '362', '230']
过滤后的数据 ['100']

使用正则表达式过滤字符串列表

通过使用前两个示例中的all()和any()方法来过滤列表。 在此示例中,使用正则表达式从列表中过滤数据。 正则表达式是一种模式,通过该模式可以搜索或匹配任何数据。 Python中使用're'模块在脚本中应用正则表达式。 在此,使用主题代码声明列表。 正则表达式用于过滤以“ CSE”开头的主题代码。 正则表达式模式中使用'^'符号在文本的开头进行搜索。

# 导入re模块以使用正则表达式
import re

# 声明列表包含科目编号
sublist = ['IDC-108', 'OKY-309', 'IDC-709', 'PHP-102', 'MIO-801']

# 声明过滤功能
def Filter(datalist):
  # 根据列表中的正则表达式搜索数据
  return [val for val in datalist
    if re.search(r'^IDC', val)]

# 打印过滤器数据
print(Filter(sublist))

运行脚本。 子列表变量包含两个以“IDC”开头的值。 运行脚本后,将显示以下输出。

['IDC-108', 'IDC-709']

使用lamda表达式过滤字符串列表

本示例说明了使用lamda表达式从字符串列表中过滤数据。 在这里,名为search_word的列表变量用于从名为text的文本变量中过滤内容。 通过使用split()方法,基于空间将文本内容转换为名为text_word的列表。 lamda表达式将忽略text_word中存在于search_word中的那些值,并通过添加空格将过滤后的值存储在变量中。

# 声明一个包含linuxidc_word中关键词的列表
linuxidc_word = ["系统", "linuxidc", "Python", "Kotlin"]

# 定义文本,从列表中搜索单词
text = "Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!"

# 根据空格分割文本并将单词存储在列表中
text_word = text.split()

# 使用lambda表达式过滤数据
filter_text = ' '.join((filter(lambda val: val not in linuxidc_word, text_word)))

# 在过滤前和过滤后打印文本
print("\n过滤前的文本:\n", text)
print("过滤后的文本:\n", filter_text)

运行脚本。 运行脚本后,将显示以下输出。

过滤前的文本:
Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!
过滤后的文本:
Linux公社 是专业的 Linux 门户网站,实时发布 最新 资讯!

使用filter()方法过滤字符串列表

filter()方法接受两个参数。 第一个参数采用函数名称或“ None”,第二个参数采用列表变量的名称作为值。 filter()方法如果返回true,则从列表中存储这些数据,否则将丢弃该数据。 在此,第一个参数值不指定任何值。 所有不为false的值将从列表中检索为已过滤数据。

#声明混合数据列表
listData = ['linuxidc', 90, 9, 'com', 100, False, 22, True, '1']

# 使用None和列表调用filter()方法
filteredData = filter(None, listData)

#过滤数据后打印列表
print('过滤后的列表:')
for val in filteredData:
  print(val)

运行脚本。该列表只包含一个false值,在过滤后的数据中将省略该false值。

总结:

当您需要从列表中搜索和检索特定值时, 过滤非常有用。我希望上面的例子能帮助读者理解从字符串列表中过滤数据的方法。

作者: wyh草样

出处:https://www.cnblogs.com/wyh0923/p/14166552.html

以上就是Python中过滤字符串列表的方法的详细内容,更多关于Python中过滤字符串列表的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
简单的抓取淘宝图片的Python爬虫
Dec 25 Python
Python中的迭代器与生成器高级用法解析
Jun 28 Python
老生常谈python中的重载
Nov 11 Python
Python使用指定字符长度切分数据示例
Dec 05 Python
python GUI库图形界面开发之PyQt5 Qt Designer工具(Qt设计师)详细使用方法及Designer ui文件转py文件方法
Feb 26 Python
PyCharm 2020.2下配置Anaconda环境的方法步骤
Sep 23 Python
python按照list中字典的某key去重的示例代码
Oct 13 Python
详解python3类型注释annotations实用案例
Jan 20 Python
Django中template for如何使用方法
Jan 31 Python
SpringBoot首页设置解析(推荐)
Feb 11 Python
利用Python+OpenCV三步去除水印
May 28 Python
python读取mat文件生成h5文件的实现
Jul 15 Python
python中@property的作用和getter setter的解释
Dec 22 #Python
地图可视化神器kepler.gl python接口的使用方法
Dec 22 #Python
Python实现Word文档转换Markdown的示例
Dec 22 #Python
python爬虫利用selenium实现自动翻页爬取某鱼数据的思路详解
Dec 22 #Python
Django中ORM的基本使用教程
Dec 22 #Python
python通用数据库操作工具 pydbclib的使用简介
Dec 21 #Python
Python 多进程原理及实现
Dec 21 #Python
You might like
PHP句法规则详解 入门学习
2011/11/09 PHP
10款PHP开源商城系统汇总介绍
2015/07/23 PHP
PHP中SSO Cookie登录分析和实现
2015/11/06 PHP
PHP基于回溯算法解决n皇后问题的方法示例
2017/11/07 PHP
php strftime函数获取日期时间(switch用法)
2018/05/16 PHP
yii2中关于加密解密的那些事儿
2018/06/12 PHP
页面中iframe相互传值传参
2009/12/13 Javascript
基于jquery的动态创建表格的插件
2011/04/05 Javascript
javascript函数定义的几种区别小结
2014/01/06 Javascript
Javascript中的数据类型之旅
2015/10/18 Javascript
jquery实现图片上传前本地预览功能
2016/05/10 Javascript
JavaScript实现翻页功能(附效果图)
2017/02/16 Javascript
jquery实现焦点轮播效果
2017/02/23 Javascript
jQuery插件zTree实现单独选中根节点中第一个节点示例
2017/03/08 Javascript
使用vue和datatables进行表格的服务器端分页实例代码
2017/06/07 Javascript
利用Vue实现移动端图片轮播组件的方法实例
2017/08/23 Javascript
vue 封装面包屑组件教程
2020/11/16 Javascript
[02:23]2014DOTA2国际邀请赛中国战队回顾
2014/08/01 DOTA
wxpython中利用线程防止假死的实现方法
2014/08/11 Python
Python常用的爬虫技巧总结
2016/03/28 Python
python中强大的format函数实例详解
2018/12/05 Python
Python实现的调用C语言函数功能简单实例
2019/03/13 Python
TensorFlow基于MNIST数据集实现车牌识别(初步演示版)
2019/08/05 Python
浅析Python 条件控制语句
2020/07/15 Python
如何将json数据转换为python数据
2020/09/04 Python
python openssl模块安装及用法
2020/12/06 Python
关于h5中的fetch方法解读(小结)
2017/11/15 HTML / CSS
500字小学生检讨书
2015/02/19 职场文书
二十年同学聚会感言
2015/07/30 职场文书
退休欢送会致辞
2015/07/31 职场文书
《暗黑破坏神2:重制版》本周进行第一轮A测 目前可官网进行申请报名
2021/04/07 其他游戏
关于Oracle12C默认用户名system密码不正确的解决方案
2021/10/16 Oracle
CSS使用伪类控制边框长度的方法
2022/01/18 HTML / CSS
Apache Pulsar集群搭建部署详细过程
2022/02/12 Servers
超越Nginx的Web服务器caddy优雅用法
2022/06/21 Servers
CSS中理解层叠性及权重如何分配
2022/12/24 HTML / CSS