用python获取txt文件中关键字的数量


Posted in Python onDecember 24, 2020

缘起:

开发人员需要tomcat中一个项目在一个月的访问请求量,因其他原因只剩下查找tomcat请求日志的方法获取,刚好最近在学习python,于是就用python摸索了下;

大体思路:

                  1.把相应tomcat的日志文件拷到有python环境的机器

 2.用os.listdir()获取到目录下所有文件名称的列表,再用for循环遍历列表加上字符串拼接得到已文件名的具体路径

 3.用open()读取文件,下面代码中for line in f:是按行读取txt文件的内容(一行一行的读,不会加载全部文件内容)

 4.用count()方法统计以项目为名的关键字(字符串)

知识点:

文件的读取和count()方法

Python count() 方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。

count()方法语法:str.count(sub, start= 0,end=len(string))

参数:

  • sub -- 搜索的子字符串
  • start -- 字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。
  • end -- 字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。

代码如下

(如果文件过多可以加工作队列(gevent库)):

import os

# 打?日?文件并计数
def read_log(url,keyword):
  count = 0
  with open(url,'r',encoding='utf-8') as f:  # 打开文件
  for line in f:                  # 按行读取txt文件
    count += line.count(keyword,53,64)  # count()方法计数,keyword为传入的关键字(字符串)
return count

path= 'E:\\python\\vscode\\工作\\log\\80\\'
dirlist = os.listdir(path)  # 获取path路径下的所有txt文件名

sum = 0
for name in dirlist: 

# 遍历获取txt文件名
  url = path + name
  num = read_log(url,keyword)
  print(str(name) + ' 文件中个数为: ' + str(num))
  sum += num
print('关键字总个数: ' + str(sum))

以上就是用python获取txt文件中关键字的数量的详细内容,更多关于python 获取关键字的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python中的map、reduce和filter浅析
Apr 26 Python
python去除文件中空格、Tab及回车的方法
Apr 12 Python
详解Python中的文件操作
Aug 28 Python
Django自定义插件实现网站登录验证码功能
Apr 19 Python
python编程实现12306的一个小爬虫实例
Dec 27 Python
浅谈python的输入输出,注释,基本数据类型
Apr 02 Python
python读写配置文件操作示例
Jul 03 Python
Django框架model模型对象验证实现方法分析
Oct 02 Python
python Qt5实现窗体跟踪鼠标移动
Dec 13 Python
关于Tensorflow使用CPU报错的解决方式
Feb 05 Python
Python 使用 PyQt5 开发的关机小工具分享
Jul 16 Python
Python变量及数据类型用法原理汇总
Aug 06 Python
举例讲解Python装饰器
Dec 24 #Python
python 基于opencv操作摄像头
Dec 24 #Python
python 基于selenium实现鼠标拖拽功能
Dec 24 #Python
python实现简单猜单词游戏
Dec 24 #Python
Python 虚拟环境工作原理解析
Dec 24 #Python
python基于openpyxl生成excel文件
Dec 23 #Python
Python+unittest+requests+excel实现接口自动化测试框架
Dec 23 #Python
You might like
php中引用符号(&)的使用详解
2013/11/13 PHP
PDO::commit讲解
2019/01/27 PHP
JQuery1.4+ Ajax IE8 内存泄漏问题
2010/10/15 Javascript
基于Jquery的仿照flash放大图片效果代码
2011/03/16 Javascript
js实例属性和原型属性示例详解
2014/11/23 Javascript
JQuery select(下拉框)操作方法汇总
2015/04/15 Javascript
Javascript闭包(Closure)详解
2015/05/05 Javascript
javascript正则表达式定义(语法)总结
2016/01/08 Javascript
Node.js 日志处理模块log4js
2016/08/28 Javascript
Windows系统下安装Node.js的步骤图文详解
2016/11/15 Javascript
如何理解Vue的作用域插槽的实现原理
2017/08/19 Javascript
javascript浏览器用户代理检测脚本实现方法
2017/10/27 Javascript
开发用到的js封装方法(20种)
2018/10/12 Javascript
微信小程序实现动态获取元素宽高的方法分析
2018/12/10 Javascript
vue elementUI table表格数据 滚动懒加载的实现方法
2019/04/04 Javascript
javascript实现商品图片放大镜
2019/11/28 Javascript
原生js实现五子棋游戏
2020/05/28 Javascript
解决element-ui的下拉框有值却无法选中的情况
2020/11/07 Javascript
JavaScript Html实现移动端红包雨功能页面
2021/01/10 Javascript
[42:56]VGJ.S vs Serenity 2018国际邀请赛小组赛BO2 第二场 8.19
2018/08/21 DOTA
python实现颜色rgb和hex相互转换的函数
2015/03/19 Python
用Python实现换行符转换的脚本的教程
2015/04/16 Python
深入探究Django中的Session与Cookie
2017/07/30 Python
python中xlrd模块的使用详解
2021/02/01 Python
详解HTML5中rel属性的prefetch预加载功能使用
2016/05/06 HTML / CSS
美国最大的烧烤架和户外生活用品专业零售商:Barbeques Galore
2021/01/09 全球购物
三年大学自我鉴定
2014/01/16 职场文书
建筑总经理岗位职责
2014/02/02 职场文书
安全生产网格化管理实施方案
2014/03/01 职场文书
工程质量承诺书
2014/03/27 职场文书
2014年房产销售工作总结
2014/12/08 职场文书
2014年幼儿园德育工作总结
2014/12/17 职场文书
2015年医德考评自我评价
2015/03/03 职场文书
三八妇女节主持词
2015/07/04 职场文书
如何写新闻稿
2015/07/18 职场文书
小学中队委竞选稿
2015/11/20 职场文书