python删除文本中行数标签的方法


Posted in Python onMay 31, 2018

问题描述:

我们在网上下载或者复制别人代码的时候经常会遇到下载的代码中包含行数标签的情况。如下图:

python删除文本中行数标签的方法

这些代码中包含着行数如1.,2.等,如果我们想直接运行或者copy代码需要自己手动的删除这些标签。既然学了python,我们写一段脚本来处理它吧。

思路分析:

首先,我们逐行的读取文本。

利用正则表达式,可以顺利地匹配出所有的这些标签以及后面跟随的“\t”,正则表达式为:“\d+.\t”。

接着我们将匹配的结果在这一行中删除它,使用string模块的replace方法,将匹配的结果用‘'代替。

最后,我们保存每次删除了行数标签的结果行,然后将这些行写入原文本。注意,以w的方式打开文本会删除原文本内容。

代码:

# -*- coding:utf-8 -*- 
import re 
import os 
import sys 
reload(sys) 
sys.setdefaultencoding('utf-8') 
 
ls = os.linesep 
label_regex = r'\d+.\t' 
content = [] 
for line in open('source.txt', 'r'): 
  mm = re.search(label_regex, line) 
  if mm: 
    mm = mm.group() 
    content.append(line.replace(mm, '').rstrip()) 
  else: 
    break 
f = open('source.txt', 'w') 
f.writelines(['%s%s' % (x,ls) for x in content])

结果:

python删除文本中行数标签的方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python在windows命令行下输出彩色文字的方法
Mar 19 Python
在Python程序中操作MySQL的基本方法
Jul 29 Python
Python HTTP客户端自定义Cookie实现实例
Apr 28 Python
简单了解Django模板的使用
Dec 20 Python
教你用一行Python代码实现并行任务(附代码)
Feb 02 Python
python生成器,可迭代对象,迭代器区别和联系
Feb 04 Python
带你认识Django
Jan 15 Python
Django rest framework jwt的使用方法详解
Aug 08 Python
python3下pygame如何实现显示中文
Jan 11 Python
Python爬取12306车次信息代码详解
Aug 12 Python
Python爬虫实现selenium处理iframe作用域问题
Jan 27 Python
图神经网络GNN算法
May 11 Python
Python使用wget实现下载网络文件功能示例
May 31 #Python
Python使用progressbar模块实现的显示进度条功能
May 31 #Python
python调用Matplotlib绘制分布点并且添加标签
May 31 #Python
python批量修改文件编码格式的方法
May 31 #Python
Python用for循环实现九九乘法表
May 31 #Python
python实现txt文件格式转换为arff格式
May 31 #Python
从django的中间件直接返回请求的方法
May 30 #Python
You might like
isset和empty的区别
2007/01/15 PHP
PHP微信开发之文本自动回复
2016/06/23 PHP
php实现贪吃蛇小游戏
2016/07/26 PHP
js事件冒泡实例分享(已测试)
2013/04/23 Javascript
JS获取键盘上任意按键的值(实例代码)
2013/11/12 Javascript
jquery用ajax方式从后台获取json数据后如何将内容填充到下拉列表
2015/08/26 Javascript
jQuery EasyUI 菜单与按钮之创建简单的菜单和链接按钮
2015/11/18 Javascript
javascript数据类型验证方法
2015/12/31 Javascript
学习javascript面向对象 javascript实现继承的方式
2016/01/04 Javascript
基于Vue 2.0的模块化前端 UI 组件库小结
2017/12/21 Javascript
总结javascript三元运算符知识点
2018/09/28 Javascript
八种Vue组件间通讯方式合集(推荐)
2020/08/18 Javascript
video.js添加自定义组件的方法
2020/12/09 Javascript
[01:45:05]VGJ.T vs Newbee Supermajor 败者组 BO3 第二场 6.6
2018/06/07 DOTA
python dict remove数组删除(del,pop)
2013/03/24 Python
python实现每次处理一个字符的三种方法
2014/10/09 Python
Python使用Scrapy爬虫框架全站爬取图片并保存本地的实现代码
2018/03/04 Python
浅谈tensorflow1.0 池化层(pooling)和全连接层(dense)
2018/04/27 Python
Python企业编码生成系统总体系统设计概述
2019/07/26 Python
jupyter notebook参数化运行python方式
2020/04/10 Python
Python 操作 PostgreSQL 数据库示例【连接、增删改查等】
2020/04/21 Python
Python图像读写方法对比
2020/11/16 Python
解决python3.x安装numpy成功但import出错的问题
2020/11/17 Python
Stokke美国官方网店:高级儿童家具、推车、汽车座椅和配件
2020/06/06 全球购物
size?荷兰官方网站:英国高级运动鞋精品店
2020/07/24 全球购物
Servlet如何得到服务器的信息
2015/12/22 面试题
重阳节登山活动方案
2014/02/03 职场文书
会计电算化大学生职业规划书
2014/02/05 职场文书
保洁公司服务承诺书
2014/05/28 职场文书
放飞梦想演讲稿600字
2014/08/26 职场文书
超市创业计划书
2014/09/15 职场文书
群众路线教育实践活动剖析材料
2014/09/30 职场文书
意向协议书
2015/01/27 职场文书
2015年幼儿园保育工作总结
2015/05/12 职场文书
详解nodejs内置模块
2021/05/06 NodeJs
Python 线程池模块之多线程操作代码
2021/05/20 Python