Python 包含汉字的文件读写之每行末尾加上特定字符


Posted in Python onDecember 12, 2016

      最近,接手的项目里,提供的数据文件格式简直让人看不下去,使用pandas打不开,一直是io error.仔细查看,发现文件中很多行数据是以"结尾,然而其他行缺失,因而需求也就很明显了:判断每行的结尾是否有",没有的话,加上就好了。

采用倒叙的方式好了,毕竟很多人需要的只是一个快速的解决方案,而不是一个why. 解决方案如下:

b = open('b_file.txt', w)
 with open('a_file.txt', 'r') as lines:
  for line in lines:
   line = line.strip()
   if not line.endswith(r'"'):
    line += r'"'
   line += '\n'
   b.write(line) 
 b.close()
 a.close()

其中整个过程的关键在于

line = line.strip()

之前我偷懒,直接使用省去了上面那行,结果在判断条件栽了跟头,程序认为每一行都不是以"结尾:

if not line.endswith(r'"')

硬着头皮试上去,重写:

for line in open(data_path+'heheda.txt', 'r'):
 if not line[-2] == r'"':
  print line
  line = line[:-1] + r'"' + line[-1:]
  print line

      此时判断条件为 if not line[-2] == r'"',这样才能得到除最后一行之外的正确结果。众所周知的原因,在windows系统中,文件的回车符是"\r\n",因而,在没有strip()处理好回车符的时候,需要手动在每一行的结尾前移一个字节进行判断每行的末尾。而对于文件的最后一行,一般情况下不是回车符作为结尾,毕竟不要换行了嘛。因而line[-2]则定位到了最后一个汉字的中间,将\xx\xx,硬写成了\xx"\xx,使得最后一个字显示错误。

以上所述是小编给大家介绍的Python 包含汉字的文件读写之每行末尾加上特定字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python开发编码规范
Sep 08 Python
python简单实现计算过期时间的方法
Jun 09 Python
python多进程共享变量
Apr 06 Python
python爬虫 正则表达式使用技巧及爬取个人博客的实例讲解
Oct 20 Python
python 信息同时输出到控制台与文件的实例讲解
May 11 Python
基于Django静态资源部署404的解决方法
Jul 28 Python
Tensorflow tensor 数学运算和逻辑运算方式
Jun 30 Python
基于python实现判断字符串是否数字算法
Jul 10 Python
Python实现快速大文件比较代码解析
Sep 04 Python
编写python代码实现简单抽奖器
Oct 20 Python
python“静态”变量、实例变量与本地变量的声明示例
Nov 13 Python
python基于tkinter制作m3u8视频下载工具
Apr 24 Python
详解python3百度指数抓取实例
Dec 12 #Python
python实现多线程抓取知乎用户
Dec 12 #Python
浅谈Python类里的__init__方法函数,Python类的构造函数
Dec 10 #Python
详解常用查找数据结构及算法(Python实现)
Dec 09 #Python
详解Python装饰器由浅入深
Dec 09 #Python
python利用正则表达式提取字符串
Dec 08 #Python
基于python的七种经典排序算法(推荐)
Dec 08 #Python
You might like
关于时间计算的结总
2006/12/06 PHP
PHP 使用header函数设置HTTP头的示例解析 表头
2013/06/17 PHP
php输入流php://input使用示例(php发送图片流到服务器)
2013/12/25 PHP
使用pthreads实现真正的PHP多线程(需PHP5.3以上版本)
2014/05/05 PHP
PHP中常用的魔术方法
2017/04/28 PHP
用cookies实现的可记忆的样式切换效果代码下载
2007/12/24 Javascript
JS input文本框禁用右键和复制粘贴功能的代码
2010/04/15 Javascript
javascript 闭包疑问
2010/12/30 Javascript
jquery密码强度校验
2015/12/02 Javascript
jQuery Mobile页面返回不需要重新get
2016/04/26 Javascript
JS弹出新窗口被拦截的解决方法
2016/08/09 Javascript
React-router中结合webpack实现按需加载实例
2017/05/25 Javascript
在页面中引入js的两种方法(推荐)
2017/08/29 Javascript
angular.extend方法的具体使用
2017/09/14 Javascript
vue实现nav导航栏的方法
2017/12/13 Javascript
js 计算图片内点个数的示例代码
2019/04/04 Javascript
[05:17]DOTA2誓师:今天我们在这里 明天TI4等我!
2014/03/26 DOTA
[02:36]DOTA2-DPC中国联赛 正赛 PSG.LGD vs Magma 选手采访
2021/03/11 DOTA
在Django的模板中使用认证数据的方法
2015/07/23 Python
CentOS 7下安装Python 3.5并与Python2.7兼容并存详解
2017/07/07 Python
[原创]pip和pygal的安装实例教程
2017/12/07 Python
python web.py开发httpserver解决跨域问题实例解析
2018/02/12 Python
用python爬取租房网站信息的代码
2018/12/14 Python
Jupyter notebook在mac:linux上的配置和远程访问的方法
2019/01/14 Python
Python 串口读写的实现方法
2019/06/12 Python
Python使用指定端口进行http请求的例子
2019/07/25 Python
python 爬虫百度地图的信息界面的实现方法
2019/10/27 Python
英国计算机产品零售商:Novatech(定制个人电脑、笔记本电脑、工作站和服务器)
2018/01/28 全球购物
Sunglasses Shop英国:欧洲领先的太阳镜在线供应商之一
2018/09/19 全球购物
理货员的岗位职责
2013/11/23 职场文书
电子商务个人自荐信
2013/12/12 职场文书
仓库规划计划书
2014/04/28 职场文书
人大代表选举标语
2014/10/07 职场文书
2015年教师节广播稿
2015/08/19 职场文书
mysql查询的控制语句图文详解
2021/04/11 MySQL
Python import模块的缓存问题解决方案
2021/06/02 Python