编程 Python

Python查找文件中包含中文的行方法

Posted in Python onDecember 19, 2018

前言

近几天在做多语言版本的时候再次发现，区分各种语言真的是一件比较困难的事情，上一次做中文提取工具的就花了不少时间，这次决定用python试一试，结果写起来发现真是方便不少，自己整理了一下方便以后查找使用。

代码

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# find the line of containing chinese in files

__author__ = 'AlbertS'

import re

def start_find_chinese():
 find_count = 0;
 with open('ko_untranslated.txt', 'wb') as outfile:
  with open('source_ko.txt', 'rb') as infile:
   while True:
    content = infile.readline()
    if re.match(r'(.*[\u4E00-\u9FA5]+)|([\u4E00-\u9FA5]+.*)', content.decode('utf-8')):
     outfile.write(content)
     find_count += 1;

    if not content:
     return find_count

# start to find
if __name__ == '__main__':
 count = start_find_chinese()
 print("find complete! count =", count)

原始文件

source_ko.txt文件内容

3 캐릭터 Lv.50 달성
8 캐릭터 Lv.80 달성
10 캐릭터 Lv.90 달성
...
...
2840 飞黄腾达
4841 同归于尽
8848 캐릭터 Lv.50 달

运行效果(ko_untranslated.txt文件)

2840 飞黄腾达
4841 同归于尽

总结

1. 其实这段小小的代码中包含了两个常用的功能，那就是读写文件和正则表达式。

2. 这也是两个重要的知识点，其中with操作可能防止资源泄漏，操作起来更加方便。

3. 正则表达式可是一个文字处理的利器，代码中的正则可能还不太完善，后续我会继续补充更新。

以上这篇Python查找文件中包含中文的行方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Python查找文件中包含中文的行方法

- Author -

AlbertS

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

日常整理python执行系统命令的常见方法(全)

Oct 22 Python

Python爬虫之模拟知乎登录的方法教程

May 25 Python

python计算auc指标实例

Jul 13 Python

Feb 16 Python

如何用Python来搭建一个简单的推荐系统

Aug 07 Python

Pandas操作CSV文件的读写实现方法

Nov 13 Python

Python函数的返回值、匿名函数lambda、filter函数、map函数、reduce函数用法实例分析

Dec 26 Python

python GUI库图形界面开发之PyQt5复选框控件QCheckBox详细使用方法与实例

Feb 28 Python

Pycharm生成可执行文件.exe的实现方法

Jun 02 Python

Tensorflow之MNIST CNN实现并保存、加载模型

Jun 17 Python

解决Pytorch自定义层出现多Variable共享内存错误问题

Jun 28 Python

opencv实现图像几何变换

Mar 24 Python

对python requests发送json格式数据的实例详解

Dec 19 #Python

解决Python下json.loads()中文字符出错的问题

Dec 19 #Python

python执行CMD指令,并获取返回的方法

Dec 19 #Python

python使用response.read()接收json数据的实例

Dec 19 #Python

Python通用循环的构造方法实例分析

Dec 19 #Python

Python实现对字典分别按键(key)和值(value)进行排序的方法分析

Dec 19 #Python

对json字符串与python字符串的不同之处详解

Dec 19 #Python

You might like

[FAQ]PHP中的一些常识：类篇

2006/10/09 PHP

解析isset与is_null的区别

2013/08/09 PHP

将php数组输出html表格的方法

2014/02/24 PHP

destoon实现资讯信息前面调用它所属分类的方法

2014/07/15 PHP

yii实现model添加默认值的方法(2种方法)

2016/01/06 PHP

php中通过eval实现字符串格式的计算公式

2017/03/18 PHP

Javascript模板技术

2007/04/27 Javascript

JavaScript 拾漏补遗

2009/12/27 Javascript

jQuery学习笔记(1)--用jQuery实现异步通信(用json传值)具体思路

2013/04/08 Javascript

jquery获取当前元素索引值用法实例

2015/06/10 Javascript

jquery实现未经美化的简洁TAB菜单效果

2015/08/28 Javascript

jQuery通过ajax快速批量提交表单数据

2016/10/25 Javascript

thinkphp标签实现bootsrtap轮播carousel实例代码

2017/02/19 Javascript

利用Node.js+Koa框架实现前后端交互的方法

2017/02/27 Javascript

深入理解JavaScript继承的多种方式和优缺点

2017/05/12 Javascript

js 实现复选框只能选择一项的示例代码

2018/01/23 Javascript

新版vue-cli模板下本地开发环境使用node服务器跨域的方法

2018/04/03 Javascript

vue router 跳转后回到顶部的实例

2018/08/31 Javascript

JavaScript setTimeout()基本用法有哪些

2020/11/04 Javascript

原生js实现自定义难度的扫雷游戏

2021/01/22 Javascript

Python中的两个内置模块介绍

2015/04/05 Python

Windows下Python的Django框架环境部署及应用编写入门

2016/03/10 Python

PyQt5实现拖放功能

2018/04/25 Python

python word转pdf代码实例

2019/08/16 Python

pytorch 预训练层的使用方法

2019/08/20 Python

Python hashlib加密模块常用方法解析

2019/12/18 Python

解决Python图形界面中设置尺寸的问题

2020/03/05 Python

CSS3自定义滚动条样式 ::webkit-scrollbar的示例代码详解

2020/06/01 HTML / CSS

Furla官网：意大利著名的皮革品牌

2019/08/06 全球购物

Java Servlet API中forward() 与redirect()的区别

2014/04/20 面试题

秘书英文求职信范文

2014/01/31 职场文书

小学运动会口号

2014/06/07 职场文书

2014年环保局工作总结

2014/12/11 职场文书

婚庆司仪开场白

2015/05/29 职场文书

单身证明范本

2015/06/15 职场文书

Ruby GDBM操作简介及数据存储原理

2022/04/19 Ruby