对python读写文件去重、RE、set的使用详解


Posted in Python onDecember 11, 2018

如下所示:

# -*- coding:utf-8 -*-
 
from datetime import datetime
import re
 
 
def Main():
 sourcr_dir = '/data/u_lx_data/fudan/muying/muying_11yue_all.txt'
 target_dir = '/data/u_lx_data/fudan/muying/python/uid_regular_get.txt'
 
 uset = set() #去重
 
 print("开始。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
 with open(target_dir, 'w+') as f_write:
  with open(sourcr_dir, 'r') as f_scorce:
   for line in f_scorce:
   line = line.strip().split("\t")
   # 宝宝树
   if line[2] == 'babytree.com':
    uidList = re.findall(r'.*NL=u%02(u\d+)', line[3], re.I)
    if uidList:
     # 去重代码
     if uidList[0] not in uset:
      f_write.write(uidList[0] + "\n")
      uset.add(uidList[0])
      print("宝宝树已完成")
 
   # 柚宝宝
   elif line[2] == 'youzibuy.com':
    if line[4].find("yunqi.youzibuy.com/tae_top_notify") != -1:
     uidList = re.findall(r'.*myuid=(\d+)', line[4], re.I)
     if uidList:
      if uidList[0] not in uset:
       f_write.write(uidList[0] + "\n")
       uset.add(uidList[0])
       print("柚宝宝已完成")
 
   # 妈妈帮
   elif line[2] == 'mmbang.com':
    uidList = re.findall(r'.*uid=(\d+)', line[3], re.I)
    if uidList:
     if uidList[0] not in uset:
      f_write.write(uidList[0] + "\n")
      uset.add(uidList[0])
      print("妈妈帮已完成")
 
   # 妈妈网
   elif line[2] == 'mama.cn':
    if line[4].find("mapi.mama.cn/feed/users/show") != -1:
     uidList = re.findall(r'.*friend_uid=(\d+)', line[4], re.I)
     if uidList:
      if uidList[0] not in uset:
       f_write.write(uidList[0] + "\n")
       uset.add(uidList[0])
    if line[4].find("mamaquan/mmq_thread") != -1:
     uidList = re.findall(r'.*uid=(\d+)', line[4], re.I)
     if uidList:
      if uidList[0] not in uset:
       f_write.write(uidList[0] + "\n")
       uset.add(uidList[0])
       print("妈妈网已完成")
 
   # 育儿网
   elif line[2] == 'ci123.com':
    uidList = re.findall(r'.*ci123js=([a-zA-Z]+\d+)', line[3], re.I)
    if uidList:
     if uidList[0] not in uset:
      f_write.write(uidList[0] + "\n")
      uset.add(uidList[0])
      print("育儿网已完成")
 
 print("完成。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
if __name__ == "__main__":
 Main()

以上这篇对python读写文件去重、RE、set的使用详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
解决Linux系统中python matplotlib画图的中文显示问题
Jun 15 Python
python如何实现int函数的方法示例
Feb 19 Python
django自带的server 让外网主机访问方法
May 14 Python
使用Python制作自动推送微信消息提醒的备忘录功能
Sep 06 Python
Python 新建文件夹与复制文件夹内所有内容的方法
Oct 27 Python
基于python实现微信好友数据分析(简单)
Feb 16 Python
python使用html2text库实现从HTML转markdown的方法详解
Feb 21 Python
python实现密度聚类(模板代码+sklearn代码)
Apr 27 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 Python
python中用ctypes模拟点击的实例讲解
Nov 26 Python
python实现图片转字符画
Feb 19 Python
pytorch 计算Parameter和FLOP的操作
Mar 04 Python
python版本五子棋的实现代码
Dec 11 #Python
python提取具有某种特定字符串的行数据方法
Dec 11 #Python
Python面向对象基础入门之编码细节与注意事项
Dec 11 #Python
Python面向对象基础入门之设置对象属性
Dec 11 #Python
python提取包含关键字的整行数据方法
Dec 11 #Python
django开发post接口简单案例,获取参数值的方法
Dec 11 #Python
python面向对象入门教程之从代码复用开始(一)
Dec 11 #Python
You might like
PhpMyAdmin出现export.php Missing parameter: what /export_type错误解决方法
2012/08/09 PHP
PHP file_get_contents设置超时处理方法
2013/09/30 PHP
PHP基于堆栈实现的高级计算器功能示例
2017/09/15 PHP
共享自己写一个框架DreamScript
2007/01/20 Javascript
javascript for循环设法提高性能
2010/02/24 Javascript
javascript图像处理—仿射变换深度理解
2013/01/16 Javascript
通过JQuery实现win8一样酷炫的动态磁贴效果(示例代码)
2013/07/13 Javascript
javascript实现的图片切割多块效果实例
2015/05/07 Javascript
JS实现的文字与图片定时切换效果代码
2015/10/06 Javascript
JavaScript模块规范之AMD规范和CMD规范
2015/10/27 Javascript
javascript检测移动设备横竖屏
2016/05/21 Javascript
Bootstrap栅格系统的使用和理解2
2016/12/14 Javascript
文件上传的几个示例分享【推荐】
2016/12/16 Javascript
Vue.js学习之计算属性
2017/01/22 Javascript
原生JS实现幻灯片
2017/02/22 Javascript
浅谈jQuery的bind和unbind事件(绑定和解绑事件)
2017/03/02 Javascript
ReactNative踩坑之配置调试端口的解决方法
2017/07/28 Javascript
React-router v4 路由配置方法小结
2017/08/08 Javascript
vue实现商品加减计算总价的实例代码
2018/08/12 Javascript
浅析微信扫码登录原理(小结)
2018/10/29 Javascript
vue项目中axios请求网络接口封装的示例代码
2018/12/18 Javascript
JavaScript中ES6规范中let和const的用法和区别
2020/08/06 Javascript
基于JavaScript的数据结构队列动画实现示例解析
2020/08/06 Javascript
深入理解python中sort()与sorted()的区别
2018/08/29 Python
Python如何获得百度统计API的数据并发送邮件示例代码
2019/01/27 Python
Django的用户模块与权限系统的示例代码
2019/07/24 Python
Python.append()与Python.expand()用法详解
2019/12/18 Python
超全Python图像处理讲解(多模块实现)
2020/04/13 Python
Python xml、字典、json、类四种数据类型如何实现互相转换
2020/05/27 Python
教师自我鉴定
2013/12/13 职场文书
小溪流的歌教学反思
2014/02/13 职场文书
商业用房租赁协议书
2014/10/13 职场文书
2014年干部培训工作总结
2014/12/17 职场文书
老乡会致辞
2015/07/28 职场文书
学校远程教育工作总结
2015/08/11 职场文书
《巨人的花园》教学反思
2016/02/19 职场文书