Python CSV文件模块的使用案例分析


Posted in Python onDecember 21, 2019

本文实例讲述了Python CSV文件模块的使用。分享给大家供大家参考,具体如下:

1、CSV模块使用流程

1、导入模块

impport CSV

2、打开文件(xxx.csv)

with open('xxx.csv','a',encoding='utf-8') as f:
  • 1、a和 a+   ‘追加'功能

a  追加写

a+ 追加写读(先写后读)

  • 2、r 和 r+  

r 只读

r+读写,先读后写

  • 3、w,w+

w 只写

w+写读 先写后读

3、初始化写入对象

writer = csv.wirter()

4、写入数据

writer.writerow(['孙悟空', '兰陵王'])

案例:

猫眼电影top10榜单的爬取

1、网址:url

2、目标:爬取自己想要的文件

3、保存本地:csv文件

4、步骤

  • 1、找url规律

第一页:https://maoyan.com/board/4?offset=0

第4页:https://maoyan.com/board/4?offset=30

第n页:offset=(n-1)*10

  • 2、写正则表达式

'<div class="movie-item-info".*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S

练习:爬取猫王top10信息

from urllib import request
import re
import time
import csv
class MaoyanSpider(object):
   def __init__(self):
    self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"}
    self.page = 1
    # 用来计数
   def get_page(self, url):
    req = request.Request(url, headers=self.headers)
    res = request.urlopen(req)
    html = res.read().decode('utf-8')
    # 直接调用解析函数
    self.parse_page(html)
   def parse_page(self,html):
     p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.*?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     #p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     r_list = p.findall(html)
     # 直接调用保存函数
     # r_list:[('霸王别姬','张国荣','1993'),(),()]
     self.write_csv(r_list)
  # 保存数据函数
   def  write_csv(self,r_list):
     with open('猫眼电影top10.csv','a') as f:
      writer = csv.writer(f)
      # 依次写入每个电影信息
      for r_t in r_list:
        film = [
          r_t[0].strip(),
          r_t[1].strip(),
          r_t[2].strip()
          ]
        writer.writerow(film)
  #主函数
   def work_om(self):
     for pn in range(0,41,10):
      url = 'https://maoyan.com/board/4?offset=%s'%str(pn)
      self.get_page(url)
      print('第%d页爬取成功'%self.page)
      self.page += 1
      time.sleep(4)
if __name__ =='__main__':
  begin = time.time()
  spider = MaoyanSpider()
  spider.work_om()
  end = time.time()
  print("执行时间%.2f"%(end - begin))

运行截图:

Python CSV文件模块的使用案例分析

更多Python相关内容感兴趣的读者可查看本站专题:《Python操作Excel表格技巧总结》、《Python编码操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python实现数通设备端口监控示例
Apr 02 Python
使用Python的Supervisor进行进程监控以及自动启动
May 29 Python
python tensorflow基于cnn实现手写数字识别
Jan 01 Python
详解如何在python中读写和存储matlab的数据文件(*.mat)
Feb 24 Python
Tensorflow使用tfrecord输入数据格式
Jun 19 Python
Python根据已知邻接矩阵绘制无向图操作示例
Jun 23 Python
Python操作json的方法实例分析
Dec 06 Python
对pandas写入读取h5文件的方法详解
Dec 28 Python
深入理解Django-Signals信号量
Feb 19 Python
Python3实现汉语转换为汉语拼音
Jul 08 Python
python中for in的用法详解
Apr 17 Python
python re模块常见用法例举
Mar 01 Python
python实现的分析并统计nginx日志数据功能示例
Dec 21 #Python
Python数据持久化存储实现方法分析
Dec 21 #Python
python cv2截取不规则区域图片实例
Dec 21 #Python
Python lxml模块的基本使用方法分析
Dec 21 #Python
python Manager 之dict KeyError问题的解决
Dec 21 #Python
tornado+celery的简单使用详解
Dec 21 #Python
Python selenium的基本使用方法分析
Dec 21 #Python
You might like
怎样在PHP中通过ADO调用Asscess数据库和COM程序
2006/10/09 PHP
PHP文件下载类
2006/12/06 PHP
PHP 文章中的远程图片采集到本地的代码
2009/07/30 PHP
分享下页面关键字抓取components.arrow.com站点代码
2014/01/30 PHP
PHP实现导出excel数据的类库用法示例
2016/10/15 PHP
微信公众平台开发教程④ ThinkPHP框架下微信支付功能图文详解
2019/04/10 PHP
Laravel框架实现多数据库连接操作详解
2019/07/12 PHP
URI、URL和URN之间的区别与联系
2006/12/20 Javascript
键盘 keycode的值 javascript时触发事件时很有用的要素
2009/11/02 Javascript
锋利的jQuery 要点归纳(二) jQuery中的DOM操作(下)
2010/03/23 Javascript
ExtJS 设置级联菜单的默认值
2010/06/13 Javascript
25个好玩的JavaScript小游戏分享
2011/04/22 Javascript
js鼠标滑过弹出层的定位IE6bug解决办法
2012/12/26 Javascript
分享网页检测摇一摇实例代码
2016/01/14 Javascript
详解AngularJS中的表单验证(推荐)
2016/11/17 Javascript
JS常用知识点整理
2017/01/21 Javascript
详解webpack 入门总结和实践(按需异步加载,css单独打包,生成多个入口文件)
2017/06/20 Javascript
微信小程序如何获取用户收货地址
2018/11/27 Javascript
JS简单数组排序操作示例【sort方法】
2019/05/17 Javascript
JavaScript实现飞舞的泡泡效果
2020/02/07 Javascript
vue项目中openlayers绘制行政区划
2020/12/24 Vue.js
vue实现拖拽进度条
2021/03/01 Vue.js
Python中的条件判断语句与循环语句用法小结
2016/03/21 Python
python批量修改文件编码格式的方法
2018/05/31 Python
详解python之协程gevent模块
2018/06/14 Python
pytorch中的自定义数据处理详解
2020/01/06 Python
Pycharm中配置远程Docker运行环境的教程图解
2020/06/11 Python
美国最值得信赖的宠物药房:Allivet
2019/03/23 全球购物
美国沃尔玛网上超市:Walmart
2020/08/14 全球购物
神路信息Java面试题目
2013/03/31 面试题
Shell如何接收变量输入
2012/09/24 面试题
个人生活学习自我评价范文
2013/11/26 职场文书
会计实习自我鉴定
2013/12/04 职场文书
小学数学教研活动总结
2014/07/01 职场文书
nginx location中多个if里面proxy_pass的方法
2021/03/31 Servers
python图像处理 PIL Image操作实例
2022/04/09 Python