Python CSV文件模块的使用案例分析


Posted in Python onDecember 21, 2019

本文实例讲述了Python CSV文件模块的使用。分享给大家供大家参考,具体如下:

1、CSV模块使用流程

1、导入模块

impport CSV

2、打开文件(xxx.csv)

with open('xxx.csv','a',encoding='utf-8') as f:
  • 1、a和 a+   ‘追加'功能

a  追加写

a+ 追加写读(先写后读)

  • 2、r 和 r+  

r 只读

r+读写,先读后写

  • 3、w,w+

w 只写

w+写读 先写后读

3、初始化写入对象

writer = csv.wirter()

4、写入数据

writer.writerow(['孙悟空', '兰陵王'])

案例:

猫眼电影top10榜单的爬取

1、网址:url

2、目标:爬取自己想要的文件

3、保存本地:csv文件

4、步骤

  • 1、找url规律

第一页:https://maoyan.com/board/4?offset=0

第4页:https://maoyan.com/board/4?offset=30

第n页:offset=(n-1)*10

  • 2、写正则表达式

'<div class="movie-item-info".*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S

练习:爬取猫王top10信息

from urllib import request
import re
import time
import csv
class MaoyanSpider(object):
   def __init__(self):
    self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"}
    self.page = 1
    # 用来计数
   def get_page(self, url):
    req = request.Request(url, headers=self.headers)
    res = request.urlopen(req)
    html = res.read().decode('utf-8')
    # 直接调用解析函数
    self.parse_page(html)
   def parse_page(self,html):
     p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.*?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     #p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     r_list = p.findall(html)
     # 直接调用保存函数
     # r_list:[('霸王别姬','张国荣','1993'),(),()]
     self.write_csv(r_list)
  # 保存数据函数
   def  write_csv(self,r_list):
     with open('猫眼电影top10.csv','a') as f:
      writer = csv.writer(f)
      # 依次写入每个电影信息
      for r_t in r_list:
        film = [
          r_t[0].strip(),
          r_t[1].strip(),
          r_t[2].strip()
          ]
        writer.writerow(film)
  #主函数
   def work_om(self):
     for pn in range(0,41,10):
      url = 'https://maoyan.com/board/4?offset=%s'%str(pn)
      self.get_page(url)
      print('第%d页爬取成功'%self.page)
      self.page += 1
      time.sleep(4)
if __name__ =='__main__':
  begin = time.time()
  spider = MaoyanSpider()
  spider.work_om()
  end = time.time()
  print("执行时间%.2f"%(end - begin))

运行截图:

Python CSV文件模块的使用案例分析

更多Python相关内容感兴趣的读者可查看本站专题:《Python操作Excel表格技巧总结》、《Python编码操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python中的reduce内建函数使用方法指南
Aug 31 Python
Python pickle模块用法实例分析
May 27 Python
python制作小说爬虫实录
Aug 14 Python
python解析html提取数据,并生成word文档实例解析
Jan 22 Python
python 实时得到cpu和内存的使用情况方法
Jun 11 Python
使用Python OpenCV为CNN增加图像样本的实现
Jun 10 Python
PyCharm+Qt Designer+PyUIC安装配置教程详解
Jun 13 Python
python opencv 读取图片 返回图片某像素点的b,g,r值的实现方法
Jul 03 Python
Python操作列表常用方法实例小结【创建、遍历、统计、切片等】
Oct 25 Python
PyPDF2读取PDF文件内容保存到本地TXT实例
May 12 Python
记一次django内存异常排查及解决方法
Aug 07 Python
Python可视化神器pyecharts绘制水球图
Jul 07 Python
python实现的分析并统计nginx日志数据功能示例
Dec 21 #Python
Python数据持久化存储实现方法分析
Dec 21 #Python
python cv2截取不规则区域图片实例
Dec 21 #Python
Python lxml模块的基本使用方法分析
Dec 21 #Python
python Manager 之dict KeyError问题的解决
Dec 21 #Python
tornado+celery的简单使用详解
Dec 21 #Python
Python selenium的基本使用方法分析
Dec 21 #Python
You might like
php中global和$GLOBALS[]的分析之一
2012/02/02 PHP
PHP邮箱验证示例教程
2016/06/01 PHP
PHP bin2hex()函数基础实例讲解
2019/02/11 PHP
thinkPHP5框架实现多数据库连接,跨数据连接查询操作示例
2019/05/29 PHP
些很实用且必用的小脚本代码
2006/06/26 Javascript
Prototype Object对象 学习
2009/07/12 Javascript
jQuery实现跨域
2015/02/03 Javascript
简单实现兼容各大浏览器的js复制内容到剪切板
2015/09/09 Javascript
js基础之DOM中document对象的常用属性方法详解
2016/10/28 Javascript
浅析script标签中的defer与async属性
2016/11/30 Javascript
基于jQuery实现的查看全文功能【实用】
2016/12/11 Javascript
JS中SetTimeout和SetInterval使用初探
2017/03/23 Javascript
NodeJs测试框架Mocha的安装与使用
2017/03/28 NodeJs
使用express+multer实现node中的图片上传功能
2018/02/02 Javascript
详解JavaScript 中 if / if...else...替换方式
2018/07/15 Javascript
vue-router动态设置页面title的实例讲解
2018/08/30 Javascript
vuex直接赋值的三种方法总结
2018/09/16 Javascript
Vue Router中应用中间件的方法
2020/08/06 Javascript
举例讲解Linux系统下Python调用系统Shell的方法
2015/11/07 Python
python中函数默认值使用注意点详解
2016/06/01 Python
用pickle存储Python的原生对象方法
2017/04/28 Python
python正则表达式的使用
2017/06/12 Python
python获取多线程及子线程的返回值
2017/11/15 Python
Django上使用数据可视化利器Bokeh解析
2019/07/31 Python
python采集百度搜索结果带有特定URL的链接代码实例
2019/08/30 Python
解决os.path.isdir() 判断文件夹却返回false的问题
2019/11/29 Python
在pycharm中debug 实时查看数据操作(交互式)
2020/06/09 Python
Python爬虫简单运用爬取代理IP的实现
2020/12/01 Python
微软日本官方网站:Microsoft日本
2017/11/26 全球购物
FC-Moto西班牙:摩托车手最大的购物场所之一
2019/04/11 全球购物
大学生学习2014全国两会心得体会
2014/03/13 职场文书
七一建党节演讲稿
2014/09/11 职场文书
党员个人自我剖析材料
2014/10/08 职场文书
党支部对转正的意见
2015/06/02 职场文书
上帝也疯狂观后感
2015/06/09 职场文书
Vue.Draggable实现交换位置
2022/04/07 Vue.js