Python CSV文件模块的使用案例分析


Posted in Python onDecember 21, 2019

本文实例讲述了Python CSV文件模块的使用。分享给大家供大家参考,具体如下:

1、CSV模块使用流程

1、导入模块

impport CSV

2、打开文件(xxx.csv)

with open('xxx.csv','a',encoding='utf-8') as f:
  • 1、a和 a+   ‘追加'功能

a  追加写

a+ 追加写读(先写后读)

  • 2、r 和 r+  

r 只读

r+读写,先读后写

  • 3、w,w+

w 只写

w+写读 先写后读

3、初始化写入对象

writer = csv.wirter()

4、写入数据

writer.writerow(['孙悟空', '兰陵王'])

案例:

猫眼电影top10榜单的爬取

1、网址:url

2、目标:爬取自己想要的文件

3、保存本地:csv文件

4、步骤

  • 1、找url规律

第一页:https://maoyan.com/board/4?offset=0

第4页:https://maoyan.com/board/4?offset=30

第n页:offset=(n-1)*10

  • 2、写正则表达式

'<div class="movie-item-info".*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S

练习:爬取猫王top10信息

from urllib import request
import re
import time
import csv
class MaoyanSpider(object):
   def __init__(self):
    self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"}
    self.page = 1
    # 用来计数
   def get_page(self, url):
    req = request.Request(url, headers=self.headers)
    res = request.urlopen(req)
    html = res.read().decode('utf-8')
    # 直接调用解析函数
    self.parse_page(html)
   def parse_page(self,html):
     p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.*?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     #p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     r_list = p.findall(html)
     # 直接调用保存函数
     # r_list:[('霸王别姬','张国荣','1993'),(),()]
     self.write_csv(r_list)
  # 保存数据函数
   def  write_csv(self,r_list):
     with open('猫眼电影top10.csv','a') as f:
      writer = csv.writer(f)
      # 依次写入每个电影信息
      for r_t in r_list:
        film = [
          r_t[0].strip(),
          r_t[1].strip(),
          r_t[2].strip()
          ]
        writer.writerow(film)
  #主函数
   def work_om(self):
     for pn in range(0,41,10):
      url = 'https://maoyan.com/board/4?offset=%s'%str(pn)
      self.get_page(url)
      print('第%d页爬取成功'%self.page)
      self.page += 1
      time.sleep(4)
if __name__ =='__main__':
  begin = time.time()
  spider = MaoyanSpider()
  spider.work_om()
  end = time.time()
  print("执行时间%.2f"%(end - begin))

运行截图:

Python CSV文件模块的使用案例分析

更多Python相关内容感兴趣的读者可查看本站专题:《Python操作Excel表格技巧总结》、《Python编码操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python获取远程文件大小的函数代码分享
May 13 Python
Python的dict字典结构操作方法学习笔记
May 07 Python
Python Web程序部署到Ubuntu服务器上的方法
Feb 22 Python
Python使用matplotlib绘制余弦的散点图示例
Mar 14 Python
Python中一行和多行import模块问题
Apr 01 Python
Windows 安装 Anaconda3+PyCharm的方法步骤
Jun 13 Python
python:动态路由的Flask程序代码
Nov 22 Python
python列表推导式入门学习解析
Dec 02 Python
谈谈Python:为什么类中的私有属性可以在外部赋值并访问
Mar 05 Python
python 负数取模运算实例
Jun 03 Python
使用python把xmind转换成excel测试用例的实现代码
Oct 12 Python
聊聊python在linux下与windows下导入模块的区别说明
Mar 03 Python
python实现的分析并统计nginx日志数据功能示例
Dec 21 #Python
Python数据持久化存储实现方法分析
Dec 21 #Python
python cv2截取不规则区域图片实例
Dec 21 #Python
Python lxml模块的基本使用方法分析
Dec 21 #Python
python Manager 之dict KeyError问题的解决
Dec 21 #Python
tornado+celery的简单使用详解
Dec 21 #Python
Python selenium的基本使用方法分析
Dec 21 #Python
You might like
木翼下载系统中说明的PHP安全配置方法
2007/06/16 PHP
MySQL时间字段究竟使用INT还是DateTime的说明
2012/02/27 PHP
PHP 杂谈《重构-改善既有代码的设计》之三 重新组织数据
2012/04/09 PHP
php目录操作实例代码
2014/02/21 PHP
PHP命令行脚本接收传入参数的三种方式
2014/08/20 PHP
使用YUI+Ant 实现JS CSS压缩
2014/09/02 PHP
php列出mysql表所有行和列的方法
2015/03/13 PHP
php操作memcache缓存方法分享
2015/06/03 PHP
php 升级到 5.3+ 后出现的一些错误,如 ereg(); ereg_replace(); 函数报错
2015/12/07 PHP
JavaScript 特殊字符
2007/04/05 Javascript
在线编辑器中换行与内容自动提取
2009/04/24 Javascript
JS 文件本身编码转换 图文教程
2009/10/12 Javascript
javascript关于继承的用法汇总
2014/12/20 Javascript
深入对Vue.js $watch方法的理解
2017/03/20 Javascript
关于vuex的学习实践笔记
2017/04/05 Javascript
详解a++和++a的区别
2017/08/30 Javascript
js纯前端实现腾讯cos文件上传功能的示例代码
2019/05/14 Javascript
vue使用自定义指令实现拖拽
2021/01/29 Javascript
Vue 自定义指令实现一键 Copy功能
2019/09/16 Javascript
[45:10]NB vs Liquid Supermajor小组赛 A组胜者组决赛 BO3 第二场 6.2
2018/06/04 DOTA
Python实现程序的单一实例用法分析
2015/06/03 Python
使用python为mysql实现restful接口
2018/01/05 Python
python实现kmp算法的实例代码
2019/04/03 Python
详解python项目实战:模拟登陆CSDN
2019/04/04 Python
基于python实现文件加密功能
2020/01/06 Python
python之pygame模块实现飞机大战完整代码
2020/11/29 Python
HTML5新增的8类INPUT输入类型介绍
2015/07/06 HTML / CSS
德国体育用品网上商店:SC24.com
2016/08/01 全球购物
彪马日本官网:PUMA日本
2019/01/31 全球购物
武汉英思工程科技有限公司&ndash;ORACLE面试测试题目
2012/04/30 面试题
大学生职业生涯规划书的基本内容
2014/01/06 职场文书
六查六看剖析材料
2014/02/15 职场文书
搞笑车尾标语
2014/06/23 职场文书
庆七一活动总结
2014/08/27 职场文书
【海涛dota解说】DCG联赛第一周 LGD VS DH
2022/04/01 DOTA
Python测试框架pytest高阶用法全面详解
2022/06/01 Python