Python程序中用csv模块来操作csv文件的基本使用教程


Posted in Python onMarch 03, 2016

CSV全称为“Comma Separated Values”,是一种格式化的文件,由行和列组成,分隔符可以根据需要来变化。
如下面为一csv文件:

Title,Release Date,Director
And Now For Something Completely Different,1971,Ian MacNaughton
Monty Python And The Holy Grail,1975,Terry Gilliam and Terry Jones
Monty Python's Life Of Brian,1979,Terry Jones
Monty Python Live At The Hollywood Bowl,1982,Terry Hughes
Monty Python's The Meaning Of Life,1983,Terry Jones

csv可以比较方便的在不同应用之间迁移数据。可以将数据批量导出为csv格式,然后倒入到其他应用程序中。很多应用中需要导出报表,也通常用csv格式导出,然后用Excel工具进行后续编辑。

打印发行日期及标题,逐行处理:

for line in open("samples/sample.csv"):
  title, year, director = line.split(",")
  print year, title

使用csv模块处理:

import csv
reader = csv.reader(open("samples/sample.csv"))
for title, year, director in reader:
  print year, title

改变分隔符

创建一csv.excel的子类,并修改分隔符为”;”

# File: csv-example-2.py
import csv
class SKV(csv.excel):
  # like excel, but uses semicolons
  delimiter = ";"
 
csv.register_dialect("SKV", SKV)
reader = csv.reader(open("samples/sample.skv"), "SKV")
for title, year, director in reader:
  print year, title

如果仅仅仅是改变一两个参数,则可以直接在reader参数中设置,如下:

# File: csv-example-3.py
 
import csv
 
reader = csv.reader(open("samples/sample.skv"), delimiter=";")
 
for title, year, director in reader:
  print year, title

将数据存为CSV格式

通过csv.writer来生成一csv文件。

# File: csv-example-4.py
 
import csv
import sys
 
data = [
  ("And Now For Something Completely Different", 1971, "Ian MacNaughton"),
  ("Monty Python And The Holy Grail", 1975, "Terry Gilliam, Terry Jones"),
  ("Monty Python's Life Of Brian", 1979, "Terry Jones"),
  ("Monty Python Live At The Hollywood Bowl", 1982, "Terry Hughes"),
  ("Monty Python's The Meaning Of Life", 1983, "Terry Jones")
]
 
writer = csv.writer(sys.stdout)
 
for item in data:
  writer.writerow(item)

实例

下面我们来看一个比较完整的例子,代码说明在注释中:

import csv


# dialect是访问csv文件时需要指定的参数之一,用来确定csv文件的数据格式
# 下面这个函数列举系统支持的dialect有哪些,默认值是'excel',用户也可
# 以从Dialect派生一个类,使用该类的实例作为dialect参数。
print csv.list_dialects()


def test_writer():
  # csv文件必须以二进制方式open
  with open('eggs.csv', 'wb') as csvfile:
    spamwriter = csv.writer(csvfile)
    spamwriter.writerow(['Spam'] * 5 + ['Baked Beans'])
    spamwriter.writerow(['Spam', 'Lovely Spam', 'Wonderful Spam'])


def test_reader():
  with open('eggs.csv', 'rb') as csvfile:
    spamreader = csv.reader(csvfile)
    for row in spamreader:
      print row


# sniffer 用来推断csv文件的格式,不是很准确
def test_sniffer():
  with open('eggs.csv', 'wb') as csvfile:
    spamwriter = csv.writer(csvfile, delimiter=' ')

    spamwriter.writerow(['Spam'] * 2 + ['Baked Beans'])
    spamwriter.writerow(['Spam', 'Lovely Spam', 'Wonderful Spam'])

  # 通常你需要指定与写入者相同的文件格式才能正确的读取数据
  with open('eggs.csv', 'rb') as csvfile:
    spamreader = csv.reader(csvfile, delimiter=' ')
    for row in spamreader:
      print ', '.join(row)

  # 如果不知道文件格式,sniffer就可以派上用场了
  with open('eggs.csv', 'rb') as csvfile:
    # 用sniffer推断文件格式,从而得到dialect
    dialect = csv.Sniffer().sniff(csvfile.read(1024))
    print dialect.delimiter, dialect.quotechar

    # 文件重新移动到头部
    csvfile.seek(0)

    # 用推断出来的dialect创建reader
    reader = csv.reader(csvfile, dialect)

    for row in reader:
      print ', '.join(row)
Python 相关文章推荐
Python打印scrapy蜘蛛抓取树结构的方法
Apr 08 Python
Python读大数据txt
Mar 28 Python
Python Sqlite3以字典形式返回查询结果的实现方法
Oct 03 Python
基于Python的关键字监控及告警
Jul 06 Python
Python中django学习心得
Dec 06 Python
Tensorflow 实现修改张量特定元素的值方法
Jul 30 Python
Dlib+OpenCV深度学习人脸识别的方法示例
May 14 Python
python安装requests库的实例代码
Jun 25 Python
详解Python time库的使用
Oct 10 Python
Python使用循环神经网络解决文本分类问题的方法详解
Jan 16 Python
解决TensorFlow训练内存不断增长,进程被杀死问题
Feb 05 Python
python 的topk算法实例
Apr 02 Python
举例简单讲解Python中的数据存储模块shelve的用法
Mar 03 #Python
Python中的数据对象持久化存储模块pickle的使用示例
Mar 03 #Python
Python和Perl绘制中国北京跑步地图的方法
Mar 03 #Python
python套接字流重定向实例汇总
Mar 03 #Python
Python设计模式中单例模式的实现及在Tornado中的应用
Mar 02 #Python
Python使用设计模式中的责任链模式与迭代器模式的示例
Mar 02 #Python
详解Python设计模式编程中观察者模式与策略模式的运用
Mar 02 #Python
You might like
解析使用substr截取UTF-8中文字符串出现乱码的问题
2013/06/20 PHP
php利用单例模式实现日志处理类库
2014/02/10 PHP
PHP网页游戏学习之Xnova(ogame)源码解读(五)
2014/06/23 PHP
Yii框架登录流程分析
2014/12/03 PHP
phpStudy访问速度慢和启动失败的解决办法
2015/11/19 PHP
php 自定义错误日志实例详解
2016/11/12 PHP
Javascript开发之三数组对象实例介绍
2012/11/12 Javascript
一个简单的全屏图片上下打开显示网页效果示例
2014/07/08 Javascript
学习JavaScript图片预加载模块
2016/11/07 Javascript
JavaScript中使用Async实现异步控制
2017/08/15 Javascript
BootStrap模态框不垂直居中的解决方法
2017/10/19 Javascript
Three.js 再探 - 写一个微信跳一跳极简版游戏
2018/01/04 Javascript
nodejs实现的连接MySQL数据库功能示例
2018/01/25 NodeJs
VUE-cli3使用 svg-sprite-loader
2018/10/20 Javascript
axios+Vue实现上传文件显示进度功能
2019/04/14 Javascript
Vue组件之高德地图地址选择功能的实例代码
2019/06/21 Javascript
[00:33]2016完美“圣”典风云人物:Sccc宣传片
2016/12/03 DOTA
C#返回当前系统所有可用驱动器符号的方法
2015/04/18 Python
Django实现图片文字同时提交的方法
2015/05/26 Python
Python多进程并发(multiprocessing)用法实例详解
2015/06/02 Python
python在windows下创建隐藏窗口子进程的方法
2015/06/04 Python
python daemon守护进程实现
2016/08/27 Python
Python实现自动添加脚本头信息的示例代码
2016/09/02 Python
Python中字符串格式化str.format的详细介绍
2017/02/17 Python
前端canvas动画如何转成mp4视频的方法
2019/06/17 HTML / CSS
详解如何获取localStorage最大存储大小的方法
2020/05/21 HTML / CSS
Invicta手表官方商店:百年制表历史的瑞士腕表品牌
2019/09/26 全球购物
高中生学习总结的自我评价范文
2013/10/13 职场文书
写求职信有什么意义
2014/02/17 职场文书
共产党员公开承诺书范文
2014/03/28 职场文书
《微笑着面对生活》优秀演讲稿范文
2014/09/23 职场文书
2014年师德师风自我剖析材料
2014/09/27 职场文书
项目转让协议书
2014/10/27 职场文书
2015年施工员工作总结范文
2015/04/20 职场文书
Pytorch数据读取之Dataset和DataLoader知识总结
2021/05/23 Python
python中__slots__节约内存的具体做法
2021/07/04 Python