编写Python脚本来获取mp3文件tag信息的教程


Posted in Python onMay 04, 2015

下面利用一个python的实例程序,来学习python。这个程序的目的就是分析出所有MP3文件的Tag信息并输出。
import os # 导入os模块,提供文件路径,列出文件等方法
import sys # 导入sys模块,使用sys.modules获取模块中的所有内容,类似反射的功能
from UserDict import UserDict # 这个表示从UserDict类中导入UserDict,类似于Java中的 import UserDict.UserDict
 

def stripnulls(data):
  "一个空字符串的处理函数将所有00字节的内容替换为空字符,病将前后的空字符串去掉"
  # Python中的strip用于去除字符串的首尾字符,同理,lstrip用于去除左边的字符,rstrip用于去除右边的字符。
  return data.replace("\00", "").strip()
 
class FileInfo(UserDict):
  '''文件基类,存储文件的文件名,继承自UserDict(存储key-value的一个类,可以重写__setitem__,__getitem__方法,
  就可以使用[])'''
  # self是定义时使用,使用时不需要,如果没有参数,则filename默认None,如果有一个参数的话,参数即为filename
  def __init__(self, filename=None):
    UserDict.__init__(self) # 初始化父类
    self["name"] = filename # 设置name为 filaname
 
class MP3FileInfo(FileInfo):
  "MP3文件的信息类,用于分析MP3文件和存储信息"
  # tagDataMap 用于存储MP3的Tag信息分别所在位置,( key : 开始位置,结束位置, 处理函数),
  # stripnulls表示最开始定义的函数
  tagDataMap = {"title" : ( 3, 33, stripnulls),
  "artist" : ( 33, 63, stripnulls),
  "album" : ( 63, 93, stripnulls),
  "year" : ( 93, 97, stripnulls),
  "comment" : ( 97, 126, stripnulls),
  "genre" : (127, 128, ord)}
   
  def __parse(self, filename): # 解析MP3文件
    self.clear()
    try:
      fsock = open(filename, "rb", 0) # 打开文件
      try:
        # 设置文件读取的指针位置, seek第二个参数,2表示从文件结尾作为参考点,
        # -128表示还有128字节结尾的点,0表示文件开头做参考点,1表示当前位置做参考点
        fsock.seek(-128, 2)
        tagdata = fsock.read(128) # 读取128字节的数据
      finally:
        fsock.close() # 关闭文件,注意在finally中,出错也需要关闭文件句柄
      if tagdata[:3] == "TAG": # 判断是否是有效的含Tag的MP3文件
        # 循环取出Tag信息位置信息, 如3, 33, stripnulls,并依次赋给start, end, parseFunc
        for tag, (start, end, parseFunc) in self.tagDataMap.items():
          # tagdata[start:end]读出start到end的字节,使用parseFunc处理这些内容
          self[tag] = parseFunc(tagdata[start:end])
    except IOError: # 如果出现IOError,则跳过继续
      pass
   
  # 重写__setitem__方法,上面的self[tag] = parseFunc(tagdata[start:end])就会使用这个方法,
  # key为tag,itme为parseFunc(tagdata[start:end])
  def __setitem__(self, key, item):
    if key == "name" and item: # 如果key是 name,并且 item不为空
      self.__parse(item) # 解析MP3文件
      # problem here,should out of the if
      # FileInfo.__setitem__(self, key, item) 如果使用这个缩进就会出现错误
    # 之前的错误点,注意这儿的缩进,无论如何都会存储key-value,使用FileInfo.__setitem__父类的方法来存储
    FileInfo.__setitem__(self, key, item)
       
def listDirectory(directory, fileExtList):
  "获取directory目录下的所有fileExtList格式的文件,fileExtList是一个列表,可以有多种格式"
  fileList = [os.path.normcase(f)
    for f in os.listdir(directory)] # 列出所有 directory的文件
  fileList = [os.path.join(directory, f)
    for f in fileList
    # 过滤文件,满足fileExtList内的一种格式。os.path.splitext将文件分成文件名和扩展名
    if os.path.splitext(f)[1] in fileExtList]
     
  # sys.modules[FileInfo.__module__] 获取FileInfo.__module__模块,其中FileInfo.__module__在此会是 main,
  # 如果被别的模块调用的话就不是了,这是为什么不直接用“main”
  def getFileInfoClass(filename, module=sys.modules[FileInfo.__module__]):
    "定义一个函数,获取文件的信息"
     # 获取需要用来解析的类,如果是mp3文件结果为MP3FileInfo,其他为FileInfo
    subclass = "%sFileInfo" % os.path.splitext(filename)[1].upper()[1:]
    # 返回一个类,注意,返回的是一个“类”。使用getattr获取moudle模块中的subclass类
    return hasattr(module, subclass) and getattr(module, subclass) or FileInfo
  # 注意,这句话可能比较难理解, getFileInfoClass(f) (f)为什么会有两个(f)呢,上面已经说过getFileInfoClass(f)
  # 根据文件名返回一个解析类,这儿是返回就是MP3FileInfo,而第二个(f)就表示对这个类以f初始化MP3FileInfo(f)
  return [getFileInfoClass(f) (f) for f in fileList]
 
if __name__ == "__main__": # main函数,在别的模块中不会允许这里面的代码了
  for info in listDirectory("E:\\Music", [".mp3"]): # 循环获取E:\\Music文件夹中所有的mp3文件的信息
    # 由于MP3FileInfo继承自FileInfo,FileInfo继承自UserDict,这个的items()就是获取key-value集合。
    # 使用"%s=%s"格式化输出,使用"\n".join将所有信息以换行连接。
    print "\n".join(["%s=%s" % (k, v) for k, v in info.items()])
    print # 每一个文件之后,输出一个空行

结果为:

album=What Are Words - Single

comment=pythontab

name=E:\Music\chris medina - what_are_words.mp3

title=What Are Words

artist=Chris Medina

year=2011

genre=13

 

album=After the Wedding

comment=pythontab

name=E:\Music\two fathers.mp3

title=Two Fathers

artist=pythontab

year=2010

genre=255

注意:逻辑比较多,代码不算少,不懂的多看注释

Python 相关文章推荐
Python中for循环和while循环的基本使用方法
Aug 21 Python
一个基于flask的web应用诞生 使用模板引擎和表单插件(2)
Apr 11 Python
Python线性方程组求解运算示例
Jan 17 Python
python实现beta分布概率密度函数的方法
Jul 08 Python
python爬虫 2019中国好声音评论爬取过程解析
Aug 26 Python
Python3+Selenium+Chrome实现自动填写WPS表单
Feb 12 Python
基于spring boot 日志(logback)报错的解决方式
Feb 20 Python
Python接口开发实现步骤详解
Apr 26 Python
基于TensorFlow的CNN实现Mnist手写数字识别
Jun 17 Python
Python3.7安装pyaudio教程解析
Jul 24 Python
python geopandas读取、创建shapefile文件的方法
Jun 29 Python
Python 可迭代对象 iterable的具体使用
Aug 07 Python
python通过定义一个类实例作为ftp回调方法
May 04 #Python
Python中__new__与__init__方法的区别详解
May 04 #Python
Python中的ConfigParser模块使用详解
May 04 #Python
Python的__builtin__模块中的一些要点知识
May 02 #Python
一些Python中的二维数组的操作方法
May 02 #Python
在Python的Tornado框架中实现简单的在线代理的教程
May 02 #Python
探究Python的Tornado框架对子域名和泛域名的支持
May 02 #Python
You might like
php adodb分页实现代码
2009/03/19 PHP
php实现水仙花数示例分享
2014/04/03 PHP
php使用pclzip类实现文件压缩的方法(附pclzip类下载地址)
2016/04/30 PHP
固定背景实现的背景滚动特效示例分享
2013/05/19 Javascript
JS实现点击文字对应DIV层不停闪动效果的方法
2015/03/02 Javascript
基于JavaScript制作霓虹灯文字 代码 特效
2015/09/01 Javascript
jquery获取url参数及url加参数的方法
2015/10/26 Javascript
jquery实现全选和全不选功能效果的实现代码【推荐】
2016/05/05 Javascript
AngularJS入门教程引导程序
2016/08/18 Javascript
Vuejs第一篇之入门教程详解(单向绑定、双向绑定、列表渲染、响应函数)
2016/09/09 Javascript
JS组件系列之使用HTML标签的data属性初始化JS组件
2016/09/14 Javascript
使用jQuery实现鼠标点击左右按钮滑动切换
2017/08/04 jQuery
vue仿淘宝订单状态的tab切换效果
2020/06/23 Javascript
vue实现PC端录音功能的实例代码
2019/06/05 Javascript
浅谈Vue2.4.0 $attrs与inheritAttrs的具体使用
2020/03/08 Javascript
实践Python的爬虫框架Scrapy来抓取豆瓣电影TOP250
2016/01/20 Python
Python 利用切片从列表中取出一部分使用的方法
2019/02/01 Python
在Django的View中使用asyncio的方法
2019/07/12 Python
python实现单链表的方法示例
2019/09/03 Python
python 普通克里金(Kriging)法的实现
2019/12/19 Python
如何在windows下安装Pycham2020软件(方法步骤详解)
2020/05/03 Python
Python中对象的比较操作==和is区别详析
2021/02/12 Python
html5的canvas元素使用方法介绍(画矩形、画折线、圆形)
2014/04/14 HTML / CSS
探索HTML5本地存储功能运用技巧
2016/03/02 HTML / CSS
viagogo法国票务平台:演唱会、体育比赛、戏剧门票
2017/03/27 全球购物
韩都衣舍天猫官方旗舰店:天猫女装销售总冠军
2017/10/10 全球购物
美国睫毛、眉毛精华液领导品牌:RevitaLash Cosmetics
2018/03/26 全球购物
Prototype中如何为一个元素添加一个方法
2014/12/08 面试题
本科生求职简历的自我评价
2013/10/21 职场文书
食品行业求职人的自我评价
2014/01/19 职场文书
新闻编辑自荐书范文
2014/02/12 职场文书
《学棋》教后反思
2014/04/14 职场文书
感恩父母的演讲稿
2014/05/06 职场文书
2014年环保工作总结
2014/11/26 职场文书
杭州黄龙洞导游词
2015/02/10 职场文书
环保建议书作文500字
2015/09/14 职场文书