Python开发编码规范


Posted in Python onSeptember 08, 2006

这篇文档所给出的编码约定适用于在主要的Python发布版本中组成标准库的Python   代码,请查阅相关的关于在Python的C实现中C代码风格指南的描述。
这篇文档改编自Guido最初的《Python风格指南》一文,并从《Barry's style guide》中添加了部分内容。在有冲突的地方,Guide的风格规则应该是符合本PEP的意图(译注:指当有冲突时,应以Guido风格为准)。这篇PEP仍然尚未完成(实际上,它可能永远都不会完成)。
  在这篇风格指导中的一致性是重要的。在一个项目内的一致性更重要。在一个模块或函数内的一致性最重要。但最重要的是:知道何时会不一致——有时只是没有实施风格指导。当出现疑惑时,运用你的最佳判断,看看别的例子,然后决定怎样看起来更好。并且要不耻下问!
  打破一条既定规则的两个好理由:
(1)     当应用这个规则是将导致代码可读性下降,即便对某人来说,他已经习惯于按这条规则来阅读代码了。
(2)     为了和周围的代码保持一致而打破规则(也许是历史原因),虽然这也是个清除其它混乱的好机会(真正的XP风格)。

代码的布局
  缩进
使用Emacs的Python-mode的默认值:4个空格一个缩进层次。对于确实古老的代码,你不希望产生混乱,可以继续使用8空格的制表符(8-space tabs)。Emacs Python-mode自动发现文件中主要的缩进层次,依此设定缩进参数。

制表符还是空格
  永远不要混用制表符和空格。最流行的Python缩进方式是仅使用空格,其次是仅使用制表符,混合着制表符和空格缩进的代码将被转换成仅使用空格。(在Emacs中,选中整个缓冲区,按ESC-x去除制表符。)调用Python命令行解释器时使用-t选项,可对代码中不合法得混合制表符和空格发出警告,使用-tt时警告将变成错误。这些选项是被高度推荐的。
  对于新的项目,强烈推荐仅使用空格而不是制表符。许多编辑器拥有使之易于实现的功能(在Emacs中,确认indent-tabs-mode是nil)。

行的最大长度
  周围仍然有许多设备被限制在每行80字符:而且,窗口限制在80个字符。使将多个窗口并排放置成为可能。在这些设备上使用默认的折叠方式看起来有点丑陋。因此,请将所有行限制在最大79字符(Emacs准确得将行限制为长80字符),对顺序排放的大块文本(文档字符串或注释),推荐将长度限制在72字符。
  折叠长行的首选方法是使用Pyhon支持的圆括号,方括号和花括号内的行延续。如果需要,你可以在表达式周围增加一对额外的圆括号,但是有时使用反斜杠看起来更好,确认恰当得缩进了延续的行。
  Emacs的Python-mode正确得完成了这些。一些例子:
#!Python
  class Rectangle(Blob):
    def __init__(self,width,height,color='black',emphasis=None,highlight=0):
        if width == 0 and height == 0 and \
          color == 'red' and emphasis == 'strong' or \
          highlight > 100:
          raise ValueError, "sorry, you lose"
        if width == 0 and height == 0 and (color == 'red' or
                              emphasis is None):
          raise ValueError,"I don't think so"
        Blob.__init__(self,width,height,color,emphasis,highlight)

空行
  用两行空行分割顶层函数和类的定义,类内方法的定义用单个空行分割,额外的空行可被用于(保守的)分割相关函数组成的群,在一组相关的单句中间可以省略空行。(例如:一组哑元素)。
  当空行用于分割方法的定义时,在‘class'行和第一个方法定义之间也要有一个空行。在函数中使用空行时,请谨慎的用于表示一个逻辑段落。Python接受contol-L(即^L)换页符作为空格:Emacs(和一些打印工具),视这个字符为页面分割符,因此在你的文件中,可以用他们来为相关片段分页。

编码
  Python核心发布中的代码必须始终使用ASCII或Latin-1编码(又名 ISO-8859-1),使用ASCII的文件不必有编码cookie,Latin-1仅当注释或文档字符串涉及作者名字需要Latin-1时才被使用:
  另外使用\x转义字符是在字符串中包含非ASCII(non-ASCII)数据的首选方法。
  作为PEP 263实现代码的测试套件的部分文件是个例外。

导入
  通常应该在单独的行中导入(Imports),例如:
No:import sys, os
Yes:import sys
    import os
  但是这样也是可以的:
  from types import StringType, ListType
  Imports 通常被放置在文件的顶部,仅在模块注释和文档字符串之后,在模块的全局变量和常量之前。Imports应该有顺序地成组安放:
1、标准库的导入(Imports )
  2、相关的主包(major package)的导入(即,所有的email包在随后导入)
  3、特定应用的导入(imports)
  你应该在每组导入之间放置一个空行,对于内部包的导入是不推荐使用相对导入的,对所有导入都要使用包的绝对路径。
  从一个包含类的模块中导入类时,通常可以写成这样:
    from MyClass import MyClass
    from foo.bar.YourClass import YourClass
  如果这样写导致了本地名字冲突,那么就这样写
    import MyClass
    import foo.bar.YourClass
  即使用"MyClass.MyClass"和"foo.bar.YourClass.YourClass"

表达式和语句中的空格
  Guido不喜欢在以下地方出现空格:
  紧挨着圆括号,方括号和花括号的,如:"spam( ham[ 1 ],{ eggs:2 } )"。要始终将它写成"spam(ham[1],{eggs: 2})"。
  紧贴在逗号,分号或冒号前的,如:
    "if x == 4:print x,y:x,y = y,x"。要始终将它写成
    "if x == 4:print x,y:x,y = y,x"。
紧贴着函数调用的参数列表前开式括号(open parenthesis )的,如"spam (1)"。要始终将它写成"spam(1)"。
紧贴在索引或切片,开始的开式括号前的,如:
  "dict ['key'] = list [index]"。要始终将它写成"dict['key'] = list[index]"。
  在赋值(或其它)运算符周围的用于和其它并排的一个以上的空格,如:
#!Python
      x= 1
      y= 2
      long_variable = 3
要始终将它写成
#!Python
      x = 1
      y = 2
      long_variable = 3
  (不要对以上任意一条和他争论——Guido 养成这样的风格超过20年了。)

其它建议
  始终在这些二元运算符两边放置一个空格:赋值(=), 比较(==,<,>,!=,<>,<=,     >=,in,not in,is,is not),布尔运算 (and,or,not)。
  按你的看法在算术运算符周围插入空格。 始终保持二元运算符两边空格的一致。
  一些例子:
#!Python
      i = i+1
      submitted = submitted + 1
      x = x*2 - 1
      hypot2 = x*x + y*y
      c = (a+b) * (a-b)
      c = (a + b) * (a - b)
  不要在用于指定关键字参数或默认参数值的'='号周围使用空格,例如:
#!Python
      def complex(real, imag=0。0):
        return magic(r=real, i=imag)
  不要将多条语句写在同一行上:
      No: if foo == 'blah':do_blah_thing()
      Yes:if foo == 'blah':
            do_blah_thing()

      No:do_one():do_two():do_three()
      Yes: do_one()
          do_two()
          do_three()

注释
同代码不一致的注释比没注释更差。当代码修改时,始终优先更新注释!注释应该是完整的句子,如果注释是一个短语或句子,首字母应该大写,除非他是一个以小写字母开头的标识符(永远不要修改标识符的大小写)。
  如果注释很短,最好省略末尾的句号。注释块通常由一个或多个由完整句子构成的段落组成,每个句子应该以句号结尾。你应该在句末,句号后使用两个空格,以便使Emacs的断行和填充工作协调一致。
  用英语书写时,断词和空格是可用的。非英语国家的Python程序员:请用英语书写你的注释,除非你120%的确信这些代码不会被不懂你的语言的人阅读。

注释块
  注释块通常应用于跟随着一些(或者全部)代码并和这些代码有着相同的缩进层次。注释块中每行以‘#'和一个空格开始(除非他是注释内的缩进文本)。注释块内的段落以仅含单个‘#'的行分割。注释块上下方最好有一空行包围(或上方两行下方一行,对一个新函数定义段的注释)。

行内注释
  一个行内注释是和语句在同一行的注释,行内注释应该谨慎适用,行内注释应该至少用两个空格和语句分开,它们应该以'#'和单个空格开始。
    x = x+1           # Increment x
  如果语意是很明了的,那么行内注释是不必要的,事实上是应该被移除的。不要这样写:
    x = x+1           # Increment x
    x = x+1           # Compensate for border
  但是有时,这样是有益的:
    x = x+1           # Compensate for border

文档字符串
  应该一直遵守编写好的文档字符串的约定PEP 257 [3]。为所有公共模块,函数,类和方法编写文档字符串。文档字符串对非公开的方法不是必要的,但你应该有一个描述这个方法做什么的注释。这个注释应该在"def"这行后。
PEP 257 描述了好的文档字符串的约定。一定注意,多行文档字符串结尾的"""应该单独成行,例如:
    """Return a foobang
    Optional plotz says to frobnicate the bizbaz first。
    """
对单行的文档字符串,结尾的"""在同一行也可以。
版本注记
如果你要将RCS或CVS的杂项(crud)包含在你的源文件中,按如下做。
#!Python
    __version__ = "$Revision: 1。4 $"
    # $Source: E:/cvsroot/Python_doc/pep8。txt,v $
这个行应该包含在模块的文档字符串之后,所有代码之前,上下用一个空行分割。

命名约定
  Python库的命名约定有点混乱,所以我们将永远不能使之变得完全一致,不过还是有公认的命名规范的。新的模块和包(包括第三方的框架)必须符合这些标准,但对已有的库存在不同风格的,保持内部的一致性是首选的。

描述:命名风格
  有许多不同的命名风格。以下的有助于辨认正在使用的命名风格,独立于它们的作用。   以下的命名风格是众所周知的:
  b (单个小写字母)
  B (单个大写字母)
  Lowercase(小写)
  lower_case_with_underscores(有下划线的小写)
  UPPERCASE(大写)
  UPPER_CASE_WITH_UNDERSCORES(有下划线的大写)
  CapitalizedWords (或 CapWords,CamelCase这样命名是因为可从字母的大小写分出单词。这有时也被当作StudlyCaps。
  mixedCase (与CapitalizedWords的不同在于首字母小写!)
  Capitalized_Words_With_Underscores(有下划线的首字母大写) (丑陋!)
  还有用短的特别前缀将相关的名字聚合在一起的风格。这在Python中不常用,但是出于完整性要提一下,例如,os.stat()函数返回一个元组,他的元素传统上说名如st_mode, st_size,st_mtime等等。
  X11库的所有公开函数以X开头。(在Python中,这个风格通常认为是不必要的,因为属性和方法名以对象作前缀,而函数名以模块名作前缀。)
另外,以下用下划线作前导或结尾的特殊形式是被公认的(这些通常可以和任何习惯组合):
_single_leading_underscore(单个下划线作前导):弱的“内部使用(internal use)”标志。 (例如,“from M import *”不会导入以下划线开头的对象)。
single_trailing_underscore_(单个下划线结尾): 用于避免与Python关键词的冲突,例如:“Tkinter.Toplevel(master,class_='ClassName')”。
  _double_leading_underscore(双下划线):从Python 1.4起为类私有名。
  _double_leading_and_trailing_underscore_:“magic”对象或属性,存在于用户控制的(user-controlled)名字空间,例如:_init_, _import_ 或_file_。有时它们被用户定义用于触发某个魔法行为(例如:运算符重载):有时被构造器插入,以便自己使用或为了调试。因此,在未来的版本中,构造器(松散得定义为Python解释器和标准库)可能打算建立自己的魔法属性列表,用户代码通常应该限制将这种约定作为己用。欲成为构造器的一部分的用户代码可以在下滑线中结合使用短前缀,例如:
_bobo_magic_attr__。

说明:命名约定
应避免的名字。永远不要用字符‘l'(小写字母el(就是读音,下同)),‘O'(大写字母oh),或‘I'(大写字母eye)作为单字符的变量名。在某些字体中这些字符不能与数字1和0分辨。试着在使用‘l'时用‘L'代替。

模块名
  模块应该是不含下划线的,简短的,小写的名字。因为模块名被映射到文件名,有些文件系统大小写不敏感并且截短长名字,模块名被选为相当短是重要的,这在Unix上不是问题,但当代码传到Mac或Windows上就可能是个问题了。
当用C或C++编写的扩展模块有一个伴随Python模块提供高层(例如进一步的面向对象)接口时,C/C++模块有下划线前导(如:_socket)。Python包应该是不含下划线的,简短的,全小写的名字。

类名
几乎不出意料,类名使用CapWords约定。内部使用的类外加一个前导下划线。

异常名
如果模块对所有情况定义了单个异常,它通常被叫做“error”或“Error”。似乎内建(扩展)的模块使用“error”(例如:os.error),而Python模块通常用“Error” (例如:xdrlib.Error)。趋势似乎是倾向使用CapWords异常名。

全局变量名
(让我们祈祷这些变量仅在一个模块的内部有意义)
  这些约定和在函数中的一样。模块是被设计为通过“from M import *”来使用的,必须用一个下划线作全局变量(及内部函数和类)的前缀防止其被导出(exporting)。

函数名
函数名应该为小写,可能用下划线风格单词以增加可读性。mixedCase仅被允许用于这种风格已经占优势的上下文(如:threading.py),以便保持向后兼容。

方法名和实例变量
这段大体上和函数相同:通常使用小写单词,必要时用下划线分隔增加可读性。仅为不打算作为类的公共界面的内部方法和实例使用一个前导下划线,Python不强制要求这样:它取决于程序员是否遵守这个约定。
使用两个前导下划线以表示类私有的名字,Python将这些名字和类名连接在一起:
如果类Foo有一个属性名为_a,它不能以Foo._a访问。(固执的用户还是可以通过Foo._Foo__a得到访问权。)
通常双前导下划线仅被用于避免含子类的类中的属性名的名字冲突。

继承的设计
始终要确定一个类中的方法和实例变量是否要被公开。通常,永远不要将数据变量公开,除非你实现的本质上只是记录,人们几乎总是更喜欢代之给出一个函数作为类的界面(Python 2.2 的一些开发者在这点上做得非常漂亮)。
同样,确定你的属性是否应为私有的。私有和非私有的区别在于模板将永远不会对原有的类(导出类)有效,而后者可以。你应该在大脑中就用继承设计好了你的类,私有属性必须有两个前导下划线,无后置下划线,非公有属性必须有一个前导下划线,无后置下划线,公共属性没有前导和后置下划线,除非它们与保留字冲突,在此情况下,单个后置下划线比前置或混乱的拼写要好,例如:class_优于klass。
最后一点有些争议:如果相比class_你更喜欢klass,那么这只是一致性问题。

设计建议
单个元素(singletons)的比较,如None 应该永远用:‘is'或‘is not'来做。当你本意是“if x is not None”时,对写成“if x”要小心。例如当你测试一个默认为None的变量或参数是否被设置为其它值时,这个值也许在布尔上下文(Boolean context)中是false!
基于类的异常总是好过基于字符串的异常。模块和包应该定义它们自己的域内特定的基异常类,基类应该是内建的Exception类的子类。还始终包含一个类的文档字符串。例如:
#!Python
    class MessageError(Exception):
        """Base class for errors in the email package。"""
使用字符串方法(methods)代替字符串模块,除非必须向后兼容Python 2.0以前的版本。字符串方法总是非常快,而且和unicode字符串共用同样的API(应用程序接口)在检查前缀或后缀时避免对字符串进行切片。用startswith()和endswith()代替,因为它们是明确的并且错误更少。例如:
    No: if foo[:3] == 'bar':
    Yes: if foo。startswith('bar'):
例外是如果你的代码必须工作在Python 1.5.2 (但是我们希望它不会发生!),对象类型的比较应该始终用isinstance()代替直接比较类型,例如:
    No: if type(obj) is type(1):
    Yes: if isinstance(obj, int):
检查一个对象是否是字符串时,紧记它也可能是unicode字符串!在Python 2.3,str和unicode有公共的基类,basestring,所以你可以这样做:
    if isinstance(obj, basestring):
在Python 2.2类型模块为此定义了StringTypes类型,例如:
#!Python
    from types import StringTypes
    if isinstance(obj, StringTypes):
在Python 2.0和2.1,你应该这样做:
#!Python
    from types import StringType, UnicodeType
    if isinstance(obj, StringType) or \
      isinstance(obj, UnicodeType) :
对序列,(字符串,列表,元组),使用空列表是false这个事实,因此“if not seq”或“if seq”比“if len(seq)”或“if not len(seq)”好。书写字符串文字时不要依赖于有意义的后置空格。这种后置空格在视觉上是不可辨别的,并且有些编辑器(特别是近来,reindent.py)会将它们修整掉。不要用==来比较布尔型的值以确定是True或False(布尔型是Pythn 2.3中新增的)
    No: if greeting == True:
    Yes: if greeting:

    No: if greeting == True:
    Yes: if greeting:

Python 相关文章推荐
Python 列表(List)操作方法详解
Mar 11 Python
如何在Python中编写并发程序
Feb 27 Python
详解Python函数作用域的LEGB顺序
May 14 Python
利用python批量给云主机配置安全组的方法教程
Jun 21 Python
Python实现图片转字符画的示例代码
Aug 21 Python
mvc框架打造笔记之wsgi协议的优缺点以及接口实现
Aug 01 Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 Python
python读写csv文件方法详细总结
Jul 05 Python
解决pycharm启动后总是不停的updating indices...indexing的问题
Nov 27 Python
Python pygame绘制文字制作滚动文字过程解析
Dec 12 Python
python实现全排列代码(回溯、深度优先搜索)
Feb 26 Python
Python爬虫实战之爬取京东商品数据并实实现数据可视化
Jun 07 Python
学习python (1)
Oct 31 #Python
学习python (2)
Oct 31 #Python
简明 Python 基础学习教程
Feb 08 #Python
Python完全新手教程
Feb 08 #Python
Python学习资料
Feb 08 #Python
一篇不错的Python入门教程
Feb 08 #Python
王纯业的Python学习笔记 下载
Feb 10 #Python
You might like
PHP+FFMPEG实现将视频自动转码成H264标准Mp4文件
2014/09/24 PHP
PHP使用glob函数遍历目录或文件夹的方法
2014/12/16 PHP
Centos下升级php5.2到php5.4全记录(编译安装)
2015/04/03 PHP
PHP图像处理类库及演示分享
2015/05/17 PHP
php无限级分类实现方法分析
2016/10/19 PHP
PHP使用XMLWriter读写xml文件操作详解
2018/07/31 PHP
TP5多入口设置实例讲解
2020/12/15 PHP
JSON 编辑器实现代码
2009/12/06 Javascript
javascript 利用Image对象实现的埋点(某处的点击数)统计
2012/12/28 Javascript
解析javascript系统错误:-1072896658的解决办法
2013/07/08 Javascript
JavaScript语言核心数据类型和变量使用介绍
2013/08/23 Javascript
jQuery读取XML文件内容的方法
2015/03/09 Javascript
jquery使用slideDown实现模块缓慢拉出效果的方法
2015/03/27 Javascript
js实现浮动在网页右侧的简洁QQ在线客服代码
2015/09/04 Javascript
详解javascript数组去重问题
2015/11/06 Javascript
Bootstrap多级导航栏(级联导航)的实现代码
2016/03/08 Javascript
JS中的数组方法笔记整理
2016/07/26 Javascript
Angular1.x复杂指令实例详解
2017/03/01 Javascript
nuxt框架中对vuex进行模块化设置的实现方法
2019/09/06 Javascript
Scrapy基于selenium结合爬取淘宝的实例讲解
2018/06/13 Python
Java文件与类动手动脑实例详解
2019/11/10 Python
python计算无向图节点度的实例代码
2019/11/22 Python
Tensorflow训练MNIST手写数字识别模型
2020/02/13 Python
解决Keras中Embedding层masking与Concatenate层不可调和的问题
2020/06/18 Python
html5简介_动力节点Java学院整理
2017/07/07 HTML / CSS
HealthElement海外旗舰店:新西兰大卖场
2018/02/23 全球购物
Seavenger官网:潜水服、浮潜、靴子和袜子
2020/03/05 全球购物
如何利用cmp命令比较文件
2016/04/11 面试题
电大毕业生自我鉴定
2014/04/10 职场文书
高中生班主任评语
2014/04/25 职场文书
金融事务专业求职信
2014/04/25 职场文书
材料化学专业求职信
2014/07/15 职场文书
长城的导游词
2015/01/30 职场文书
毕业实习感受与体会
2015/05/26 职场文书
解决thinkphp6(tp6)在状态码500下不报错,或者显示错误“Malformed UTF-8 characters”的问题
2021/04/01 PHP
PyQt5爬取12306车票信息程序的实现
2021/05/14 Python