使用Python3中的gettext模块翻译Python源码以支持多语言


Posted in Python onMarch 31, 2015

你写了一个Python 3程序,还想要它适用于其他语言。你能复制全部代码库,然后刻意地检查每个.py文件,替换掉所有找到的文本字符串。但这意味着你有两份你代码的独立副本,每当你要做出个改动或修复个bug,你的工作量会加倍。而且如果你想要程序还适用于其他语言,就更糟了。

幸运的是,Python给了一个解决办法,就是用gettext模块。
一个Hack解法

你应该把你自己的解决办法统一改变。例如,你可以把你程序中的每个字符串替换为一个函数调用(函数名简单些,比如像_()一样),这会返回被翻译为该正确语言的字符串。举个例子,如果你的程序原本是:
 

print('Hello world!')

……你可以将它改为:
 

print(_('Hello world!'))

……函数_()会返回'Hello world!'的翻译,它基于程序设置有的语言。比如,如果这个语言设置之前被存在一个叫LANGUAGE的全局变量中,函数_()看起来像这样:
 

def _(s):
  spanishStrings = {'Hello world!': 'Hola Mundo!'}
  frenchStrings = {'Hello world!': 'Bonjour le monde!'}
  germanStrings = {'Hello world!': 'Hallo Welt!'}
 
  if LANGUAGE == 'English':
    return s
  if LANGUAGE == 'Spanish':
    return spanishStrings[s]
  if LANGUAGE == 'French':
    return frenchStrings[s]
  if LANGUAGE == 'German':
    return germanStrings[s]

这可以,但是你这是在重复造轮子。Python的gettext模块可以做更多。gettext是一系列工具,文件格式在20世纪90年代被发明出来,来规范软件国际化(也叫I18N)。gettext是个作为对于所有编程语言的系统化的设计,但是我们会在本篇文章中只专注于Python。
程序例子

设想你有个想要翻译的用Python3写的简单“猜数字”游戏。程序的源代码在这里。有四步来使这个程序国际化:

    调整这个.py文件的源代码,这样使字符串输入进一个名为_()的函数。
    用和Python一起安装的pygettext.py文本,从源代码创建一个”pot”文件。
    用这个免费的跨平台Poedit软件,从pot文件创建.po和.mo文件。
    再次调整你的.py文件源代码导入gettext模块的代码,设置语言。

第一步:添加 _() 函数

首先,检查你程序中的所有需要被翻译和用_()的调用来替代的字符串。针对Python使用的gettext系统用_()作为得到翻译了的字符串的通用名,因为它是个短名。

注意:用格式型字符串而不是连接型字符串会是你的程序翻译起来更简单。例如,用连接型字符串你的程序会像这样:
 

print('Good job, ' + myName + '! You guessed my number in ' + guessesTaken + ' guesses!')
print(_('Good job, ') + myName + _('! You guessed my number in ') + guessesTaken + _(' guesses!'))

This results in three separate strings that need to be translated, as opposed to the single string needed in the string formatting approach:
这会导致三个独立的字符串都需要翻译,然而相反的是在格式型的字符串中,只需翻译一个字符串:

print('Good job, %s! You guessed my number in %s guesses!' % (myName, guessesTaken))
print(_('Good job, %s! You guessed my number in %s guesses!') % (myName, guessesTaken))

当你改完“猜数字”源代码后,它会像这样。你并不能运行它,因为_()函数还没定义。这个变化只是让pygettext.py文本可以找到所有需要翻译的字符串。
第二步:用pygettext.py提取字符串

在你Python安装(Windows上的C:Python34Toolsi18n)中的Tools/i18n就是pygettext.py文本。对于可译字符串普通 gettext unix 命令解析 C/C++ 源码并且 xgettext unix 命令可以解析其他语言,而pygettext.py则知道怎样去解析Python源码。它会找到所有字符串并产生个”pot”文件。

在Windows上我已经运行了这个文本像这样:
 

C:>py -3.4 C:Python34Toolsi18npygettext.py -d guess guess.py

这创建了一个pot文件,叫guess.pot。这只是个普通纯文本文件,它列出来了全部的在源码中寻找_()的调用的要翻译的字符串。你可以在这儿看guess.pot文件.
第三步:用Poedit翻译字符串

你可以用文本编辑器填写翻译但是免费的Poedit软件会更容易从这儿下载http://poedit.net. 选择 > New from POT/PO file… 然后选择你的guess.po文件。

使用Python3中的gettext模块翻译Python源码以支持多语言

Poedit会问你想要翻译成什么语言。我们举例用西班牙语:

使用Python3中的gettext模块翻译Python源码以支持多语言

填写翻译吧。(我用 http://translate.google.com,所以对于真的使用西班牙语的人会感觉有点奇怪。)

使用Python3中的gettext模块翻译Python源码以支持多语言

现在储存文件在它的gettext形式的文件夹里。保存会创建.po文件(一个人类可读的文本文件不同于原始.pot文件,除了是有西语翻译的)和一个.mo文件(一个gettext会读取的机器可读版本。这些文件会存在一个特定的文件夹内,为的是让gettext能够找到他们。他们看起来像这样(比如西语文件中的”es”和德语文件中”de”):
 

./guess.py
./guess.pot
./locale/es/LC_MESSAGES/guess.mo
./locale/es/LC_MESSAGES/guess.po
./locale/de/LC_MESSAGES/guess.mo
./locale/de/LC_MESSAGES/guess.po

这些两种性质的语言像西语中的”es”和德语中的 ”de” 被称作ISO 639-1 codes 是语言的标准缩写。你不一定要用他们,但是遵循标准是有道理的。
第四步:给你程序加上gettext代码

现在你有包含翻译的.mo文件,调整你的Python代码去用它。在你的程序中加上下面的:
 

import gettext
es = gettext.translation('guess', localedir='locale', languages=['es'])
es.install()

第一个 'guess' 是”定义域”,这其实是意味着guess.mo文件名中“猜”的部分。 localedir是你创建的locale文件夹的目录地址。这会是相对或绝对的路径。'es'描述在locale文件夹下面的文件。LC_MESSAGES文件夹是个标准名

install()方法会导致调用_()返回翻译为西语的字符串。如果你想回到原始的英语只需要分配一个lambda函数值给_,这会返回当时输入的字符串:
 

import gettext
es = gettext.translation('guess', localedir='locale', languages=['es'])
print(_('Hello! What is your name?')) # prints Spanish
 
_ = lambda s: s

你可以检查准备翻译的”Guess the Number”源码。如果你想要运行此程序,下载并解压这个压缩文件和它的locale文件夹和.mo安装文件。
延伸阅读

我怎样都称不上是 I18N or gettext的专家,如果我的教程讲解不够好,请一定要留言。大多数情况下,你的软件运行时不会转换语言,而是会去读LANGUAGE,LC_ALL,LC_MESSAGES,和LANG这些环境变量中的一个来确定计算机的工作地点。我会边学习边更新本教程的。

Python 相关文章推荐
用实例说明python的*args和**kwargs用法
Nov 01 Python
Python字符串逐字符或逐词反转方法
May 21 Python
Python实现提取谷歌音乐搜索结果的方法
Jul 10 Python
详解Python的collections模块中的deque双端队列结构
Jul 07 Python
Python文本相似性计算之编辑距离详解
Nov 28 Python
python字符串的方法与操作大全
Jan 30 Python
python使用matplotlib绘制热图
Nov 07 Python
Python基础学习之基本数据结构详解【数字、字符串、列表、元组、集合、字典】
Jun 18 Python
Django发送邮件和itsdangerous模块的配合使用解析
Aug 10 Python
解决Python3.8用pip安装turtle-0.0.2出现错误问题
Feb 11 Python
python实现随机加减法生成器
Feb 24 Python
python基于tkinter制作下班倒计时工具
Apr 28 Python
python根据出生日期获得年龄的方法
Mar 31 #Python
用Python进行一些简单的自然语言处理的教程
Mar 31 #Python
用Python制作在地图上模拟瘟疫扩散的Gif图
Mar 31 #Python
以一段代码为实例快速入门Python2.7
Mar 31 #Python
11个并不被常用但对开发非常有帮助的Python库
Mar 31 #Python
Python的Flask框架中@app.route的用法教程
Mar 31 #Python
使用Python的Flask框架实现视频的流媒体传输
Mar 31 #Python
You might like
解析php中memcache的应用
2013/06/18 PHP
完美解决PHP中的Cannot modify header information 问题
2013/08/12 PHP
php 伪造ip以及url来路信息方法汇总
2014/11/25 PHP
PHP的Json中文处理解决方案
2016/09/29 PHP
JQuery实现点击div以外的位置隐藏该div窗口
2013/09/13 Javascript
js中浮点型运算BUG的解决方法说明
2014/01/06 Javascript
javascript获取checkbox复选框获取选中的选项
2014/08/12 Javascript
jquery实现手风琴效果
2015/11/20 Javascript
JS组件Bootstrap实现弹出框和提示框效果代码
2015/12/08 Javascript
Bootstrap中的Dropdown下拉菜单更改为悬停(hover)触发
2016/08/31 Javascript
简单实现jQuery级联菜单
2017/01/09 Javascript
Javascript的this用法
2017/01/16 Javascript
jQuery+Ajax请求本地数据加载商品列表页并跳转详情页的实现方法
2017/07/12 jQuery
vue.js与后台数据交互的实例讲解
2018/08/08 Javascript
在Angular中使用JWT认证方法示例
2018/09/10 Javascript
实例介绍JavaScript中多种组合继承
2019/01/20 Javascript
vue如何自动化打包测试环境和正式环境的dist/test文件
2019/06/06 Javascript
vue element-ui table组件动态生成表头和数据并修改单元格格式 父子组件通信
2019/08/15 Javascript
vue2.0 获取从http接口中获取数据,组件开发,路由配置方式
2019/11/04 Javascript
基于vue和websocket的多人在线聊天室
2020/02/01 Javascript
[50:50]完美世界DOTA2联赛PWL S3 INK ICE vs DLG 第一场 12.20
2020/12/23 DOTA
python实现随机密码字典生成器示例
2014/04/09 Python
python计算两个矩形框重合百分比的实例
2018/11/07 Python
python文件选择对话框的操作方法
2019/06/27 Python
浅析PyTorch中nn.Module的使用
2019/08/18 Python
加拿大廉价机票预订网站:CheapOair.ca
2018/03/04 全球购物
全球速卖通俄罗斯站:AliExpress俄罗斯
2019/06/17 全球购物
技术副厂长岗位职责
2013/12/26 职场文书
销售冠军获奖感言
2014/02/03 职场文书
2014领导班子四风问题查摆思想汇报
2014/09/13 职场文书
银行求职自荐信范文
2015/03/04 职场文书
中学音乐课教学反思
2016/02/18 职场文书
读《瓦尔登湖》有感:每个人都需要一个瓦尔登湖
2019/10/17 职场文书
浅谈Web Storage API的使用
2021/06/23 Javascript
分享CSS盒子模型隐藏的几种方式
2022/02/28 HTML / CSS
Nginx配置根据url参数重定向
2022/04/11 Servers