Python实现删除Android工程中的冗余字符串


Posted in Python onJanuary 19, 2015

Android提供了一套很方便的进行资源(语言)国际化机制,为了更好地支持多语言,很多工程的翻译往往会放到类似crowdin这样的平台上。资源是全了,但是还是会有一些问题。

哪些问题

以下使用一些语言进行举例。其中values为工程默认的资源。

1.某语言的资源和某语言限定区域的资源之间。如values-fr-rCA存在于values-fr相同的字符串,这种表现最为严重。
2.某语言的资源和默认的资源之间。values-fr存在与values相同的字符串,可能原因是由于values-fr存在未翻译字符串导致

为什么要去重

洁癖,容不下半点冗余。

解决思路

1.如果values-fr-rCA存在于values-fr相同的字符串,去除values-fr-rCA中的重复字符串,保留values-fr。这样可以保证在values-fr-rCA下也可以正确读取到资源。

2.如果values-fr存在与values相同的字符串。如去除values-fr中得重复字符串,保留values的条目。

Py脚本

#!/usr/bin/env python

# coding=utf-8

from os import listdir,path, system

from sys import argv

try:

    import xml.etree.cElementTree as ET

except ImportError:

    import xml.etree.ElementTree as ET


def genRegionLangPair(filePath):

    basicLanguage = None

    if ('values' in filePath) :

        hasRegionLimit = ('r' == filePath[-3:-2])

        if (hasRegionLimit):

            basicLanguage = filePath[0:-4]

            if (not path.exists(basicLanguage)) :

                return None

            belongsToEnglish =  ("values-en" in basicLanguage)

            if (belongsToEnglish):

                #Compare with the res/values/strings.xml

                return (path.dirname(basicLanguage) + '/values/strings.xml', filePath + "/strings.xml")

            else:

                return (basicLanguage + '/strings.xml', filePath + "/strings.xml")

    return None
def genLangPair(filePath):

    def shouldGenLanPair(filePath):

        if (not 'values' in filePath ):

            return False

        if('dpi' in filePath):

            return False

        if ('dimes' in filePath):

            return False

        if ('large' in filePath):

            return False

        return True
    if(shouldGenLanPair(filePath)):

        basicLanguage = path.dirname(filePath) + '/values/strings.xml'

        targetLanguage = filePath + '/strings.xml'

        if (not path.exists(targetLanguage)):

           return None
        if (not path.samefile(basicLanguage,targetLanguage)) :

            return (basicLanguage, targetLanguage)

    return None
def genCompareList(filePath):

    compareLists = []

    for file in listdir(filePath):

        regionPair = genRegionLangPair(filePath + '/' + file)

        if (None != regionPair):

            compareLists.append(regionPair)
        languagePair = genLangPair(filePath + '/' + file)

        if (None != languagePair) :

            compareLists.append(languagePair)
    return compareLists
def getXmlEntries(filePath):

    root = ET.ElementTree(file=filePath).getroot()

    entries = {}

    for child in root:

        attrib = child.attrib

        if (None != attrib) :

            entries[attrib.get('name')] = child.text

    print 'xmlEntriesCount',len(entries)

    return entries
def rewriteRegionFile(sourceEntries, filePath):

    if (not path.exists(filePath)):

        return

    ET.register_namespace('xliff',"urn:oasis:names:tc:xliff:document:1.2")

    tree = ET.ElementTree(file=filePath)

    root = tree.getroot()

    print root

    totalCount = 0

    removeCount = 0

    unRemoveCount = 0

    print len(root)

    toRemoveList = []

    for child in root:

        totalCount = totalCount + 1

        attrib = child.attrib

        if (None == attrib):

            continue
        childName = attrib.get('name')
        if (sourceEntries.get(childName) == child.text):

            removeCount = removeCount + 1

            toRemoveList.append(child)

        else:

            unRemoveCount = unRemoveCount + 1

            print childName, sourceEntries.get(childName), child.text

    print filePath,totalCount, removeCount,unRemoveCount
    for aItem in toRemoveList:

        root.remove(aItem)
    if (len(root) != 0 ):

        tree.write(filePath, encoding="UTF-8")

    else:

        command = 'rm -rf %s'%(path.dirname(filePath))

        print command

        system(command)

def main(projectDir):

    lists = genCompareList(projectDir + "/res/")
    for item in lists:

        print item

        src = item[0]

        dest = item[1]

        rewriteRegionFile(getXmlEntries(src),dest)
if __name__ == "__main__":

    if (len(argv) == 2) :

        main(argv[1])

如何使用

python removeRepeatedStrings.py your_android_project_root_dir
Python 相关文章推荐
让Python代码更快运行的5种方法
Jun 21 Python
Python的Flask框架中使用Flask-SQLAlchemy管理数据库的教程
Jun 14 Python
Python模拟用户登录验证
Sep 11 Python
python清除字符串前后空格函数的方法
Oct 21 Python
简单了解python高阶函数map/reduce
Jun 28 Python
Python使用线程来接收串口数据的示例
Jul 02 Python
Python数据类型之列表和元组的方法实例详解
Jul 08 Python
我们为什么要减少Python中循环的使用
Jul 10 Python
python利用itertools生成密码字典并多线程撞库破解rar密码
Aug 12 Python
python机器学习实现决策树
Nov 11 Python
Python实现随机爬山算法
Jan 29 Python
Flask搭建一个API服务器的步骤
May 28 Python
Python中字典和JSON互转操作实例
Jan 19 #Python
Python中的字典遍历备忘
Jan 17 #Python
Python中处理unchecked未捕获异常实例
Jan 17 #Python
Python实现过滤单个Android程序日志脚本分享
Jan 16 #Python
Python中的对象,方法,类,实例,函数用法分析
Jan 15 #Python
Python转换HTML到Text纯文本的方法
Jan 15 #Python
python中os操作文件及文件路径实例汇总
Jan 15 #Python
You might like
深入解析php之apc
2013/05/15 PHP
PHP+jquery+ajax实现即时聊天功能实例
2014/12/23 PHP
详解PHP的Yii框架中日志的相关配置及使用
2015/12/08 PHP
在Laravel框架里实现发送邮件实例(邮箱验证)
2016/05/20 PHP
php使用ffmpeg向视频中添加文字字幕的实现方法
2016/05/23 PHP
PHP实现微信对账单处理
2018/10/01 PHP
jquery插件制作 提示框插件实现代码
2012/08/17 Javascript
poshytip 基于jquery的 插件 主要用于显示微博人的图像和鼠标提示等
2012/10/12 Javascript
jquery清空textarea等输入框实现代码
2013/04/22 Javascript
js简单实现用户注册信息的校验代码
2013/11/15 Javascript
jquery实现效果比较好的table选中行颜色
2014/03/25 Javascript
jQuery插件jquery-barcode实现条码打印的方法
2015/11/25 Javascript
详解Javascript中prototype属性(推荐)
2016/09/03 Javascript
CodeMirror js代码加亮使用总结
2017/03/25 Javascript
VUE多层路由嵌套实现代码
2017/05/15 Javascript
微信小程序动态添加分享数据
2017/06/14 Javascript
解决Nodejs全局安装模块后找不到命令的问题
2018/05/15 NodeJs
vue中组件的过渡动画及实现代码
2018/11/21 Javascript
Vue匿名插槽与作用域插槽的合并和覆盖行为
2019/04/22 Javascript
Vue包大小优化的实现(从1.72M到94K)
2021/02/18 Vue.js
[03:02]生活中的Dendi之野外度假篇
2016/08/09 DOTA
[01:06:25]Secret vs Liquid 2018国际邀请赛淘汰赛BO3 第一场 8.25
2018/08/29 DOTA
跟老齐学Python之赋值,简单也不简单
2014/09/24 Python
零基础写python爬虫之抓取百度贴吧代码分享
2014/11/06 Python
Python open()文件处理使用介绍
2014/11/30 Python
Python按行读取文件的简单实现方法
2016/06/22 Python
python2 与python3的print区别小结
2018/01/16 Python
浅谈Pandas:Series和DataFrame间的算术元素
2018/12/22 Python
详解python中的time和datetime的常用方法
2019/07/08 Python
Python 一键获取百度网盘提取码的方法
2019/08/01 Python
Python基于Tkinter编写crc校验工具
2020/05/06 Python
Django在Model保存前记录日志实例
2020/05/14 Python
节约电力资源的建议书
2014/03/12 职场文书
圣诞晚会主持词开场白
2015/05/28 职场文书
党支部综合考察意见
2015/06/01 职场文书
未婚证明范本
2015/06/15 职场文书