Python不规范的日期字符串处理类


Posted in Python onJune 10, 2014

我分析了形如19920203、199203、1992.02.03、1992.02、1992-02-03、1992-02、920203时间格式特征,列出了正则表达式如下:

^((?:19|20)?\d{2})[-.]?((?:[0-1]?|1)[0-9])[-.]?((?:[0-3]?|[1-3])[0-9])?$

当然这个表达式还不是很完善,只能做简单的切割,不能判断日期的合法性,关于日期是否合法,我还是交给Python的时间功能来处理吧。

根据上面的正则表达式,我写的DateParser类如下:

import re
import datetime# ***************************************************
# *
# * Description: 非标准的日期字符串处理
# * Author: wangye  <pcn88 at hotmail dot com>
# *
# ***************************************************
class DateParser(object):
    def __init__(self):
        self.pattern = re.compile(
        r'^((?:19|20)?\d{2})[-.]?((?:[0-1]?|1)[0-9])[-.]?((?:[0-3]?|[1-3])[0-9])?$'
        )
    def __cutDate(self, date, flags):
        y = date.year
        m = date.month if flags[1] else 1
        d = date.day if flags[2] else 1
        return datetime.date(y, m, d)
    def __mergeFlags(self, flags1, flags2):
        l = []
        length = min(len(flags1), len(flags2))
        for i in range(0, length):
            if flags1[i] and flags2[i]:
                l.append(True)
            else:
                l.append(False)
        return l
    def parse(self, strdate):
        """
        描述:时间解析方法。
        参数:strdate 要分析的时间字符串,比如目标时间类型datetime(1992, 2, 3)
              可以被解析的是下述字符串之一:
            19920203 
            199203
            1992.02.03
            1992.02
            1992-02-03
            1992-02
            920203
        返回值:
            如果成功
            元组(datetime, flags),其中datetime表示转换完成的合法时间,
        flags是标志位,表示有效位数,比如199202实际转换了年和月,日没有,
        但是本函数将默认返回1日,但是flags将表示为(True, True, False),
        前面两个True分别表示年和月被转换,最后一个False表示日没有被转换。
            如果失败
            返回None。
        """
        m = self.pattern.match(strdate)
        flags = [False, False, False]
        if m:
            matches = list(m.groups())
            flags = list(map(lambda x:True if x!=None else False, matches))
            results = list(map(lambda x:int(x) if x!=None else 1, matches))
            # results = list(map(lambda x:1 if x==None else x, results))
            if results[0]<100:
                if results[0]>9:
                    results[0] += 1900
                else:
                    results[0] += 2000
            return (datetime.date(results[0], results[1], results[2]), flags)
        else:
            return None
    def convert(self, strdate, format):
        """
        描述:转换日期为指定格式。
        参数:strdate 同parse方法的strdate参数。
              format Python时间格式标识,同datetime.date.strftime格式化标识。
        返回值:
            如果成功,返回指定format格式的时间字符串。
            如果失败,返回None。
        """
        date = self.parse(strdate)
        if date:
            date = date[0]
            return datetime.date.strftime(date, format)
        else:
            return None
    def compare(self, strdate1, strdate2):
        """
        描述:比较两个日期。
        参数:strdate1 和 strdate2 同parse方法的strdate参数
        返回值:
            可以是下列值之一
            -4  strdate1 无效,  strdate2 有效
            -3  strdate1 有效,  strdate2 无效
            -2  strdate1 和 strdate2 无效
            -1  strdate1 < strdate2
             0  strdate1 = strdate2
             1  strdate1 > strdate2
        """
        date1,flags1 = self.parse(strdate1)
        date2,flags2 = self.parse(strdate2)
        if date1 == None and date2 != None:
            return -4
        if date1 != None and date2 == None:
            return -3
        elif date1 == None and date2 == None:
            return -2
        flags = self.__mergeFlags(flags1, flags2)
        date1 = self.__cutDate(date1, flags)
        date2 = self.__cutDate(date2, flags)
        if date1>date2:
            return 1
        elif date1<date2:
            return -1
        else:
            return 0

下面举几个例子供大家参考:

>>> DateParser().parse("19860126")
(datetime.date(1986, 1, 26), [True, True, True])
>>> DateParser().parse("199111")
(datetime.date(1991, 11, 1), [True, True, False])
>>> DateParser().parse("1991")
(datetime.date(1919, 9, 1), [True, True, True])
>>> DateParser().parse("8511")
(datetime.date(1985, 11, 1), [True, True, False])
>>> DateParser().convert("19911101", "%Y * %m * %d")
'1991 * 11 * 01'
>>> DateParser().convert("1990.1.01", "%Y.%m.%d")
'1990.01.01'
>>> DateParser().compare("1992.2", "19922")
0
>>> DateParser().compare("1992.2", "1956.03.1")
1
Python 相关文章推荐
使用python检测主机存活端口及检查存活主机
Oct 12 Python
利用Python实现图书超期提醒
Aug 02 Python
python记录程序运行时间的三种方法
Jul 14 Python
用python统计代码行的示例(包括空行和注释)
Jul 24 Python
tensorflow 打印内存中的变量方法
Jul 30 Python
Django 接收Post请求数据,并保存到数据库的实现方法
Jul 12 Python
python中count函数简单的实例讲解
Feb 06 Python
python实现将range()函数生成的数字存储在一个列表中
Apr 02 Python
基于TensorFlow的CNN实现Mnist手写数字识别
Jun 17 Python
Django多个app urls配置代码实例
Nov 26 Python
python空元组在all中返回结果详解
Dec 15 Python
解决pytorch 的state_dict()拷贝问题
Mar 03 Python
Python ORM框架SQLAlchemy学习笔记之数据查询实例
Jun 10 #Python
Python ORM框架SQLAlchemy学习笔记之数据添加和事务回滚介绍
Jun 10 #Python
Python ORM框架SQLAlchemy学习笔记之映射类使用实例和Session会话介绍
Jun 10 #Python
Python ORM框架SQLAlchemy学习笔记之关系映射实例
Jun 10 #Python
Python ORM框架SQLAlchemy学习笔记之安装和简单查询实例
Jun 10 #Python
Python使用htpasswd实现基本认证授权的例子
Jun 10 #Python
python网络编程学习笔记(10):webpy框架
Jun 09 #Python
You might like
php下将多个数组合并成一个数组的方法与实例代码
2011/02/03 PHP
php列出一个目录下的所有文件的代码
2012/10/09 PHP
PHP使用ffmpeg给视频增加字幕显示的方法
2015/03/12 PHP
PHP Oauth授权和本地加密实现方法
2016/08/12 PHP
PHP Post获取不到非表单数据的问题解决办法
2018/02/27 PHP
JQuery与Ajax常用代码实现对比
2009/10/03 Javascript
javascript实现可改变滚动方向的无缝滚动实例
2013/06/17 Javascript
jquery实现表格隔行换色效果
2015/11/19 Javascript
JS图片左右无缝隙滚动的实现(兼容IE,Firefox 遵循W3C标准)
2016/09/23 Javascript
详解js中call与apply关键字的作用
2016/11/21 Javascript
微信小程序 swiper制作tab切换实现附源码
2017/01/21 Javascript
jQuery DateTimePicker 日期和时间插件示例
2017/01/22 Javascript
JS基于面向对象实现的多个倒计时器功能示例
2017/02/28 Javascript
jQuery+PHP+Mysql实现抽奖程序
2020/04/12 jQuery
Vue.js实现微信过渡动画左右切换效果
2017/06/13 Javascript
基于Vue实例对象的数据选项
2017/08/09 Javascript
Vue实现typeahead组件功能(非常靠谱)
2017/08/26 Javascript
JS实现中英文混合文字溢出友好截取功能
2018/08/06 Javascript
解决Vue-cli npm run build生产环境打包,本地不能打开的问题
2018/09/20 Javascript
Vue列表渲染的示例代码
2018/11/01 Javascript
python实现批量修改文件名代码
2017/09/10 Python
详解python3中的真值测试
2018/08/13 Python
Django压缩静态文件的实现方法详析
2018/08/26 Python
使用python根据端口号关闭进程的方法
2018/11/06 Python
Python中遍历列表的方法总结
2019/06/27 Python
10款最好的Python开发编辑器
2019/07/03 Python
利用python实现AR教程
2019/11/20 Python
python中68个内置函数的总结与介绍
2020/02/24 Python
俄罗斯香水和化妆品网上商店:NOTINO.ru
2019/12/17 全球购物
房地产项目策划书
2014/02/05 职场文书
2014世界杯球队球队口号
2014/06/05 职场文书
商场周年庆活动方案
2014/08/19 职场文书
2014年语文教师工作总结
2014/12/18 职场文书
布达拉宫导游词
2015/02/02 职场文书
股东大会通知
2015/04/24 职场文书
win10电脑双屏显示一个黑屏怎么办?win10电脑双屏显示一个黑屏解决方法
2022/07/15 数码科技