在Python dataframe中出生日期转化为年龄的实现方法


Posted in Python onOctober 20, 2018

我们在做数据挖掘项目或大数据竞赛时,如果个体是人的时候,获得的数据中可能有出生日期的Series,举个简单例子,比如这样的一些数:

# -*- coding: utf-8 -*-
import pandas as pd
from pandas import Series, DataFrame
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt %matplotlib inline
data = {'birth': ['10/8/00', '7/21/93', '6/14/01', '5/18/99', '1/5/98']}
frame = DataFrame(data)
frame

在Python dataframe中出生日期转化为年龄的实现方法

从数据来看,'10/8/00'之类的数,最左边的数表示月份,中间的数表示日,最后的数表示年度。

实际上我们在分析时并不需要人的出生日期,而是需要年龄,不同的年龄阶段会有不同的状态,比如收入、健康、居住条件等等,且能够很好地把不同样本的差异性进行大范围的划分,而不是像出生日期那样包含信息量过大且在算法训练时不好作为有效数据进行训练,age是一个很好地特征工程指示变量。

那如何把上述birth数据变为年龄age呢?

在这里用到datetime这个库,如下:

(1)首先把birth转化为标准时间格式

frame['birth'] = pd.to_datetime(frame['birth'])
frame

在Python dataframe中出生日期转化为年龄的实现方法 

(2)获取当前时间的年份,并减去birth的年份

import datetime as dt
now_year =dt.datetime.today().year #当前的年份
frame['age']=now_year-frame.birth.dt.year
frame

在这里使用了dt.datetime.today().year来获取当前日期的年份,然后将birth数据中的年份数据提取出来(frame.birth.dt.year),两者相减就得到需要的年龄数据,如下:

在Python dataframe中出生日期转化为年龄的实现方法

有时候我们可能还会关注到人的出生月份与要预测变量的关系,比如人的星座就是很流行的一种以出生月份、日份来评估其对人的影响,也可以按这种方法去提取月、日数据。

总结

以上所述是小编给大家介绍的在Python dataframe中出生日期转化为年龄的实现方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python 执行字符串表达式函数(eval exec execfile)
Aug 11 Python
Python 专题四 文件基础知识
Mar 20 Python
python使用tensorflow保存、加载和使用模型的方法
Jan 31 Python
pandas 按照特定顺序输出的实现代码
Jul 10 Python
详解Python中pandas的安装操作说明(傻瓜版)
Apr 08 Python
Python微信操控itchat的方法
May 31 Python
python多线程同步实例教程
Aug 11 Python
Python内置类型性能分析过程实例
Jan 29 Python
python爬虫开发之使用python爬虫库requests,urllib与今日头条搜索功能爬取搜索内容实例
Mar 10 Python
Spring @Enable模块驱动原理及使用实例
Jun 23 Python
Python中相见恨晚的技巧
Apr 13 Python
Python识别花卉种类鉴定网络热门植物并自动整理分类
Apr 08 Python
Django中的ajax请求
Oct 19 #Python
Tesserocr库的正确安装方式
Oct 19 #Python
Python中Proxypool库的安装与配置
Oct 19 #Python
在cmder下安装ipython以及环境的搭建
Oct 19 #Python
破解安装Pycharm的方法
Oct 19 #Python
使用Selenium破解新浪微博的四宫格验证码
Oct 19 #Python
Selenium的使用详解
Oct 19 #Python
You might like
JoshChen_php新手进阶高手不可或缺的规范介绍
2013/08/16 PHP
CI框架自动加载session出现报错的解决办法
2014/06/17 PHP
PHP实现文件下载详解
2014/11/27 PHP
php截取中文字符串函数实例
2015/02/23 PHP
php封装的smarty类完整实例
2016/10/19 PHP
PHP通过bypass disable functions执行系统命令的方法汇总
2018/05/02 PHP
PHP排序二叉树基本功能实现方法示例
2018/05/26 PHP
PHP验证类的封装与使用方法详解
2019/01/10 PHP
php设计模式之备忘模式分析【星际争霸游戏案例】
2020/03/24 PHP
用JS控制回车事件的代码
2011/02/20 Javascript
JavaScript实现拼音排序的方法
2012/11/20 Javascript
使用iframe window的scroll方法控制iframe页面滚动
2014/03/05 Javascript
javascript判断是否按回车键并解决浏览器之间的差异
2014/05/13 Javascript
浅谈javascript对象模型和function对象
2014/12/26 Javascript
JavaScript使用shift方法移除素组第一个元素实例分析
2015/04/06 Javascript
详解webpack 如何集成第三方js库
2017/06/29 Javascript
Python中使用摄像头实现简单的延时摄影技术
2015/03/27 Python
python提取页面内url列表的方法
2015/05/25 Python
Python入门学习之字符串与比较运算符
2015/10/12 Python
python通过配置文件共享全局变量的实例
2019/01/11 Python
pip安装python库的方法总结
2019/08/02 Python
PyQt5中向单元格添加控件的方法示例
2020/03/24 Python
CSS3中利用animation属性创建雪花飘落特效
2014/05/14 HTML / CSS
用css3写出气球样式的示例代码
2017/09/11 HTML / CSS
html5文字阴影效果text-shadow使用示例
2013/07/25 HTML / CSS
最新英语专业学生求职信范文
2013/09/21 职场文书
毕业生自我推荐
2013/11/04 职场文书
一份婚庆公司创业计划书
2014/01/11 职场文书
科长竞聘演讲稿
2014/05/16 职场文书
民族精神月活动总结
2014/08/28 职场文书
2014年派出所工作总结
2014/11/21 职场文书
2016公务员年度考核评语
2015/12/01 职场文书
妇联2016年六一国际儿童节活动总结
2016/04/06 职场文书
创业计划书之服装
2019/10/07 职场文书
Pytorch中的数据集划分&正则化方法
2021/05/27 Python
使用CSS定位HTML元素的实现方法
2022/07/07 HTML / CSS