python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python操作ie登陆土豆网的方法
May 09 Python
Django中使用locals()函数的技巧
Jul 16 Python
python实现音乐下载器
Apr 15 Python
对python3 Serial 串口助手的接收读取数据方法详解
Jun 12 Python
pandas删除行删除列增加行增加列的实现
Jul 06 Python
Tensorflow的常用矩阵生成方式
Jan 04 Python
Python GUI自动化实现绕过验证码登录
Jan 10 Python
Python函数默认参数常见问题及解决方案
Mar 26 Python
matplotlib grid()设置网格线外观的实现
Feb 22 Python
解决python 输出到csv 出现多空行的情况
Mar 24 Python
python爬虫之selenium库的安装及使用教程
May 23 Python
如何正确理解python装饰器
Jun 15 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
PHP 数字左侧自动补0
2008/03/31 PHP
php中设置多级目录session的问题
2011/08/08 PHP
php中使用Curl、socket、file_get_contents三种方法POST提交数据
2011/08/12 PHP
PHP制作百度词典查词采集器
2015/01/29 PHP
yii2.0实现pathinfo的形式访问的配置方法
2016/04/06 PHP
支付宝服务窗API接口开发php版本
2016/07/20 PHP
PHP的new static和new self的区别与使用
2019/11/27 PHP
新手入门常用代码集锦
2007/01/11 Javascript
基于jquery的inputlimiter 实现字数限制功能
2010/05/30 Javascript
jquery.validate 自定义验证方法及validate相关参数
2016/01/18 Javascript
基于JavaScript实现智能右键菜单
2016/03/02 Javascript
JavaScript用JSONP跨域请求数据实例详解
2017/01/06 Javascript
Webpack打包慢问题的完美解决方法
2017/03/16 Javascript
JavaScript操作文件_动力节点Java学院整理
2017/06/30 Javascript
JS获取子、父、兄节点方法小结
2017/08/14 Javascript
koa2实现登录注册功能的示例代码
2018/12/03 Javascript
ZK中使用JS读取客户端txt文件内容问题
2019/11/07 Javascript
element-ui中按需引入的实现
2019/12/25 Javascript
[01:02:54]完美世界DOTA2联赛PWL S2 FTD vs GXR 第一场 11.22
2020/11/26 DOTA
Python实现的数据结构与算法之链表详解
2015/04/22 Python
python检测是文件还是目录的方法
2015/07/03 Python
Python字符串、整数、和浮点型数相互转换实例
2018/08/04 Python
使用EduBlock轻松学习Python编程
2018/10/08 Python
Python+selenium 获取浏览器窗口坐标、句柄的方法
2018/10/14 Python
基于Python+Appium实现京东双十一自动领金币功能
2019/10/31 Python
Pytorch学习之torch用法----比较操作(Comparison Ops)
2020/06/28 Python
Python用requests库爬取返回为空的解决办法
2021/02/21 Python
澳大利亚旅游网站:Lastminute
2017/08/07 全球购物
英国儿童设计师服装和玩具购物网站:Zac & Lulu
2020/10/19 全球购物
考试没考好检讨书
2014/01/31 职场文书
《乌鸦和狐狸》教学反思
2014/02/08 职场文书
团购业务员岗位职责
2014/03/15 职场文书
党员承诺践诺书
2014/05/20 职场文书
党员群众路线承诺书
2014/05/20 职场文书
军训决心书范文
2015/09/22 职场文书
Redis的字符串是如何实现的
2021/10/24 Redis