python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python多线程同步Lock、RLock、Semaphore、Event实例
Nov 21 Python
结合Python的SimpleHTTPServer源码来解析socket通信
Jun 27 Python
Python使用pyh生成HTML文档的方法示例
Mar 10 Python
Python paramiko模块的使用示例
Apr 11 Python
Python 通配符删除文件的实例
Apr 24 Python
python pandas读取csv后,获取列标签的方法
Nov 12 Python
Python面向对象程序设计OOP深入分析【构造函数,组合类,工具类等】
Jan 05 Python
使用Python实现毫秒级抢单功能
Jun 06 Python
Python如何使用turtle库绘制图形
Feb 26 Python
解决python使用list()时总是报错的问题
May 05 Python
Python全局变量与global关键字常见错误解决方案
Oct 05 Python
pytorch DataLoader的num_workers参数与设置大小详解
May 28 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
日本收入最高的漫画家:海贼王作者版税年收入高达8.45亿元
2020/03/04 日漫
基于mysql的bbs设计(四)
2006/10/09 PHP
mysql 的 like 问题,超强毕杀记!!!
2007/01/18 PHP
WebQQ最新登陆协议的用法
2014/12/22 PHP
Prototype使用指南之selector.js说明
2008/10/26 Javascript
javascript 仿QQ滑动菜单效果代码
2010/09/03 Javascript
Javascript设计模式理论与编程实战之简单工厂模式
2015/11/03 Javascript
JavaScript条件判断_动力节点Java学院整理
2017/06/26 Javascript
vue组件初学_弹射小球(实例讲解)
2017/09/06 Javascript
js指定日期增加指定月份的实现方法
2018/12/19 Javascript
微信小程序如何刷新当前界面的实现方法
2019/06/07 Javascript
小程序input数据双向绑定实现方法
2019/10/17 Javascript
js实现登录拖拽窗口
2020/02/10 Javascript
VUE table表格动态添加一列数据,新增的这些数据不可以编辑(v-model绑定的数据不能实时更新)
2020/04/03 Javascript
js观察者模式的弹幕案例
2020/11/23 Javascript
基于Python List的赋值方法
2018/06/23 Python
利用django-suit模板添加自定义的菜单、页面及设置访问权限
2018/07/13 Python
python2和python3的输入和输出区别介绍
2018/11/20 Python
python脚本当作Linux中的服务启动实现方法
2019/06/28 Python
详解Python图像处理库Pillow常用使用方法
2019/09/02 Python
探秘TensorFlow 和 NumPy 的 Broadcasting 机制
2020/03/13 Python
Python figure参数及subplot子图绘制代码
2020/04/18 Python
Python全局变量与global关键字常见错误解决方案
2020/10/05 Python
使用python tkinter开发一个爬取B站直播弹幕工具的实现代码
2021/02/07 Python
英国人最爱的饰品网站:Accessorize
2016/08/22 全球购物
美国快时尚彩妆品牌:Winky Lux(透明花瓣润唇膏)
2018/11/06 全球购物
北京华建集团SQL面试题
2014/06/03 面试题
几个Linux面试题笔试题
2012/12/01 面试题
《李广射虎》教学反思
2014/04/27 职场文书
励志广播稿300字(5篇)
2014/09/15 职场文书
交通事故协议书范本
2014/11/18 职场文书
学生检讨书范文
2015/01/27 职场文书
长城英文导游词
2015/01/30 职场文书
面试通知邮件
2015/04/20 职场文书
2015年度女工工作总结
2015/10/22 职场文书
Go语言设计模式之结构型模式
2021/06/22 Golang