python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python进阶篇之字典操作总结
Nov 16 Python
Python基础之条件控制操作示例【if语句】
Mar 23 Python
Python图像处理PIL各模块详细介绍(推荐)
Jul 17 Python
OpenCV3.0+Python3.6实现特定颜色的物体追踪
Jul 23 Python
python可视化篇之流式数据监控的实现
Aug 07 Python
简单的Python调度器Schedule详解
Aug 30 Python
tensorflow tf.train.batch之数据批量读取方式
Jan 20 Python
Python3 filecmp模块测试比较文件原理解析
Mar 23 Python
Python中常见的数制转换有哪些
May 27 Python
pytorch 移动端部署之helloworld的使用
Oct 30 Python
给numpy.array增加维度的超简单方法
Jun 02 Python
python实现对doc、txt、xls等文档的读写操作
Apr 02 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
Syphon 虹吸式咖啡壶冲煮–拨动法
2021/03/03 冲泡冲煮
PHP insert语法详解
2008/06/07 PHP
PHP伪造referer实例代码
2008/09/20 PHP
PHP数组及条件,循环语句学习
2012/11/11 PHP
利用PHP扩展vld查看PHP opcode操作步骤
2013/03/04 PHP
php静态文件返回304技巧分享
2015/01/06 PHP
php+ajax制作无刷新留言板
2015/10/27 PHP
php查询操作实现投票功能
2016/05/09 PHP
lnmp安装多版本PHP共存的方法详解
2018/08/02 PHP
JS无限树状列表实现代码
2011/01/11 Javascript
Prototype源码浅析 Number部分
2012/01/16 Javascript
jQuery之按钮组件的深入解析
2013/06/19 Javascript
jquery中html、val与text三者属性取值的联系与区别介绍
2013/12/29 Javascript
Jquery网页内滑动缓冲导航的实现代码
2015/04/05 Javascript
jQuery常用的一些技巧汇总
2016/03/26 Javascript
js基础之DOM中元素对象的属性方法详解
2016/10/28 Javascript
javascript深拷贝和浅拷贝详解
2017/02/14 Javascript
Bootstrap如何激活导航状态
2017/03/22 Javascript
微信小程序实现移动端滑动分页效果(ajax)
2017/06/13 Javascript
利用Node.js批量抓取高清妹子图片实例教程
2018/08/02 Javascript
vue 微信扫码登录(自定义样式)
2020/01/06 Javascript
vant中的toast层级改变操作
2020/11/04 Javascript
[01:03]DOTA2新的征程 你的脚印值得踏上
2014/08/13 DOTA
Python创建日历实例
2014/08/21 Python
Python Web框架Flask中使用百度云存储BCS实例
2015/02/08 Python
Python操作Access数据库基本步骤分析
2016/09/19 Python
python 性能优化方法小结
2017/03/31 Python
python中的print()输出
2019/04/12 Python
Python实现Appium端口检测与释放的实现
2020/12/31 Python
CSS3 中的@keyframes介绍
2014/09/02 HTML / CSS
HTML5自定义属性的问题分析
2019/08/16 HTML / CSS
出门问问全球官方商城:Tichome音箱和TicWatch智能手表
2017/12/02 全球购物
英国最受信任的在线眼镜商之一:Fashion Eyewear
2019/10/31 全球购物
面试后的感谢信范文
2014/02/01 职场文书
党支部遵守党的政治纪律情况对照检查材料
2014/09/26 职场文书
《蓝鲸的眼睛》读后感5篇
2020/01/15 职场文书