python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python海龟绘图实例教程
Jul 24 Python
Python中关于字符串对象的一些基础知识
Apr 08 Python
使用Python编写类UNIX系统的命令行工具的教程
Apr 15 Python
Python守护进程和脚本单例运行详解
Jan 06 Python
详解Python3中字符串中的数字提取方法
Jan 14 Python
python实现批量解析邮件并下载附件
Jun 19 Python
python3爬虫怎样构建请求header
Dec 23 Python
pycharm+PyQt5+python最新开发环境配置(踩坑)
Feb 11 Python
Flask框架模板渲染操作简单示例
Jul 31 Python
使用python采集Excel表中某一格数据
May 14 Python
Selenium之模拟登录铁路12306的示例代码
Jul 31 Python
Python常用扩展插件使用教程解析
Nov 02 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
php实现的短网址算法分享
2014/06/20 PHP
laravel实现上传图片,并且制作缩略图,按照日期存放的代码
2019/10/16 PHP
jquery的$getjson调用并获取远程的JSON字符串问题
2012/12/10 Javascript
javascript-简单的日历实现及Date对象语法介绍(附图)
2013/05/30 Javascript
js中继承的几种用法总结(apply,call,prototype)
2013/12/26 Javascript
用js设置下拉框为只读的小技巧
2014/04/10 Javascript
jQuery中:last-child选择器用法实例
2014/12/31 Javascript
JavaScript中document.forms[0]与getElementByName区别
2015/01/21 Javascript
jQuery仿360导航页图标拖动排序效果代码分享
2015/08/24 Javascript
纯javascript实现自动发送邮件
2015/10/21 Javascript
php输出全部gb2312编码内的汉字方法
2017/03/04 Javascript
详解JavaScript调用栈、尾递归和手动优化
2017/06/03 Javascript
详解webpack之scss和postcss-loader的配置
2018/01/09 Javascript
Vue项目全局配置微信分享思路详解
2018/05/04 Javascript
js使用ajax传值给后台,后台返回字符串处理方法
2018/08/08 Javascript
详解Vue CLI3配置解析之css.extract
2018/09/14 Javascript
vue项目使用axios发送请求让ajax请求头部携带cookie的方法
2018/09/26 Javascript
JS实现获取数组中最大值或最小值功能示例
2019/03/02 Javascript
vue改变对象或数组时的刷新机制的方法总结
2019/04/24 Javascript
对TypeScript库进行单元测试的方法
2019/07/18 Javascript
vue-cli在 history模式下的配置详解
2019/11/26 Javascript
vue中监听路由参数的变化及方法
2019/12/06 Javascript
详解Vue的ref特性的使用
2020/01/24 Javascript
使用webpack5从0到1搭建一个react项目的实现步骤
2020/12/16 Javascript
[43:53]OG vs EG 2019国际邀请赛淘汰赛 胜者组 BO3 第三场 8.22
2019/09/05 DOTA
Pythony运维入门之Socket网络编程详解
2019/04/15 Python
Pytorch加载部分预训练模型的参数实例
2019/08/18 Python
如何基于pandas读取csv后合并两个股票
2020/09/25 Python
PyCharm2019.3永久激活破解详细图文教程,亲测可用(不定期更新)
2020/10/29 Python
希尔顿酒店中国网站:Hilton中国
2017/03/11 全球购物
岗位职责的构建方法
2014/02/01 职场文书
超市仓管员岗位职责
2014/04/07 职场文书
《桃林那间小木屋》教学反思
2014/05/01 职场文书
县委务虚会发言材料
2014/10/20 职场文书
学校德育工作总结2015
2015/05/11 职场文书
你真的了解PHP中的引用符号(&)吗
2021/05/12 PHP