python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现抓取页面上链接的简单爬虫分享
Jan 21 Python
使用Nginx+uWsgi实现Python的Django框架站点动静分离
Mar 21 Python
利用Python2下载单张图片与爬取网页图片实例代码
Dec 25 Python
python 获取指定文件夹下所有文件名称并写入列表的实例
Apr 23 Python
详解利用django中间件django.middleware.csrf.CsrfViewMiddleware防止csrf攻击
Oct 09 Python
python matplotlib 画dataframe的时间序列图实例
Nov 20 Python
python队列原理及实现方法示例
Nov 27 Python
Python greenlet和gevent使用代码示例解析
Apr 01 Python
大数据分析用java还是Python
Jul 06 Python
Python预测2020高考分数和录取情况
Jul 08 Python
Pycharm中如何关掉python console
Oct 27 Python
python通配符之glob模块的使用详解
Apr 24 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
PHP+DBM的同学录程序(3)
2006/10/09 PHP
php include,include_once,require,require_once
2008/09/05 PHP
用PHP查询搜索引擎排名位置的代码
2010/01/05 PHP
深入掌握include_once与require_once的区别
2013/06/17 PHP
PHP实现将浏览历史页面网址保存到cookie的方法
2015/01/26 PHP
Yii2使用dropdownlist实现地区三级联动功能的方法
2016/07/18 PHP
PHP实现的mysql主从数据库状态检测功能示例
2017/07/20 PHP
php ActiveMQ的安装与使用方法图文教程
2020/02/23 PHP
PhpStorm连接服务器并实现自动上传功能
2020/12/09 PHP
javascript学习笔记(二十) 获得和设置元素的特性(属性)
2012/06/20 Javascript
Jquery获取元素的父容器对象示例代码
2014/02/10 Javascript
jQuery中$.get、$.post、$.getJSON和$.ajax的用法详解
2014/11/19 Javascript
jQuery中extend函数的实现原理详解
2015/02/03 Javascript
javascript中sort() 方法使用详解
2015/08/30 Javascript
jQuery中animate()的使用方法及解决$(”body“).animate({“scrollTop”:top})不被Firefox支持的问题
2017/04/04 jQuery
Angular CLI在Angular项目中如何使用scss详解
2018/04/10 Javascript
VUE脚手架的下载和配置步骤详解
2019/04/01 Javascript
说说Vuex的getters属性的具体用法
2019/04/15 Javascript
微信小程序引入VANT组件的方法步骤
2019/09/19 Javascript
基于ts的动态接口数据配置的详解
2019/12/18 Javascript
Pyramid Mako模板引入helper对象的步骤方法
2013/11/27 Python
Python实现Kmeans聚类算法
2020/06/10 Python
python K近邻算法的kd树实现
2018/09/06 Python
对Python 窗体(tkinter)树状数据(Treeview)详解
2018/10/11 Python
Python3离线安装Requests模块问题
2019/10/13 Python
python3操作注册表的方法(Url protocol)
2020/02/05 Python
tensorflow 分类损失函数使用小记
2020/02/18 Python
python用opencv完成图像分割并进行目标物的提取
2020/05/25 Python
canvas绘图按照contain或者cover方式适配并居中显示
2019/02/18 HTML / CSS
水产养殖学应届生求职信
2013/09/29 职场文书
欢迎领导检查标语
2014/06/27 职场文书
公司授权委托书样本
2014/09/15 职场文书
2014年银行信贷员工作总结
2014/12/08 职场文书
考察邀请函范文
2015/01/31 职场文书
党员违纪检讨书
2015/05/05 职场文书
高二数学教学反思
2016/02/18 职场文书