python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python字符串处理函数简明总结
Apr 13 Python
Django自定义分页效果
Jun 27 Python
Python简单计算给定某一年的某一天是星期几示例
Jun 27 Python
PyCharm配置mongo插件的方法
Nov 30 Python
深入理解Python异常处理的哲学
Feb 01 Python
Python开启线程,在函数中开线程的实例
Feb 22 Python
python集合常见运算案例解析
Oct 17 Python
Python3中的f-Strings增强版字符串格式化方法
Mar 04 Python
python 安装库几种方法之cmd,anaconda,pycharm详解
Apr 08 Python
学python爬虫能做什么
Jul 29 Python
Python爬虫新手入门之初学lxml库
Dec 20 Python
Python趣味挑战之教你用pygame画进度条
May 31 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
PHP如何抛出异常处理错误
2011/03/02 PHP
PHP函数引用返回的实例详解
2016/09/11 PHP
XP折叠菜单&仿QQ2006菜单
2006/12/16 Javascript
JavaScript 异步调用框架 (Part 3 - 代码实现)
2009/08/04 Javascript
jquery checkbox,radio是否选中的判断代码
2010/03/20 Javascript
基于jQuery的可以控制左右滚动及自动滚动效果的代码
2010/07/25 Javascript
由浅入深讲解Javascript继承机制与simple-inheritance源码分析
2015/12/13 Javascript
javascript的 {} 语句块详解
2016/02/27 Javascript
javascript运算符语法全面概述
2016/07/14 Javascript
浅谈js中字符和数组一些基本算法题
2016/08/15 Javascript
前端程序员必须知道的高性能Javascript知识
2016/08/24 Javascript
node.js请求HTTPS报错:UNABLE_TO_VERIFY_LEAF_SIGNATURE\的解决方法
2016/12/18 Javascript
详解vue2.0 transition 多个元素嵌套使用过渡
2017/06/19 Javascript
JS实现给json数组动态赋值的方法示例
2020/03/19 Javascript
php register_shutdown_function函数详解
2017/07/23 Javascript
vue2.0 axios跨域并渲染的问题解决方法
2018/03/08 Javascript
Vue脚手架的简单使用实例
2018/07/10 Javascript
vue-swiper的使用教程
2018/08/30 Javascript
Angular2之二级路由详解
2018/08/31 Javascript
JS中使用cavas截图网页并解决跨域及模糊问题
2018/11/13 Javascript
Nginx设置为Node.js的前端服务器方法总结
2019/03/27 Javascript
js 递归json树实现根据子id查父id的方法分析
2019/11/08 Javascript
ES6使用新特性Proxy实现的数据绑定功能实例
2020/05/11 Javascript
Python+OpenCV+图片旋转并用原底色填充新四角的例子
2019/12/12 Python
Pytorch之parameters的使用
2019/12/31 Python
Python图像读写方法对比
2020/11/16 Python
pandas apply使用多列计算生成新的列实现示例
2021/02/24 Python
德国运动营养和健身网上商店:Myprotein.de
2018/07/18 全球购物
程序员跳槽必看面试题总结
2013/06/28 面试题
通信工程毕业生自荐信
2013/11/01 职场文书
专业幼师实习生自我鉴定范文
2013/12/08 职场文书
我的中国梦演讲稿高中篇
2014/08/19 职场文书
群众路线教育实践活动个人对照检查材料思想汇报(社区班子)
2014/10/06 职场文书
使用feign服务调用添加Header参数
2021/06/23 Java/Android
Vue3如何理解ref toRef和toRefs的区别
2022/02/18 Vue.js
从零开始在Centos7上部署SpringBoot项目
2022/04/07 Servers