编程 Python

python使用pandas抽样训练数据中某个类别实例

Posted in Python onFebruary 28, 2020

废话真的一句也不想多说，直接看代码吧！

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展：pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

python使用pandas抽样训练数据中某个类别实例

- Author -

Yan456jie

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python字符串处理函数简明总结

Apr 13 Python

Django自定义分页效果

Jun 27 Python

Python简单计算给定某一年的某一天是星期几示例

Jun 27 Python

PyCharm配置mongo插件的方法

Nov 30 Python

深入理解Python异常处理的哲学

Feb 01 Python

Python开启线程,在函数中开线程的实例

Feb 22 Python

python集合常见运算案例解析

Oct 17 Python

Python3中的f-Strings增强版字符串格式化方法

Mar 04 Python

python 安装库几种方法之cmd,anaconda,pycharm详解

Apr 08 Python

学python爬虫能做什么

Jul 29 Python

Python爬虫新手入门之初学lxml库

Dec 20 Python

Python趣味挑战之教你用pygame画进度条

May 31 Python

如何使用repr调试python程序

Feb 28 #Python

Python编程快速上手——Excel到CSV的转换程序案例分析

Feb 28 #Python

python对文件的操作方法汇总

Feb 28 #Python

最新2019Pycharm安装教程亲测

Feb 28 #Python

Python发送手机动态验证码代码实例

Feb 28 #Python

Python 开发工具PyCharm安装教程图文详解(新手必看)

Feb 28 #Python

Python3使用xlrd、xlwt处理Excel方法数据

Feb 28 #Python

You might like

PHP如何抛出异常处理错误

2011/03/02 PHP

PHP函数引用返回的实例详解

2016/09/11 PHP

XP折叠菜单&仿QQ2006菜单

2006/12/16 Javascript

JavaScript 异步调用框架 (Part 3 - 代码实现)

2009/08/04 Javascript

jquery checkbox,radio是否选中的判断代码

2010/03/20 Javascript

基于jQuery的可以控制左右滚动及自动滚动效果的代码

2010/07/25 Javascript

由浅入深讲解Javascript继承机制与simple-inheritance源码分析

2015/12/13 Javascript

javascript的 {} 语句块详解

2016/02/27 Javascript

javascript运算符语法全面概述

2016/07/14 Javascript

浅谈js中字符和数组一些基本算法题

2016/08/15 Javascript

前端程序员必须知道的高性能Javascript知识

2016/08/24 Javascript

node.js请求HTTPS报错：UNABLE_TO_VERIFY_LEAF_SIGNATURE\的解决方法

2016/12/18 Javascript

详解vue2.0 transition 多个元素嵌套使用过渡

2017/06/19 Javascript

JS实现给json数组动态赋值的方法示例

2020/03/19 Javascript

php register_shutdown_function函数详解

2017/07/23 Javascript

vue2.0 axios跨域并渲染的问题解决方法

2018/03/08 Javascript

Vue脚手架的简单使用实例

2018/07/10 Javascript

vue-swiper的使用教程

2018/08/30 Javascript

Angular2之二级路由详解

2018/08/31 Javascript

JS中使用cavas截图网页并解决跨域及模糊问题

2018/11/13 Javascript

Nginx设置为Node.js的前端服务器方法总结

2019/03/27 Javascript

js 递归json树实现根据子id查父id的方法分析

2019/11/08 Javascript

ES6使用新特性Proxy实现的数据绑定功能实例

2020/05/11 Javascript

Python+OpenCV+图片旋转并用原底色填充新四角的例子

2019/12/12 Python

Pytorch之parameters的使用

2019/12/31 Python

Python图像读写方法对比

2020/11/16 Python

pandas apply使用多列计算生成新的列实现示例

2021/02/24 Python

德国运动营养和健身网上商店：Myprotein.de

2018/07/18 全球购物

程序员跳槽必看面试题总结

2013/06/28 面试题

通信工程毕业生自荐信

2013/11/01 职场文书

专业幼师实习生自我鉴定范文

2013/12/08 职场文书

我的中国梦演讲稿高中篇

2014/08/19 职场文书

群众路线教育实践活动个人对照检查材料思想汇报（社区班子）

2014/10/06 职场文书

使用feign服务调用添加Header参数

2021/06/23 Java/Android

Vue3如何理解ref toRef和toRefs的区别

2022/02/18 Vue.js

从零开始在Centos7上部署SpringBoot项目

2022/04/07 Servers