python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之坑爹的字符编码
Sep 28 Python
Python2.6版本中实现字典推导 PEP 274(Dict Comprehensions)
Apr 28 Python
python用装饰器自动注册Tornado路由详解
Feb 14 Python
python利用有道翻译实现"语言翻译器"的功能实例
Nov 14 Python
selenium3+python3环境搭建教程图解
Dec 07 Python
python贪吃蛇游戏代码
Apr 18 Python
python文件绝对路径写法介绍(windows)
Dec 25 Python
python数据类型可变不可变知识点总结
Mar 06 Python
Python Tkinter实例——模拟掷骰子
Oct 24 Python
python实现猜拳游戏项目
Nov 30 Python
python中24小时制转换为12小时制的方法
Jun 18 Python
Python获取江苏疫情实时数据及爬虫分析
Aug 02 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
让你的WINDOWS同时支持MYSQL4,MYSQL4.1,MYSQL5X
2006/12/06 PHP
PHP+MYSQL会员系统的登陆即权限判断实现代码
2011/09/23 PHP
php使用memcoder将视频转成mp4格式的方法
2015/03/12 PHP
php获取从百度、谷歌等搜索引擎进入网站关键词的方法
2015/07/08 PHP
基于 Swoole 的微信扫码登录功能实现代码
2018/01/15 PHP
Laravel框架在本地虚拟机快速安装的方法详解
2018/06/11 PHP
php ActiveMQ的安装与使用方法图文教程
2020/02/23 PHP
PHP 范围解析操作符(::)用法分析【访问静态成员和类常量】
2020/04/14 PHP
Web 前端设计模式--Dom重构 提高显示性能
2010/10/22 Javascript
使用jQuery同时控制四张图片的伸缩实现代码
2013/04/19 Javascript
JavaScript中的关键字"VAR"使用详解 分享
2013/07/31 Javascript
jquery+html5制作超酷的圆盘时钟表
2015/04/14 Javascript
详解JavaScript的Polymer框架中的通知交互
2015/07/29 Javascript
ztree获取选中节点时不能进入可视区域出现BUG如何解决
2015/12/03 Javascript
jQuery simpleModal插件的使用介绍
2016/08/30 Javascript
Nodejs中解决cluster模块的多进程如何共享数据问题
2016/11/10 NodeJs
ES6新特性之字符串的扩展实例分析
2017/04/01 Javascript
使用Object.defineProperty如何巧妙找到修改某个变量的准确代码位置
2018/11/02 Javascript
js的继承方法小结(prototype、call、apply)(推荐)
2019/04/17 Javascript
python 根据正则表达式提取指定的内容实例详解
2016/12/04 Python
Python实现简单http服务器
2018/04/12 Python
python输出数组中指定元素的所有索引示例
2019/12/06 Python
Python Pandas list列表数据列拆分成多行的方法实现
2020/12/14 Python
Under Armour安德玛德国官网:美国高端运动科技品牌
2019/03/09 全球购物
解释i节点在文件系统中的作用
2013/11/26 面试题
高一自我鉴定
2013/12/17 职场文书
党员批评与自我批评
2014/02/12 职场文书
高中军训第一天感言
2014/03/06 职场文书
实用的简历自我评价
2014/03/06 职场文书
节约粮食标语
2014/06/18 职场文书
2015年六一儿童节演讲稿
2015/03/19 职场文书
煤矿百日安全活动总结
2015/05/07 职场文书
2015年小班保育员工作总结
2015/05/27 职场文书
个人收入证明格式
2015/06/24 职场文书
创业计划书之健康营养产业
2019/10/15 职场文书
JavaScript数组reduce()方法的语法与实例解析
2021/07/07 Javascript