python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现把utf-8格式的文件转换成gbk格式的文件
Jan 22 Python
在Python中操作日期和时间之gmtime()方法的使用
May 22 Python
给你选择Python语言实现机器学习算法的三大理由
Nov 15 Python
Python实现抓取HTML网页并以PDF文件形式保存的方法
May 08 Python
Python中asyncio与aiohttp入门教程
Oct 16 Python
浅谈python连续赋值可能引发的错误
Nov 10 Python
python实现简单加密解密机制
Mar 19 Python
numpy concatenate数组拼接方法示例介绍
May 27 Python
python实现简单聊天室功能 可以私聊
Jul 12 Python
Python使用扩展库pywin32实现批量文档打印实例
Apr 09 Python
基于Python下载网络图片方法汇总代码实例
Jun 24 Python
PySwarms(Python粒子群优化工具包)的使用:GlobalBestPSO例子解析
Apr 05 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
php下一个阿拉伯数字转中文数字的函数
2007/07/16 PHP
在WordPress中安装使用视频播放器插件Hana Flv Player
2016/01/04 PHP
PHP实现一维数组与二维数组去重功能示例
2018/05/24 PHP
javascript延时重复执行函数 lLoopRun.js
2007/06/29 Javascript
JQuery 构建客户/服务分离的链接模型中Table分页代码效率初探
2010/01/22 Javascript
JQuery动态给table添加、删除行 改进版
2011/01/19 Javascript
五个jQuery图片画廊插件 推荐
2011/05/12 Javascript
详细介绍8款超实用JavaScript框架
2013/10/25 Javascript
jQuery中bind()方法用法实例
2015/01/19 Javascript
jQuery手机浏览器中拖拽动作的艰难性分析
2015/02/04 Javascript
jQuery数据缓存用法分析
2015/02/20 Javascript
浅谈JavaScript字符串与数组
2015/06/03 Javascript
JS实现自动变化的导航菜单效果代码
2015/09/09 Javascript
原生JS和jQuery版实现文件上传功能
2016/04/18 Javascript
jQuery实现将div中滚动条滚动到指定位置的方法
2016/08/10 Javascript
利用CSS、JavaScript及Ajax实现图片预加载的方法
2016/11/29 Javascript
Javascript Event(事件)的传播与冒泡
2017/01/23 Javascript
JavaScript实现form表单的多文件上传
2020/03/27 Javascript
解决前后端分离 vue+springboot 跨域 session+cookie失效问题
2019/05/13 Javascript
小程序瀑布流组件实现翻页与图片懒加载
2020/05/19 Javascript
OpenLayers实现图层切换控件
2020/09/25 Javascript
[01:03:50]DOTA2-DPC中国联赛 正赛 CDEC vs DLG BO3 第二场 2月7日
2021/03/11 DOTA
Python程序设计入门(5)类的使用简介
2014/06/16 Python
Python闭包的两个注意事项(推荐)
2017/03/20 Python
Django 实现前端图片压缩功能的方法
2019/08/07 Python
Sentry错误日志监控使用方法解析
2020/11/12 Python
HTML5 HTMLCollection和NodeList的区别详解
2020/04/29 HTML / CSS
Sperry澳大利亚官网:源自美国帆船鞋创始品牌
2019/07/29 全球购物
strlen的几种不同实现方法
2013/05/31 面试题
网络工程师面试(三木通信技术有限公司)
2013/06/05 面试题
实习鉴定范文
2013/12/19 职场文书
楼面经理岗位职责范本
2014/02/18 职场文书
课外小组活动总结
2014/08/27 职场文书
2014流动人口计划生育工作总结
2014/12/20 职场文书
dubbo集成zipkin获取Traceid的实现
2021/07/26 Java/Android
mysql 子查询的使用
2022/04/28 MySQL