python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现备份文件实例
Sep 16 Python
python通过urllib2获取带有中文参数url内容的方法
Mar 13 Python
Python functools模块学习总结
May 09 Python
python机器学习理论与实战(二)决策树
Jan 19 Python
Python cookbook(数据结构与算法)从序列中移除重复项且保持元素间顺序不变的方法
Mar 13 Python
python实现动态创建类的方法分析
Jun 25 Python
Python编程实现tail-n查看日志文件的方法
Jul 08 Python
Python进程间通信 multiProcessing Queue队列实现详解
Sep 23 Python
Python 导入文件过程图解
Oct 15 Python
k-means 聚类算法与Python实现代码
Jun 01 Python
Python 执行矩阵与线性代数运算
Aug 01 Python
详解python 支持向量机(SVM)算法
Sep 18 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
PHP新手上路(七)
2006/10/09 PHP
php二分查找二种实现示例
2014/03/12 PHP
php中出现空白页的原因及解决方法汇总
2014/07/08 PHP
php中的钩子理解及应用实例分析
2019/08/30 PHP
ExtJS GTGrid 简单用户管理
2009/07/01 Javascript
一个轻量级的javascript库 pj介绍
2010/12/19 Javascript
你未必知道的JavaScript和CSS交互的5种方法
2014/04/02 Javascript
js操作滚动条事件实例
2015/01/29 Javascript
javascript限制文本框输入值类型的方法
2015/05/07 Javascript
jquery实现选中单选按钮下拉伸缩效果
2015/08/06 Javascript
javascript省市区三级联动下拉框菜单实例演示
2015/11/29 Javascript
jQuery Easyui实现左右布局
2016/01/26 Javascript
js+canvas绘制五角星的方法
2016/01/28 Javascript
jQuery实现左侧导航模块的显示与隐藏效果
2016/07/04 Javascript
浅析Node.js实现HTTP文件下载
2016/08/05 Javascript
基于Bootstrap的Metronic框架实现页面链接收藏夹功能
2016/08/29 Javascript
JS生成一维码(条形码)功能示例
2017/01/19 Javascript
基于JavaScript实现简单的音频播放功能
2018/01/07 Javascript
jQuery实现模糊搜索功能的方法分析
2018/06/29 jQuery
js异步上传多张图片插件的使用方法
2018/10/22 Javascript
JS实现秒杀倒计时特效
2020/01/02 Javascript
微信小程序中使用 async/await的方法实例分析
2020/05/06 Javascript
[42:32]完美世界DOTA2联赛PWL S2 LBZS vs FTD.C 第二场 11.27
2020/12/01 DOTA
[01:36:17]DOTA2-DPC中国联赛 正赛 Ehome vs iG BO3 第一场 1月31日
2021/03/11 DOTA
Python正则表达式非贪婪、多行匹配功能示例
2017/08/08 Python
Python线程创建和终止实例代码
2018/01/20 Python
Python实现的查询mysql数据库并通过邮件发送信息功能
2018/05/17 Python
Python面向对象程序设计之私有属性及私有方法示例
2019/04/08 Python
python利用tkinter实现屏保
2019/07/30 Python
python 实现"神经衰弱"翻牌游戏
2020/11/09 Python
马来西亚最大的电器网站:Senheng
2017/10/13 全球购物
欧克利英国官网:Oakley英国
2019/08/24 全球购物
外贸业务员岗位职责
2013/11/24 职场文书
大学生职业生涯规划书前言
2014/01/09 职场文书
iPhone13将有八大升级
2021/04/15 数码科技
Python进程池与进程锁之语法学习
2022/04/11 Python