Python从数据库读取大量数据批量写入文件的方法


Posted in Python onDecember 10, 2018

使用机器学习训练数据时,如果数据量较大可能我们不能够一次性将数据加载进内存,这时我们需要将数据进行预处理,分批次加载进内存。

下面是代码作用是将数据从数据库读取出来分批次写入txt文本文件,方便我们做数据的预处理和训练机器学习模型。

#%%
import pymssql as MySQLdb #这里是python3 如果你是python2.x的话,import MySQLdb
#数据库连接属性
hst = '188.10.34.18'
usr = 'sa'
passwd = 'p@ssw0rd'
db = 'HistoryTrace'
 
#总共多少数据
allData = 1674333
#每个批次多少条数据
dataOfEach = 20000
#批次
batch = ceil(allData/dataOfEach)
 
#文件名
global IDctrl 
IDctrl = 1
filename = str(IDctrl)+'.txt'
 
#连接数据库
conn = MySQLdb.connect(host=hst,user=usr,password=passwd,database=db)
cur=conn.cursor()
 
while IDctrl<batch:
 #读取数据库
 sql = 'SELECT Longitude,Latitude,Altitude,VelComOfLong,VelComOfLati,Aircraft,Section,TimeMinus\
    FROM dealed1 where ID>=' + str(IDctrl) + ' and ID <' + str(IDctrl + dataOfEach) 
 cur.execute(sql)
 rows=cur.fetchall()
 #写文件
 f = open(filename,'w')
 f.writelines(str(rows))
 #文件名加1
 IDctrl+=1
 filename = str(IDctrl)+'.txt'
 
#关闭数据库连接
f.close()
conn.close()

以上这篇Python从数据库读取大量数据批量写入文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现批量转换文件编码(批转换编码示例)
Jan 23 Python
python中使用urllib2获取http请求状态码的代码例子
Jul 07 Python
详解使用 pyenv 管理多个版本 python 环境
Oct 19 Python
Python+PIL实现支付宝AR红包
Feb 09 Python
TensorFlow入门使用 tf.train.Saver()保存模型
Apr 24 Python
在Python中使用defaultdict初始化字典以及应用方法
Oct 31 Python
Python multiprocess pool模块报错pickling error问题解决方法分析
Mar 20 Python
python hough变换检测直线的实现方法
Jul 12 Python
python matplotlib库绘制散点图例题解析
Aug 10 Python
基于Django统计博客文章阅读量
Oct 29 Python
django-crontab实现服务端的定时任务的示例代码
Feb 17 Python
Python中logger日志模块详解
Aug 04 Python
对Python实现简单的API接口实例讲解
Dec 10 #Python
python中dir()与__dict__属性的区别浅析
Dec 10 #Python
python分块读取大数据,避免内存不足的方法
Dec 10 #Python
Python 文本文件内容批量抽取实例
Dec 10 #Python
Python中作用域的深入讲解
Dec 10 #Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 #Python
Python文件常见操作实例分析【读写、遍历】
Dec 10 #Python
You might like
用PHP为SHOPEX增加日志功能代码
2010/07/02 PHP
php计算给定日期所在周的开始日期和结束日期示例
2017/02/06 PHP
PHP使用new StdClass()创建空对象的方法分析
2017/06/06 PHP
微信公众号实现扫码获取微信用户信息(网页授权)
2019/04/09 PHP
yii 框架实现按天,月,年,自定义时间段统计数据的方法分析
2020/04/04 PHP
JavaScript EasyPager 分页函数
2011/05/25 Javascript
用最通俗易懂的代码帮助新手理解javascript闭包 推荐
2012/03/01 Javascript
js中settimeout方法加参数的使用实例
2014/02/27 Javascript
JavaScript实现的购物车效果可以运用在好多地方
2014/05/09 Javascript
jQuery将多条数据插入模态框的示例代码
2014/09/25 Javascript
jquery移动节点实例
2015/01/14 Javascript
JS实现仿QQ面板的手风琴效果折叠菜单代码
2015/09/11 Javascript
JQuery日期插件datepicker的使用方法
2016/03/03 Javascript
Struts2+jquery.form.js实现图片与文件上传的方法
2016/05/05 Javascript
Bootstrap文件上传组件之bootstrap fileinput
2016/11/25 Javascript
详解Python中logging日志模块在多进程环境下的使用
2016/12/26 Javascript
JavaScript异步上传图片文件的实例代码
2017/07/04 Javascript
Angularjs过滤器实现动态搜索与排序功能示例
2017/12/13 Javascript
JS函数内部属性之arguments和this实例解析
2018/10/07 Javascript
微信小程序五子棋游戏的棋盘,重置,对弈实现方法【附demo源码下载】
2019/02/20 Javascript
JS实现放大镜效果
2020/09/21 Javascript
[05:15]2018年度CS GO社区贡献奖-完美盛典
2018/12/16 DOTA
Python批量修改文件后缀的方法
2014/01/26 Python
PyMongo安装使用笔记
2015/04/27 Python
Python的CGIHTTPServer交互实现详解
2018/02/08 Python
Python 互换字典的键值对实例
2019/02/12 Python
Python:Numpy 求平均向量的实例
2019/06/29 Python
pygame实现烟雨蒙蒙下彩虹雨
2019/11/11 Python
Python unittest单元测试框架及断言方法
2020/04/15 Python
基于HTML5新特性Mutation Observer实现编辑器的撤销和回退操作
2016/01/11 HTML / CSS
Herschel Supply Co.美国:背包、手提袋及配件
2020/11/24 全球购物
公安交警个人对照检查材料思想汇报
2014/10/01 职场文书
党员干部对十八届四中全会的期盼
2014/10/17 职场文书
python读取pdf格式文档的实现代码
2021/04/01 Python
与Windows10相比Windows11有哪些改进?值不值得升级?
2021/11/21 数码科技
Nginx工作模式及代理配置的使用细节
2022/03/21 Servers