Python从数据库读取大量数据批量写入文件的方法


Posted in Python onDecember 10, 2018

使用机器学习训练数据时,如果数据量较大可能我们不能够一次性将数据加载进内存,这时我们需要将数据进行预处理,分批次加载进内存。

下面是代码作用是将数据从数据库读取出来分批次写入txt文本文件,方便我们做数据的预处理和训练机器学习模型。

#%%
import pymssql as MySQLdb #这里是python3 如果你是python2.x的话,import MySQLdb
#数据库连接属性
hst = '188.10.34.18'
usr = 'sa'
passwd = 'p@ssw0rd'
db = 'HistoryTrace'
 
#总共多少数据
allData = 1674333
#每个批次多少条数据
dataOfEach = 20000
#批次
batch = ceil(allData/dataOfEach)
 
#文件名
global IDctrl 
IDctrl = 1
filename = str(IDctrl)+'.txt'
 
#连接数据库
conn = MySQLdb.connect(host=hst,user=usr,password=passwd,database=db)
cur=conn.cursor()
 
while IDctrl<batch:
 #读取数据库
 sql = 'SELECT Longitude,Latitude,Altitude,VelComOfLong,VelComOfLati,Aircraft,Section,TimeMinus\
    FROM dealed1 where ID>=' + str(IDctrl) + ' and ID <' + str(IDctrl + dataOfEach) 
 cur.execute(sql)
 rows=cur.fetchall()
 #写文件
 f = open(filename,'w')
 f.writelines(str(rows))
 #文件名加1
 IDctrl+=1
 filename = str(IDctrl)+'.txt'
 
#关闭数据库连接
f.close()
conn.close()

以上这篇Python从数据库读取大量数据批量写入文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
举例介绍Python中的25个隐藏特性
Mar 30 Python
python比较两个列表是否相等的方法
Jul 28 Python
Python实现简单文本字符串处理的方法
Jan 22 Python
python中datetime模块中strftime/strptime函数的使用
Jul 03 Python
用python生成(动态彩色)二维码的方法(使用myqr库实现)
Jun 24 Python
python3.6 tkinter实现屏保小程序
Jul 30 Python
python matplotlib如何给图中的点加标签
Nov 14 Python
导入tensorflow:ImportError: libcublas.so.9.0 报错
Jan 06 Python
python3 实现口罩抽签的功能
Mar 11 Python
jupyter lab的目录调整及设置默认浏览器为chrome的方法
Apr 10 Python
Python中and和or如何使用
May 28 Python
Python SMTP发送电子邮件的示例
Sep 23 Python
对Python实现简单的API接口实例讲解
Dec 10 #Python
python中dir()与__dict__属性的区别浅析
Dec 10 #Python
python分块读取大数据,避免内存不足的方法
Dec 10 #Python
Python 文本文件内容批量抽取实例
Dec 10 #Python
Python中作用域的深入讲解
Dec 10 #Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 #Python
Python文件常见操作实例分析【读写、遍历】
Dec 10 #Python
You might like
php中修改浏览器的User-Agent来伪装你的浏览器和操作系统
2011/07/29 PHP
Laravel 6 将新增为指定队列任务设置中间件的功能
2019/08/06 PHP
jQuery 操作option的实现代码
2011/03/03 Javascript
JS中使用Array函数shift和pop创建可忽略参数的例子
2014/05/28 Javascript
jQuery实现form表单元素序列化为json对象的方法
2015/12/09 Javascript
AngularJS进行性能调优的7个建议
2015/12/28 Javascript
JavaScript优化专题之Loading and Execution加载和运行
2016/01/20 Javascript
checkbox批量选中,获取选中项的值的简单实例
2016/06/28 Javascript
Angular中$cacheFactory的作用和用法实例详解
2016/08/19 Javascript
Jquery Easyui对话框组件Dialog使用详解(14)
2016/12/19 Javascript
基于Vuex无法观察到值变化的解决方法
2018/03/01 Javascript
通过npm或yarn自动生成vue组件的方法示例
2019/02/12 Javascript
详解javascript中的Error对象
2019/04/25 Javascript
js设计模式之单例模式原理与用法详解
2019/08/15 Javascript
webpack4从0搭建组件库的实现
2020/11/29 Javascript
跟老齐学Python之list和str比较
2014/09/20 Python
Python 列表list使用介绍
2014/11/30 Python
python读取json文件并将数据插入到mongodb的方法
2015/03/23 Python
Python中super函数的用法
2017/11/17 Python
pandas重新生成索引的方法
2018/11/06 Python
Python基础知识点 初识Python.md
2019/05/14 Python
Win10环境python3.7安装dlib模块趟过的坑
2019/08/01 Python
使用Python进行中文繁简转换的实现代码
2019/10/18 Python
python根据文本生成词云图代码实例
2019/11/15 Python
python GUI库图形界面开发之PyQt5单行文本框控件QLineEdit详细使用方法与实例
2020/02/27 Python
如何用python批量调整视频声音
2020/12/22 Python
HTML5页面音视频在微信和app下自动播放的实现方法
2016/10/20 HTML / CSS
英国工具中心:UK Tool Centre
2017/07/10 全球购物
瑜伽灵感珠宝:Satya Jewelry
2018/01/06 全球购物
费用会计岗位职责
2014/01/01 职场文书
人事部岗位职责范本
2014/03/05 职场文书
商学院大学生求职的自我评价
2014/03/12 职场文书
公司承诺函范文
2015/01/21 职场文书
保研推荐信范文
2015/03/25 职场文书
干部考核工作总结
2015/08/12 职场文书
MySQL去除重叠时间求时间差和的实现
2021/08/23 MySQL