编程 Python

PyMongo 查询数据的实现

Posted in Python onJune 28, 2021

查询数据

往 mongodb存储的所有数据，都是为了需要读取的时候能够取出。
但读取除了按某一列比如分数：排序读取；还会出现我只看某一段时间、某个班的条件筛选；还会出现我想看每个班平均分聚合求平均....等等多样操作
这些操作都可以通过 find_one()、find() 完成：

ret2find = collect.find_one()
# {'_id': ObjectId('5ea780bf747e3e128470e485'), 'class_name': '高三（1）班', 'student_name': '张三', 'subject': '英语', 'score': 100, 'date': '20200301'}

ret2find = collect.find()
# <pymongo.cursor.Cursor object at 0x0000024BBEBE15C8>

从上面的结果可以看出，find_one() 查询得出单一字典；find()则是一个生成器对象能够通过 for val in ret2find: 遍历取出

设置查询条件

但能取出全部数据还不够，查询一般是会带条件、甚至复杂的条件 —— 比如：查询出高三（1）班，张三或李四，成绩大于90 的科目，该怎么做呢？

ret2find = collect.find({"class_name":"高三（1）班","score":{"$gt":90},"$or":[{"student_name":"张三"},{"student_name":"李四"}]})

for val in ret2find:
    print(val)

上面有两个要点：

{"class_name":"高三（1）班","score":{"$gt":90}}

这一段写法表示 “高三（1）班且分数 > 90”；
而 $gt 比较操作符，表大于意思，除 $gt 操作符以外还有：

符号	含义
$lt	小于
$lte	小于等于
$gt	大于
$gte	大于等于
$ne	不等于
$in	在范围内
$nin	不在范围内

{"$or":[{"student_name":"张三"},{"student_name":"李四"}]}

这一段写法表示 “学生名称为张三或李四”
而其中的 $or 逻辑操作符，用它来表示条件之间的关系。除了 $or 以外的逻辑操作符还有：

符号	含义
$and	按条件取交集
$not	单个条件的相反集合
$nor	多个条件的相反集合
$or	多个条件的并集

符号	含义	示例	示例含义
$regex	正则匹配	{"student_name":{"regex":".∗三"}}	学生名以 “三” 结尾
$expr	允许查询中使用聚合表达式	{"expr":{"gt":["spent","budget"]}}	查询花费大于预算的超支记录
$exists	属性是否存在	{"date":{"$exists": True}}	date属性存在
$exists	属性是否存在	{"date":{"$exists": True}}	date属性存在
$type	类型判断	{"score":{"$type":"int"}}	score的类型为int
$mod	取模操作	{'score': {'$mod': [5, 0]}}	分数取5、0的模

PS：pymongo最大查询限制

在用pyhton遍历mongo数据中时候，发限查询到101行就会阻塞，如下

lista_a = []
    for info in db.get_collection("dbs").find():
        lista_a.append(info)
        print("info nums=",len(info))

'''结果显示'''
'''info nums=101'''

分析原因：mongodb的find()方法返回游标cursor，可能有一个限制阈值101，参考文档，如下

原文：

The MongoDB server returns the query results in batches. The amount of data in the batch will not exceed the maximum BSON document size. To override the default size of the batch, see batchSize() and limit().

New in version 3.4: Operations of type find(), aggregate(), listIndexes, and listCollections return a maximum of 16 megabytes per batch. batchSize() can enforce a smaller limit, but not a larger one.

find() and aggregate() operations have an initial batch size of 101 documents by default. Subsequent getMore operations issued against the resulting cursor have no default batch size, so they are limited only by the 16 megabyte message size.

For queries that include a sort operation without an index, the server must load all the documents in memory to perform the sort before returning any results.

翻译：

MongoDB服务器批量返回查询结果。批处理中的数据量不会超过最大BSON文档大小。要覆盖批处理的默认大小，请参见batchSize()和limit()。
新版本3.4:类型为find()、aggregate()、listIndexes和listCollections的操作每批最多返回16兆字节。batchSize()可以执行较小的限制，但不能执行较大的限制。
find()和aggregate()操作的初始批处理大小默认为101个文档。针对生成的游标发出的后续getMore操作没有默认的批处理大小，因此它们仅受16mb消息大小的限制。对于包含没有索引的排序操作的查询，服务器必须在返回任何结果之前加载内存中的所有文档来执行排序。

解决方案

lista_a = []
    for info in db.get_collection("dbs").find().batch_size1(5000): #修改最大限制阈
        lista_a.append(info)
        print("info nums=",len(info))

但是这种方法是每次游标返回5000条数据，循环遍历，如果单词查找50000次应该怎么写呢？如下

lista_a = []
   cousor=db.get_collection("dbs").find().batch_size1(5000)
    for i in range(50000): #修改最大限制阈
        lista_a.append(next(cousor))

到此这篇关于PyMongo 查询数据的实现的文章就介绍到这了,更多相关PyMongo 查询数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

PyMongo 查询数据的实现

- Author -

锐玩道

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python中使用支持向量机SVM实践

Dec 27 Python

详解Python3.6的py文件打包生成exe

Jul 13 Python

pycharm运行出现ImportError:No module named的解决方法

Oct 13 Python

详解Python函数式编程—高阶函数

Mar 29 Python

tensorflow 实现打印pb模型的所有节点

Jan 23 Python

Django中文件上传和文件访问微项目的方法

Apr 27 Python

Python字符串格式化f-string多种功能实现

May 07 Python

使用opencv识别图像红色区域,并输出红色区域中心点坐标

Jun 02 Python

Python执行时间的几种计算方法

Jul 31 Python

Python配置pip国内镜像源的实现

Aug 20 Python

scrapy利用selenium爬取豆瓣阅读的全步骤

Sep 20 Python

python3定位并识别图片验证码实现自动登录功能

Jan 29 Python

浅谈哪个Python库才最适合做数据可视化

总结Python变量的相关知识

详解非极大值抑制算法之Python实现

Python实现生活常识解答机器人

Python办公自动化之教你如何用Python将任意文件转为PDF格式

Python移位密码、仿射变换解密实例代码

Pytest中conftest.py的用法

You might like

PHP中for与foreach的区别分析

2011/03/09 PHP

PHP fgetcsv 定义和用法(附windows与linux下兼容问题)

2012/05/29 PHP

一些常用且实用的原生JavaScript函数

2010/09/08 Javascript

jquery调用asp.net 页面后台的实现代码

2011/04/27 Javascript

javascript弹出页面回传值的方法

2015/01/28 Javascript

谈一谈javascript闭包

2016/01/28 Javascript

Nodejs如何搭建Web服务器

2016/03/28 NodeJs

Jquery对新插入的节点绑定Click事件失效的解决方法

2016/06/02 Javascript

JavaScript中的Array 对象（数组对象）

2016/06/02 Javascript

让编辑器支持word复制黏贴、截屏的js代码

2016/10/17 Javascript

jQuery插件ajaxFileUpload异步上传文件

2016/10/19 Javascript

JS短信验证码倒计时功能的实现（没有验证码，只有倒计时）

2016/10/27 Javascript

通过bootstrap全面学习less

2016/11/09 Javascript

学习vue.js条件渲染

2016/12/03 Javascript

详解vue.js 开发环境搭建最简单攻略

2017/06/12 Javascript

javascript 中模板方法单例的实现方法

2017/10/17 Javascript

Angular动态绑定样式及改变UI框架样式的方法小结

2018/09/03 Javascript

Node.js JSON模块用法实例分析

2019/01/04 Javascript

qrcode生成二维码微信长按无法识别问题的解决

2019/04/04 Javascript

js实现踩五彩块游戏

2020/02/08 Javascript

Vue + Node.js + MongoDB图片上传组件实现图片预览和删除功能详解

2020/04/29 Javascript

JavaScript 如何计算文本的行数的实现

2020/09/14 Javascript

pyqt4教程之widget使用示例分享

2014/03/07 Python

python中正则表达式的使用方法

2018/02/25 Python

详解PyTorch批训练及优化器比较

2018/04/28 Python

详解用selenium来下载小姐姐图片并保存

2021/01/26 Python

CSS3感应鼠标的背景闪烁和图片缩放动画效果

2014/05/14 HTML / CSS

Made in Design英国：设计家具、照明、家庭装饰和花园家具

2019/09/24 全球购物

毕业生的求职信范文分享

2013/12/04 职场文书

优秀士兵个人事迹材料

2014/01/19 职场文书

声乐专业大学生职业生涯规划书：理想的未来需要自己去打造

2014/09/20 职场文书

2015年全国科普日活动总结

2015/03/23 职场文书

小学少先队活动总结

2015/05/08 职场文书

认识实习感想

2015/08/10 职场文书

感恩老师主题班会

2015/08/12 职场文书

opencv 分类白天与夜景视频的方法

2021/06/05 Python

PyMongo 查询数据的实现

查询数据

设置查询条件

更多查询操作

PS：pymongo最大查询限制

解决方案