PHP 中执行排序与 MySQL 中排序


Posted in PHP onApril 21, 2009

此文首发在 InfoQ 中文站作者:明灵(dragon) , Fenng . Note:要转载的朋友请注意注明这篇文章的第一作者!
这篇文章是dragon 朋友来邮探讨后他做的一个总结。在 DB 中排序还是在 应用程序中排序是个很有趣的话题,dragon 第一份邮件中其实已经总结的很好了,我添加了一点建议而已。现在放上来,与大家共享。这篇文章也投稿到了 InfoQ 中文站

Q:列出在 PHP 中执行排序要优于在 MYSQL 中排序的原因?给一些必须在MYSQL中排序的实例?

A:通常来说,执行效率需要考虑 CPU、内存和硬盘等的负载情况,假定 MYSQL 服务器和 PHP 的服务器都已经按照最适合的方式来配置,那么系统的可伸缩性(Scalability)和用户感知性能(User-perceived Performance)是我们追求的主要目标。在实际运行中,MYSQL 中数据往往以 HASH tables、BTREE 等方式存贮于内存,操作速度很快;同时 INDEX 已经进行了一些预排序;很多应用中,MYSQL 排序是首选。而在应用层(PHP)中排序,也必然在内存中进行,与 MYSQL 相比具有如下优势:

  • 1、 考虑整个网站的可伸缩性和整体性能,在应用层(PHP)中排序明显会降低数据库的负载,从而提升整个网站的扩展能力。而数据库的排序,实际上成本是非常高的,消耗内存、CPU,如果并发的排序很多,DB 很容易到瓶颈。
  • 2、 如果在应用层(PHP)和MYSQL之间还存在数据中间层,合理利用,PHP会有更好的收益。
  • 3、 PHP在内存中的数据结构专门针对具体应用来设计,比数据库更为简洁、高效;
  • 4、 PHP不用考虑数据灾难恢复问题,可以减少这部分的操作损耗;
  • 5、 PHP不存在表的锁定问题;
  • 6、 MYSQL中排序,请求和结果返回还需要通过网络连接来进行,而PHP中排序之后就可以直接返回了,减少了网络IO。

至于执行速度,差异应该不会很大,除非应用设计有问题,造成大量不必要的网络IO。另外,应用层要注意PHP 的 Cache 设置,如果超出会报告内部错误;此时要根据应用做好评估,或者调整Cache。具体选择,将取决于具体的应用。

列出一些 PHP 中执行排序更优的情况:

  • 1、 数据源不在 MYSQL 中,存在硬盘、内存或者来自网络的请求等;
  • 2、 数据存在 MYSQL 中,量不大,而且没有相应的索引,此时把数据取出来用PHP排序更快;
  • 3、 数据源来自于多个 MYSQL 服务器,此时从多个 MYSQL 中取出数据,然后在PHP中排序更快;
  • 4、 除了 MYSQL 之外,存在其他数据源,比如硬盘、内存或者来自网络的请求等,此时不适合把这些数据存入 MYSQL 后再排序;

列出一些必须在 MYSQL 中排序的实例:

  • 1、 MYSQL 中已经存在这个排序的索引;
  • 2、 MYSQL 中数据量较大,而结果集需要其中很小的一个子集;比如 1000000 行数据,取TOP 10;
  • 3、 对于一次排序、多次调用的情况,比如统计聚合的情形,可以提供给不同的服务使用,那么在 MYSQL 中排序是首选的。另外,对于数据深度挖掘,通常做法是在应用层做完排序等复杂操作,把结果存入MYSQL即可,便于多次使用。
  • 4、 不论数据源来自哪里,当数据量大到一定的规模后,由于占用内存/Cache 的关系,不再适合 PHP 中排序了;此时把数据复制、导入或者存在 MYSQL ,并用 INDEX 优化,是优于 PHP 的。不过,用 Java,甚至 C++ 来处理这类操作会更好。 [有些类似大数据集聚合或者汇总的数据,在客户端排序得不偿失。当然,也有用类似搜索引擎的思路来解决类似应用的情况。]

从网站整体考虑,就必须加入人力和成本的考虑。假如网站规模和负载较小,而人力有限(人数和能力都可能有限),此时在应用层(PHP)做排序要做不 少开发和调试工作,耗费时间,得不偿失;不如在 DB 中处理,简单快速。对于大规模的网站,电力、服务器的费用很高,在系统架构上精打细算,可以节约大量的费用,是公司持续发展之必要;此时如果能在应用层(PHP) 进行排序并满足业务需求,尽量在应用层进行。

PHP 相关文章推荐
PHP中路径问题的解决方案
Oct 09 PHP
php数组函数序列之array_key_exists() - 查找数组键名是否存在
Oct 29 PHP
解决PHP mysql_query执行超时(Fatal error: Maximum execution time …)
Jul 03 PHP
php Session存储到Redis的方法
Nov 04 PHP
php数组中包含中文的排序方法
Jun 03 PHP
让CodeIgniter数据库缓存自动过期的处理的方法
Jun 12 PHP
php使用substr()和strpos()联合查找字符串中某一特定字符的方法
May 12 PHP
解决nginx不支持thinkphp中pathinfo的问题
Jul 21 PHP
WordPress中获取页面链接和标题的相关PHP函数用法解析
Dec 17 PHP
PHP用FTP类上传文件视频等的简单实现方法
Sep 23 PHP
php分页查询的简单实现代码
Mar 14 PHP
PHP基于curl post实现发送url及相关中文乱码问题解决方法
Nov 25 PHP
一个php导出oracle库的php代码
Apr 20 #PHP
php一句话cmdshell新型 (非一句话木马)
Apr 18 #PHP
对squid中refresh_pattern的一些理解和建议
Apr 17 #PHP
PHP 加密与解密的斗争
Apr 17 #PHP
php error_log 函数的使用
Apr 13 #PHP
PHP Document 代码注释规范
Apr 13 #PHP
php pcntl_fork和pcntl_fork 的用法
Apr 13 #PHP
You might like
PHP中文分词的简单实现代码分享
2011/07/17 PHP
利用php递归实现无限分类 格式化数组的详解
2013/06/08 PHP
MySql数据库查询结果用表格输出PHP代码示例
2015/03/20 PHP
PHP使用PDO抽象层获取查询结果的方法示例
2018/05/10 PHP
javascript小数计算出现近似值的解决办法
2010/02/06 Javascript
Colortip基于jquery的信息提示框插件在IE6下面的显示问题修正方法
2010/12/06 Javascript
23个Javascript弹出窗口特效整理
2011/02/25 Javascript
node.js中的fs.writeFileSync方法使用说明
2014/12/14 Javascript
JavaScript随机生成信用卡卡号的方法
2015/04/07 Javascript
基于jQuery和hwSlider实现内容左右滑动切换效果附源码下载(一)
2016/06/22 Javascript
jquery中done和then的区别(详解)
2017/12/19 jQuery
微信小程序wx.uploadfile 本地文件转base64的实现代码
2018/06/28 Javascript
Vue 无限滚动加载指令实现方法
2019/05/28 Javascript
小程序新版订阅消息模板消息
2019/12/31 Javascript
vue2路由方式--嵌套路由实现方法分析
2020/03/06 Javascript
解决elementUI 切换tab后 el_table 固定列下方多了一条线问题
2020/07/19 Javascript
基于vue.js仿淘宝收货地址并设置默认地址的案例分析
2020/08/20 Javascript
python关键字and和or用法实例
2015/05/28 Python
python2 与 python3 实现共存的方法
2018/07/12 Python
[原创]Python入门教程1. 基本运算【四则运算、变量、math模块等】
2018/10/28 Python
使用Django搭建网站实现商品分页功能
2020/05/22 Python
python实现PDF中表格转化为Excel的方法
2020/06/16 Python
Lombok插件安装(IDEA)及配置jar包使用详解
2020/11/04 Python
Python爬虫之Selenium警告框(弹窗)处理
2020/12/04 Python
英国复古和经典球衣网站:Vintage Football Shirts
2018/10/05 全球购物
简述安装Slackware Linux系统的过程
2012/01/12 面试题
聘任书的写作格式及范文
2014/03/29 职场文书
小学运动会班级口号
2014/06/09 职场文书
大专生自荐书范文
2014/06/22 职场文书
社保转移委托书范本
2014/10/08 职场文书
优秀党员推荐材料
2014/12/18 职场文书
2015年法律事务部工作总结
2015/07/27 职场文书
大学生十八大感想
2015/08/11 职场文书
2016七夕情人节感言
2015/12/09 职场文书
Python中requests做接口测试的方法
2021/05/30 Python
Lakehouse数据湖并发控制陷阱分析
2022/03/31 Oracle