python 实现在无序数组中找到中位数方法


Posted in Python onMarch 03, 2020

一、问题描述

1求一个无序数组的中位数, (若数组是偶数,则中位数是指中间两个数字之和除以2,若数组是奇数,则中位数是指最中间位置。要求:不能使用排序,时间复杂度尽量低

2例如:

lists = [3, 2, 1, 4] , 中位数为 = (2+3)/2 = 2.5
lists = [3, 1, 2] , 中位数为 2

3、算法思想:

利用快速排序思想(但是并不是全部使用):任意挑选一个元素,以该元素为key, 划分数组为两个部分,如果左侧数组长度刚好为(n-1)/2, 那么key就为中位数, 若左侧数组长度 < (n-1)/2 , 那么中位数点在右侧,反之,中位数在左侧。然后进入相应的一侧继续寻找中位

平均时间复杂度为O(n)

二、程序

class Solution(object):
 
 def findmedian(self, lists):
  if not lists or len(lists) == 0:
   return []
 
  n = len(lists)
  if n % 2 == 0:
   a = self.partition(lists, n/2, 0, n-1)
   b = self.partition(lists, n/2-1, 0, n-1)
   mid = (lists[a]+lists[b])/ (2 * 1.0)
   return mid
  else:
   mid = self.partition(lists, n/2, 0, n-1)
   return lists[mid]
 
 def partition(self, lists, k, start, end):
 
  key = lists[start]
  left, right = start, end
 
  while left < right:
   while left < right and lists[right] > key:
    right = right - 1
   lists[left] = lists[right]
 
   while left < right and lists[left] < key:
    left = left + 1
   lists[right] = lists[left]
 
  lists[left] = key
 
  if left == k:
   return left
  elif left > k:
   return self.partition(lists, k, start, left-1)
  else:
   return self.partition(lists, k, left+1, end)
 
 
if __name__ == "__main__":
 
 sol = Solution()
 lists = [2, 5, 4, 9, 3, 6, 8, 7, 1]
 # lists = [1, 2]
 
 
 data = sol.findmedian(lists)
 print("中位数 = %s" % data)

知识补充:python streaming 实现某个字段排序

一,hadoop streaming默认情况

1,在hadoop streaming的默认情况下,是以\t作为分隔符的,标准输入时,每行的第一个\t之前的内容作为key,第一个\t之后的内容作为value。注意,如果一个\t字符都没有,那么整行作为key。

2,streaming的一些参数如下:

-D stream.map.output.field.separator :设置map输出中key和value的分隔符
-D stream.num.map.output.key.fields : 设置map程序分隔符的位置,该位置之前的部分作为key,之后的部分作为value
-D map.output.key.field.separator : 设置map输出中key内部的分割符
-D num.key.fields.for.partition : 指定分桶时,key按照分隔符切割后,其中用于分桶key所占的列数(配合-partitioner org.apache.hadoop.mapred.lib.KeyFieldBasedPartitioner 使用)
-D stream.reduce.output.field.separator:设置reduce输出中key和value的分隔符
-D stream.num.reduce.output.key.fields:设置reduce程序分隔符的位置

二,python streaming 实现某个字段的排序

1, 输入数据: cat data.txt (中间是tab键)

11 2
11 3
11 4 1
11 1

11 12 22

2,streaming程序如下:

vim sorted.sh

#!/bin/bash

export CURRENT=/home/chunhe.liao/hadoop_streaming/sort

/usr/local/hadoop-2.6.3/bin/hadoop jar /usr/local/hadoop-2.6.3/share/hadoop/tools/lib/hadoop-streaming-2.6.3.jar \
-D stream.map.output.field.separator='\t' \
-D stream.num.map.output.key.fields=3 \
-D mapreduce.job.output.key.comparator.class=org.apache.hadoop.mapreduce.lib.partition.KeyFieldBasedComparator \
-D mapreduce.partition.keycomparator.options=-k3,3nr \  # 按照第三列逆序排列,可以根据想要的第几段来选择。
-input "/user/test/inputdata/datas3/data.txt" \
-output "/user/test/streaming/sorted_20180711" \
-mapper "python mapper.py" \
-reducer "python reducer.py" \
-file "$CURRENT/mapper.py" \
-file "$CURRENT/reducer.py"

(2) mapper.py

# -*- coding: utf-8 -*-
import sys
 
for line in sys.stdin:
 line = line.strip()
 print('{0}'.format(line))

(3) reducer.py

# -*- coding: utf-8 -*-
import sys
 
for line in sys.stdin:
 line = line.strip()
 print("{0}".format(line))

运行命令:

bash sorted.sh

运行结果:

hdfs dfs -cat /user/test/streaming/sorted_20180711/part-00000

11 12 22
11 3
11 2
11 4 1
11 1

以上这篇python 实现在无序数组中找到中位数方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
分析Python的Django框架的运行方式及处理流程
Apr 08 Python
编写Python脚本来实现最简单的FTP下载的教程
May 04 Python
Python中将字典转换为XML以及相关的命名空间解析
Oct 15 Python
python实现class对象转换成json/字典的方法
Mar 11 Python
简介Python的collections模块中defaultdict类型的用法
Jul 07 Python
使用python遍历指定城市的一周气温
Mar 31 Python
Python实现基本数据结构中栈的操作示例
Dec 04 Python
解决python3 pika之连接断开的问题
Dec 18 Python
利用Python+阿里云实现DDNS动态域名解析的方法
Apr 01 Python
详细整理python 字符串(str)与列表(list)以及数组(array)之间的转换方法
Aug 30 Python
python 多进程并行编程 ProcessPoolExecutor的实现
Oct 11 Python
浅谈Python里面None True False之间的区别
Jul 09 Python
python的列表List求均值和中位数实例
Mar 03 #Python
基于Python数据分析之pandas统计分析
Mar 03 #Python
python 的numpy库中的mean()函数用法介绍
Mar 03 #Python
Python统计学一数据的概括性度量详解
Mar 03 #Python
python多维数组分位数的求取方式
Mar 03 #Python
浅谈pandas.cut与pandas.qcut的使用方法及区别
Mar 03 #Python
python Plotly绘图工具的简单使用
Mar 03 #Python
You might like
PHP的curl实现get,post和cookie(实例介绍)
2013/06/17 PHP
yii的CURD操作实例详解
2014/12/04 PHP
laravel按天、按小时,查询数据的实例
2019/10/09 PHP
Jquery 高亮显示文本中重要的关键字
2009/12/24 Javascript
关于js遍历表格的实例
2013/07/10 Javascript
Jquery each方法跳出循环,并获取返回值(实例讲解)
2013/12/12 Javascript
nodejs分页类代码分享
2014/06/17 NodeJs
不到30行JS代码实现Excel表格的方法
2014/11/15 Javascript
Javascript中的apply()方法浅析
2015/03/15 Javascript
详解jQuery移动页面开发中的ui-grid网格布局使用
2015/12/03 Javascript
BootStrap.css 在手机端滑动时右侧出现空白的原因及解决办法
2016/06/07 Javascript
prototype与__proto__区别详细介绍
2017/01/09 Javascript
超全面的vue.js使用总结
2017/02/12 Javascript
Vue.js移动端左滑删除组件的实现代码
2017/09/08 Javascript
jQuery Validate插件ajax方式验证输入值的实例
2017/12/21 jQuery
使用JS判断移动端手机横竖屏状态
2018/07/30 Javascript
解决vue 绑定对象内点击事件失效问题
2018/09/05 Javascript
vue-router的使用方法及含参数的配置方法
2018/11/13 Javascript
在vue中使用防抖函数组件操作
2020/07/26 Javascript
python中enumerate的用法实例解析
2014/08/18 Python
利用pyinstaller或virtualenv将python程序打包详解
2017/03/22 Python
Python BS4库的安装与使用详解
2018/08/08 Python
python__new__内置静态方法使用解析
2020/01/07 Python
python suds访问webservice服务实现
2020/06/26 Python
HTML5教程之html 5 本地数据库(Web Sql Database)
2014/04/03 HTML / CSS
意大利消费电子产品购物网站:SLG Store
2019/12/26 全球购物
青年文明号事迹材料
2014/01/18 职场文书
群众路线剖析材料范文
2014/10/09 职场文书
优秀教师先进材料
2014/12/16 职场文书
放牛班的春天观后感
2015/06/01 职场文书
春风化雨观后感
2015/06/11 职场文书
2015国庆节放假通知范文
2015/07/30 职场文书
员工给公司的建议书
2019/06/24 职场文书
在校大学生才艺比赛策划书怎么写?
2019/08/26 职场文书
MyBatis-Plus 批量插入数据的操作方法
2021/09/25 Java/Android
世界十大动漫制作公司排行榜,迪士尼上榜,第二是美国代表性文化符
2022/03/18 欧美动漫