python的random模块及加权随机算法的python实现方法


Posted in Python onJanuary 04, 2017

random是用于生成随机数的,我们可以利用它随机生成数字或者选择字符串。

•random.seed(x)改变随机数生成器的种子seed。

一般不必特别去设定seed,Python会自动选择seed。

•random.random()    用于生成一个随机浮点数n,0 <= n < 1

•random.uniform(a,b)    用于生成一个指定范围内的随机浮点数,生成的随机整数a<=n<=b;

•random.randint(a,b)    用于生成一个指定范围内的整数,a为下限,b为上限,生成的随机整数a<=n<=b;若a=b,则n=a;若a>b,报错

•random.randrange([start], stop [,step])    从指定范围[start,stop)内,按指定基数递增的集合中获取一个随机数,基数缺省值为1

•random.choice(sequence)    从序列中获取一个随机元素,参数sequence表示一个有序类型,并不是一种特定类型,泛指list,tuple,字符串等

•random.shuffle(x[,random])    用于将一个列表中的元素打乱 (洗牌),会改变原始列表

•random.sample(sequence,k)    从指定序列中随机获取k个元素作为一个片段返回,不会改变原有序列

那么现在基础知识有了,我们来实现一个加权随机算法:

加权随机算法一般应用在以下场景:有一个集合S,里面比如有A,B,C,D这四项。这时我们想随机从中抽取一项,但是抽取的概率不同,比如我们希望抽到A的概率是50%,抽到B和C的概率是20%,D的概率是10%。一般来说,我们可以给各项附一个权重,抽取的概率正比于这个权重。那么上述集合就成了:

{A:5,B:2,C:2,D:1}

方法一:

最简单的方法可以这样:

把序列按权重值扩展成:lists=[A,A,A,A,A,B,B,C,C,D],然后random.choice(lists)随机选一个就行。虽然这样选取的时间复杂度是O(1),但是数据量一大,空间消耗就太大了。

# coding:utf-8
import random


def weight_choice(list, weight):
  """
  :param list: 待选取序列
  :param weight: list对应的权重序列
  :return:选取的值
  """
  new_list = []
  for i, val in enumerate(list):
    new_list.extend(val * weight[i])
  return random.choice(new_list)


if __name__ == "__main__":
  print(weight_choice(['A', 'B', 'C', 'D'], [5, 2, 2, 1]))

方法二:

比较常用的方法是这样:

计算权重总和sum,然后在1到sum之间随机选择一个数R,之后遍历整个集合,统计遍历的项的权重之和,如果大于等于R,就停止遍历,选择遇到的项。

还是以上面的集合为例,sum等于10,如果随机到1-5,则会在遍历第一个数字的时候就退出遍历。符合所选取的概率。

选取的时候要遍历集合,它的时间复杂度是O(n)。

# coding:utf-8
import random

list = ['A', 'B', 'C', 'D']


def weight_choice(weight):
  """
  :param weight: list对应的权重序列
  :return:选取的值在原列表里的索引
  """
  t = random.randint(0, sum(weight) - 1)
  for i, val in enumerate(weight):
    t -= val
    if t < 0:
      return i


if __name__ == "__main__":
  print(list[weight_choice([5, 2, 2, 1])])

方法三:

可以先对原始序列按照权重排序。这样遍历的时候,概率高的项可以很快遇到,减少遍历的项。(因为rnd递减的速度最快(先减去最大的数))

比较{A:5,B:2,C:2,D:1}和{B:2,C:2,A:5,D:1}

前者遍历步数的期望是5/10*1+2/10*2+2/10*3+1/10*4=19/10而后者是2/10*1+2/10*2+5/10*3+1/10*4=25/10。

这样提高了平均选取速度,但是原序列排序也需要时间。

先搞一个权重值的前缀和序列,然后在生成一个随机数t后,可以用二分法来从这个前缀和序列里找,那么选取的时间复杂度就是O(logn)了。

 

# coding:utf-8
import random
import bisect

list = ['A', 'B', 'C', 'D']


def weight_choice(weight):
  """
  :param weight: list对应的权重序列
  :return:选取的值在原列表里的索引
  """
  weight_sum = []
  sum = 0
  for a in weight:
    sum += a
    weight_sum.append(sum)
  t = random.randint(0, sum - 1)
  return bisect.bisect_right(weight_sum, t)


if __name__ == "__main__":
  print(list[weight_choice([5, 2, 2, 1])])

以上这篇python的random模块及加权随机算法的python实现方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
CentOS6.5设置Django开发环境
Oct 13 Python
python中os模块详解
Oct 14 Python
Python KMeans聚类问题分析
Feb 23 Python
Python从零开始创建区块链
Mar 06 Python
Python创建普通菜单示例【基于win32ui模块】
May 09 Python
关于django 数据库迁移(migrate)应该知道的一些事
May 27 Python
Python简易计算器制作方法代码详解
Oct 31 Python
Python values()与itervalues()的用法详解
Nov 27 Python
python 实现视频 图像帧提取
Dec 10 Python
使用python执行shell脚本 并动态传参 及subprocess的使用详解
Mar 06 Python
Python字典fromkeys()方法使用代码实例
Jul 20 Python
Python全局变量与global关键字常见错误解决方案
Oct 05 Python
python 实现红包随机生成算法的简单实例
Jan 04 #Python
Python 模板引擎的注入问题分析
Jan 01 #Python
python getopt详解及简单实例
Dec 30 #Python
浅谈编码,解码,乱码的问题
Dec 30 #Python
Python实现将数据库一键导出为Excel表格的实例
Dec 30 #Python
python脚本实现数据导出excel格式的简单方法(推荐)
Dec 30 #Python
利用python生成一个导出数据库的bat脚本文件的方法
Dec 30 #Python
You might like
关于时间计算的结总
2006/12/06 PHP
PHP上传图片进行等比缩放可增加水印功能
2014/01/13 PHP
php实现字符串反转输出的方法
2015/03/14 PHP
PHP中trim()函数简单使用指南
2015/04/16 PHP
PHP实现查询两个数组中不同元素的方法
2016/02/23 PHP
PHP实现支持加盐的图片加密解密
2016/09/09 PHP
php四种定界符详解
2017/02/16 PHP
利用php-cli和任务计划实现刷新token功能的方法
2017/05/03 PHP
解决laravel 出现ajax请求419(unknown status)的问题
2019/09/03 PHP
javascript函数定义的几种区别小结
2014/01/06 Javascript
封装了一个支持匿名函数的Javascript事件监听器
2014/06/05 Javascript
Javascript字符串对象的常用方法简明版
2014/06/26 Javascript
深入分析jsonp协议原理
2015/09/26 Javascript
JS折半插入排序算法实例
2015/12/02 Javascript
jQuery模拟物体自由落体运动(附演示与demo源码下载)
2016/01/21 Javascript
asp.net+jquery.form实现图片异步上传的方法(附jquery.form.js下载)
2016/05/05 Javascript
关于js二维数组和多维数组的定义声明(详解)
2016/10/02 Javascript
在vue-cli项目中使用bootstrap的方法示例
2018/04/21 Javascript
解决Angular4项目部署到服务器上刷新404的问题
2018/08/31 Javascript
一次让你了解全部JavaScript的作用域
2019/06/24 Javascript
基于JavaScript伪随机正态分布代码实例
2019/11/07 Javascript
js数组的基本使用总结
2021/01/18 Javascript
python实现读取命令行参数的方法
2015/05/22 Python
Python的Flask框架中配置多个子域名的方法讲解
2016/06/07 Python
Python实现Smtplib发送带有各种附件的邮件实例
2017/06/05 Python
深入分析python数据挖掘 Json结构分析
2018/04/21 Python
softmax及python实现过程解析
2019/09/30 Python
学会迭代器设计模式,帮你大幅提升python性能
2021/01/03 Python
python反扒机制的5种解决方法
2021/02/06 Python
CSS3字体效果的设置方法小结
2016/06/13 HTML / CSS
经典团队口号
2014/06/06 职场文书
校本教研活动总结
2014/07/01 职场文书
2015年高三班主任工作总结
2015/05/21 职场文书
保姆聘用合同
2015/09/21 职场文书
Python中的程序流程控制语句
2022/02/24 Python