NumPy - 随机数函数


本文引用了python之道的原创内容:http://www.cnblogs.com/lemonbit/,感谢作者的辛苦奉献


NumPy的随机函数子库:np.random.*包含有关随机数的函数。

随机数组生成

rand(d0, d1, ..., dn) 根据d0-dn创建随机数数组,浮点数,[0, 1),均匀分布,
randn(d0, d1, ..., dn) 根据d0-dn创建随机数数组,标准正太分布
randint(low[,high,shape]) 根据shape创建随机整数数组 范围是[1ow, high),均匀分布
seed(s) 随机数种子s是给定的种子值,相同的种子值产生相同的随机数组

常用分布

uniform(low,high,size) 产生具有均匀分布的数组,low为起始值,high为结束值,size为形状
normal(loc,scale,size) 产生具有正太分布的数组,loc为均值,scale为标准差,size为形状
poisson(lam,size) 产生具有泊松分布的数组,lam为随机事件发生率,size为形状

数组的随机变换

shuffle(a) 根据数组a的第1轴进行随机排列,改变数组x
permutation(a) 根据数组a的第1轴产生一个新的乱序数组,不改变数组x
choice(a[, size, replace, p]) 从一维数组a中以概率p抽取元素,形成size形状新数组 replace表示是否可以重用元素,默认为True

1.numpy.random.rand()

numpy.random.rand(d0,d1,…,dn)

  • rand函数根据给定维度生成[0,1)之间的数据,包含0,不包含1
  • dn表格每个维度
  • 返回值为指定维度的array
示例1:
import numpy as np
np.random.rand(4,2)

输出如下:

array([[ 0.47504803,  0.42937928],
       [ 0.14574222,  0.11560788],
       [ 0.25687586,  0.25580875],
       [ 0.94538806,  0.6959757 ]])
示例2:
np.random.rand(4,3,2) # shape: 4*3*2

输出如下:

array([[[ 0.08256277,  0.11408276],
        [ 0.11182496,  0.51452019],
        [ 0.09731856,  0.18279204]],

       [[ 0.74637005,  0.76065562],
        [ 0.32060311,  0.69410458],
        [ 0.28890543,  0.68532579]],

       [[ 0.72110169,  0.52517524],
        [ 0.32876607,  0.66632414],
        [ 0.45762399,  0.49176764]],

       [[ 0.73886671,  0.81877121],
        [ 0.03984658,  0.99454548],
        [ 0.18205926,  0.99637823]]])

2 numpy.random.randn()

numpy.random.randn(d0,d1,…,dn)

  • randn函数返回一个或一组样本,具有标准正态分布。
  • dn表格每个维度
  • 返回值为指定维度的array
示例1:
np.random.randn() # 当没有参数时,返回单个数据

输出如下:

-1.1241580894939212
示例2:
np.random.randn(2,4)

输出如下:

array([[ 0.27795239, -2.57882503,  0.3817649 ,  1.42367345],
       [-1.16724625, -0.22408299,  0.63006614, -0.41714538]])
示例3:
np.random.randn(4,3,2)

输出如下:

array([[[ 1.27820764,  0.92479163],
        [-0.15151257,  1.3428253 ],
        [-1.30948998,  0.15493686]],

       [[-1.49645411, -0.27724089],
        [ 0.71590275,  0.81377671],
        [-0.71833341,  1.61637676]],

       [[ 0.52486563, -1.7345101 ],
        [ 1.24456943, -0.10902915],
        [ 1.27292735, -0.00926068]],

       [[ 0.88303   ,  0.46116413],
        [ 0.13305507,  2.44968809],
        [-0.73132153, -0.88586716]]])

标准正态分布介绍

  • 标准正态分布—-standard normal distribution
  • 标准正态分布又称为u分布,是以0为均值、以1为标准差的正态分布,记为N(0,1)。

3 numpy.random.randint()

3.1 numpy.random.randint()

numpy.random.randint(low, high=None, size=None, dtype=’l’)

  • 返回随机整数,范围区间为[low,high),包含low,不包含high
  • 参数:low为最小值,high为最大值,size为数组维度大小,dtype为数据类型,默认的数据类型是np.int
  • high没有填写时,默认生成随机数的范围是[0,low)
np.random.randint(1,size=5) # 返回[0,1)之间的整数,所以只有0
array([0, 0, 0, 0, 0])
np.random.randint(1,5) # 返回1个[1,5)时间的随机整数
4
np.random.randint(-5,5,size=(2,2))
array([[ 2, -1],
       [ 2,  0]])

3.2 numpy.random.random_integers(在python3中被废弃)

numpy.random.random_integers(low, high=None, size=None)

  • 返回随机整数,范围区间为[low,high],包含low和high
  • 参数:low为最小值,high为最大值,size为数组维度大小
  • high没有填写时,默认生成随机数的范围是[1,low]

该函数在最新的numpy版本中已被替代,建议使用randint函数.

4 生成[0,1)之间的浮点数

  • numpy.random.random_sample(size=None)
  • numpy.random.random(size=None)
  • numpy.random.ranf(size=None)
  • numpy.random.sample(size=None)
print('-----------random_sample--------------')
print(np.random.random_sample(size=(2,2)))
print('-----------random--------------')
print(np.random.random(size=(2,2)))
print('-----------ranf--------------')
print(np.random.ranf(size=(2,2)))
print('-----------sample--------------')
print(np.random.sample(size=(2,2)))
-----------random_sample--------------
[[ 0.34966859  0.85655008]
 [ 0.16045328  0.87908218]]
-----------random--------------
[[ 0.25303772  0.45417512]
 [ 0.76053763  0.12454433]]
-----------ranf--------------
[[ 0.0379055   0.51288667]
 [ 0.71819639  0.97292903]]
-----------sample--------------
[[ 0.59942807  0.80211491]
 [ 0.36233939  0.12607092]]

5 numpy.random.choice()

numpy.random.choice(a, size=None, replace=True, p=None)

  • 从给定的一维数组中生成随机数
  • 参数: a为一维数组类似数据或整数;size为数组维度;p为数组中的数据出现的概率
  • a为整数时,对应的一维数组为np.arange(a)
np.random.choice(5,3)
array([4, 1, 4])
np.random.choice(5, 3, replace=False)
# 当replace为False时,生成的随机数不能有重复的数值
array([0, 3, 1])
np.random.choice(5,size=(3,2))
array([[1, 0],
       [4, 2],
       [3, 3]])
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3))
array([['moto', 'iphone', 'xiaomi'],
       ['lenovo', 'xiaomi', 'xiaomi'],
       ['xiaomi', 'lenovo', 'iphone']],
      dtype='<U7')
  • 参数p的长度与参数a的长度需要一致;
  • 参数p为概率,p里的数据之和应为1
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3), p=[0.1,0.6,0.1,0.1,0.1])
array([['sansumg', 'sansumg', 'sansumg'],
       ['sansumg', 'sansumg', 'sansumg'],
       ['sansumg', 'xiaomi', 'iphone']],
      dtype='<U7')

6 numpy.random.seed()

  • np.random.seed()的作用:使得随机数据可预测。
  • 当我们设置相同的seed,每次生成的随机数相同。如果不设置seed,则每次会生成不同的随机数
np.random.seed(0)
np.random.rand(5)
array([ 0.5488135 ,  0.71518937,  0.60276338,  0.54488318,  0.4236548 ])
np.random.seed(1676)
np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])
np.random.seed(1676)
np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])

7 常用分布

import numpy as np
from numpy import random as nr

#第一个参数是均值,第二个参数是标准差
r1 = nr.normal(100,10,size = (3,4))
print( r1)

#前两个参数分别是区间的初始值和终值
r2 = nr.uniform(0,10,size = (3,4))
print( r2)

#第一个参数为指定的lanbda系数
r3 = nr.poisson(2.0,size = (3,4))
print( r3)
[[  99.57619153  105.21599862  100.33290773  118.14849087]
 [ 104.39781654  102.75392659  109.68372436   97.67639048]
 [  98.9490583   106.2696648    92.47993056  106.39908356]]
[[ 9.069041    3.3715954   6.05280926  4.10175944]
 [ 6.23153336  7.84132131  8.01869299  2.45534397]
 [ 1.17173598  8.9285104   3.19890916  5.02223051]]
[[1 3 0 2]
 [3 2 1 1]
 [1 1 1 5]]

8 数组的随机变换

permutation()随机生成一个乱序数组,当参数是n时,返回[0,n)的乱序,他返回一个新数组。而shuffle()则直接将原数组打乱。choice()是从指定的样本中随机抽取。

import numpy as np
from numpy import random as nr

#只显示小数点后两位
np.set_printoptions(precision = 2)

#返回打乱数组,原数组不变
r1 = nr.randint(10,100,size = (3,4))
print( r1)
print( nr.permutation(r1))
print( r1)

print( nr.permutation(5))

# 使用shuffle打乱数组顺序
x = np.arange(10)
nr.shuffle(x)
print( x)

#xhoice()函数从指定数组中随机抽取样本
#size参数用于指定输出数组的大小
#replace参数为True时,进行可重复抽取,而False表示进行不可重复的抽取。默认为True
x = np.array(10)
c1 = nr.choice(x,size = (2,3))
print( c1)

c2 = nr.choice(x,5,replace = False)
print( c2)
[[11 55 88 51]
 [67 35 25 22]
 [60 10 10 60]]
[[11 55 88 51]
 [60 10 10 60]
 [67 35 25 22]]
[[11 55 88 51]
 [67 35 25 22]
 [60 10 10 60]]
[4 3 1 0 2]
[9 0 4 5 8 2 7 6 3 1]
[[6 9 3]
 [5 9 2]]
[8 0 2 3 4]

results matching ""

    No results matching ""