NumPy - 数组操作

NumPy包中有几个函数用于处理ndarray对象中的元素。 它们可以分为以下类型:

修改形状

序号 形状及描述
1. reshape不改变数据的条件下修改形状
2. flat数组上的一维迭代器
3. flatten返回折叠为一维的数组副本
4. ravel返回连续的展开数组

numpy.reshape

这个函数在不改变数据的条件下修改形状,它接受如下参数:

numpy.reshape(arr, newshape, order')

其中:

  • arr :要修改形状的数组
  • newshape :整数或者整数数组,新的形状应当兼容原有形状
  • order'C' 为 C 风格顺序, 'F' 为 F 风格顺序, 'A' 为保留原顺序。

例子

import numpy as np
a = np.arange(8)
print('原始数组:')
print(a)
print ('\n')

b = a.reshape(4,2)
print( '修改后的数组:')
print( b)

输出如下:

原始数组:
[0 1 2 3 4 5 6 7]

修改后的数组:
[[0 1]
 [2 3]
 [4 5]
 [6 7]]

numpy.ndarray.flat

该函数返回数组上的一维迭代器,行为类似 Python 内建的迭代器。

例子

import numpy as np
a = np.arange(8).reshape(2,4)
print('原始数组:')
print(a)
print('\n')

print( '调用 flat 函数之后:')
# 返回展开数组中的下标的对应元素
print(a.flat[5])

输出如下:

原始数组:
[[0 1 2 3]
 [4 5 6 7]]

调用 flat 函数之后:
5

numpy.ndarray.flatten

该函数返回折叠为一维的数组副本,函数接受下列参数:

ndarray.flatten(order)

其中:

  • order'C' -- 按行, 'F' -- 按列, 'A' -- 原顺序, 'k' -- 元素在内存中的出现顺序。

例子

import numpy as np
a = np.arange(8).reshape(2,4)

print ('原数组:')
print (a)
print ('\n')
# default is column-major

print ('展开的数组:')
print (a.flatten())
print ('\n')

print ('以 F 风格顺序展开的数组:')
print (a.flatten(order = 'F'))

输出如下:

原数组:
[[0 1 2 3]
 [4 5 6 7]]

展开的数组:
[0 1 2 3 4 5 6 7]

以 F 风格顺序展开的数组:
[0 4 1 5 2 6 3 7]

numpy.ravel

这个函数返回展开的一维数组,并且按需生成副本。返回的数组和输入数组拥有相同数据类型。这个函数接受两个参数。

numpy.ravel(a, order)

构造器接受下列参数:

  • order'C' -- 按行, 'F' -- 按列, 'A' -- 原顺序, 'k' -- 元素在内存中的出现顺序。

例子

import numpy as np
a = np.arange(8).reshape(2,4)

print ('原数组:')
print (a)
print ('\n')

print ('调用 ravel 函数之后:')
print (a.ravel())
print ('\n')

print ('以 F 风格顺序调用 ravel 函数之后:')
print (a.ravel(order = 'F'))
原数组:
[[0 1 2 3]
 [4 5 6 7]]

调用 ravel 函数之后:
[0 1 2 3 4 5 6 7]

以 F 风格顺序调用 ravel 函数之后:
[0 4 1 5 2 6 3 7]

翻转操作

序号 操作及描述
1. transpose翻转数组的维度
2. ndarray.Tself.transpose()相同
3. rollaxis向后滚动指定的轴
4. swapaxes互换数组的两个轴

numpy.transpose

这个函数翻转给定数组的维度。如果可能的话它会返回一个视图。函数接受下列参数:

numpy.transpose(arr, axes)

其中:

  • arr :要转置的数组
  • axes :整数的列表,对应维度,通常所有维度都会翻转。

例子

import numpy as np
a = np.arange(12).reshape(3,4)

print ('原数组:')
print (a)
print ('\n')

print ('转置数组:')
print (np.transpose(a))

输出如下:

原数组:
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]]

转置数组:
[[ 0 4 8]
 [ 1 5 9]
 [ 2 6 10]
 [ 3 7 11]]

numpy.ndarray.T

该函数属于ndarray类,行为类似于numpy.transpose

例子

import numpy as np
a = np.arange(12).reshape(3,4)

print ('原数组:')
print (a)
print ('\n')

print ('转置数组:')
print (a.T)

输出如下:

原数组:
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]]

转置数组:
[[ 0 4 8]
 [ 1 5 9]
 [ 2 6 10]
 [ 3 7 11]]

numpy.rollaxis

该函数向后滚动特定的轴,直到一个特定位置。这个函数接受三个参数:

numpy.rollaxis(arr, axis, start)

其中:

  • arr :输入数组
  • axis :要向后滚动的轴,其它轴的相对位置不会改变
  • start :默认为零,表示完整的滚动。会滚动到特定位置。

例子

# 创建了三维的 ndarray
import numpy as np
a = np.arange(8).reshape(2,2,2)

print ('原数组:')
print (a)
print ('\n')
# 将轴 2 滚动到轴 0(宽度到深度)

print ('调用 rollaxis 函数:')
print (np.rollaxis(a,2))
# 将轴 0 滚动到轴 1:(宽度到高度)
print ('\n')

print ('调用 rollaxis 函数:')
print (np.rollaxis(a,2,1))

输出如下:

原数组:
[[[0 1]
 [2 3]]
 [[4 5]
 [6 7]]]

调用 rollaxis 函数:
[[[0 2]
 [4 6]]
 [[1 3]
 [5 7]]]

调用 rollaxis 函数:
[[[0 2]
 [1 3]]
 [[4 6]
 [5 7]]]

numpy.swapaxes

该函数交换数组的两个轴。对于 1.10 之前的 NumPy 版本,会返回交换后数组的试图。这个函数接受下列参数:

numpy.swapaxes(arr, axis1, axis2)
  • arr :要交换其轴的输入数组
  • axis1 :对应第一个轴的整数
  • axis2 :对应第二个轴的整数
# 创建了三维的 ndarray
import numpy as np
a = np.arange(8).reshape(2,2,2)

print ('原数组:')
print (a)
print ('\n')
# 现在交换轴 0(深度方向)到轴 2(宽度方向)

print ('调用 swapaxes 函数后的数组:')
print (np.swapaxes(a, 2, 0))

输出如下:

原数组:
[[[0 1]
 [2 3]]

 [[4 5]
  [6 7]]]

调用 swapaxes 函数后的数组:
[[[0 4]
 [2 6]]

 [[1 5]
  [3 7]]]

修改维度

序号 维度和描述
1. broadcast产生模仿广播的对象
2. broadcast_to将数组广播到新形状
3. expand_dims扩展数组的形状
4. squeeze从数组的形状中删除单维条目

broadcast

如前所述,NumPy 已经内置了对广播的支持。 此功能模仿广播机制。 它返回一个对象,该对象封装了将一个数组广播到另一个数组的结果。

该函数使用两个数组作为输入参数。 下面的例子说明了它的用法。

import numpy as np
x = np.array([[1], [2], [3]])
y = np.array([4, 5, 6])  

# 对 y 广播 x
b = np.broadcast(x,y)  
# 它拥有 iterator 属性,基于自身组件的迭代器元组

print '对 y 广播 x:'
r,c = b.iters
print r.next(), c.next()
print r.next(), c.next()
print '\n'  
# shape 属性返回广播对象的形状

print '广播对象的形状:'
print b.shape
print '\n'  
# 手动使用 broadcast 将 x 与 y 相加
b = np.broadcast(x,y)
c = np.empty(b.shape)

print '手动使用 broadcast 将 x 与 y 相加:'
print c.shape
print '\n'  
c.flat = [u + v for (u,v) in b]

print '调用 flat 函数:'
print c
print '\n'  
# 获得了和 NumPy 内建的广播支持相同的结果

print 'x 与 y 的和:'
print x + y

输出如下:

对 y 广播 x:
1 4
1 5

广播对象的形状:
(3, 3)

手动使用 broadcast 将 x 与 y 相加:
(3, 3)

调用 flat 函数:
[[ 5. 6. 7.]
 [ 6. 7. 8.]
 [ 7. 8. 9.]]

x 与 y 的和:
[[5 6 7]
 [6 7 8]
 [7 8 9]]

numpy.broadcast_to

此函数将数组广播到新形状。 它在原始数组上返回只读视图。 它通常不连续。 如果新形状不符合 NumPy 的广播规则,该函数可能会抛出ValueError

注意 - 此功能可用于 1.10.0 及以后的版本。

该函数接受以下参数。

numpy.broadcast_to(array, shape, subok)

例子

import numpy as np
a = np.arange(4).reshape(1,4)

print ('原数组:')
print (a)
print ('\n')

print ('调用 broadcast_to 函数之后:')
print (np.broadcast_to(a,(4,4)))

输出如下:

[[0  1  2  3]
 [0  1  2  3]
 [0  1  2  3]
 [0  1  2  3]]

numpy.expand_dims

函数通过在指定位置插入新的轴来扩展数组形状。该函数需要两个参数:

numpy.expand_dims(arr, axis)

其中:

  • arr :输入数组
  • axis :新轴插入的位置

例子

import numpy as np
x = np.array([[1], [2], [3]])
y = np.array([4, 5, 6])

# 对 y 广播 x
b = np.broadcast(x,y)
# 它拥有 iterator 属性,基于自身组件的迭代器元组

print ('对 y 广播 x:')
r,c = b.iters
#print (r.next(), c.next())
#print (r.next(), c.next())
print ('\n')
# shape 属性返回广播对象的形状

print ('广播对象的形状:')
print (b.shape)
print ('\n')
# 手动使用 broadcast 将 x 与 y 相加
b = np.broadcast(x,y)
c = np.empty(b.shape)

print ('手动使用 broadcast 将 x 与 y 相加:')
print (c.shape)
print ('\n')
c.flat = [u + v for (u,v) in b]

print ('调用 flat 函数:')
print (c)
print ('\n')
# 获得了和 NumPy 内建的广播支持相同的结果

print ('x 与 y 的和:')
print (x + y)

输出如下:

数组 x:
[[1 2]
 [3 4]]

数组 y:
[[[1 2]
 [3 4]]]

数组 x 和 y 的形状:
(2, 2) (1, 2, 2)

在位置 1 插入轴之后的数组 y:
[[[1 2]]
 [[3 4]]]

x.shape 和 y.shape:
2 3

x.shape and y.shape:
(2, 2) (2, 1, 2)

numpy.squeeze

函数从给定数组的形状中删除一维条目。 此函数需要两个参数。

numpy.squeeze(arr, axis)

其中:

  • arr :输入数组
  • axis :整数或整数元组,用于选择形状中单一维度条目的子集

例子

import numpy as np
x = np.arange(9).reshape(1,3,3)

print ('数组 x:')
print (x)
print ('\n')
y = np.squeeze(x)

print ('数组 y:')
print (y)
print ('\n')

print ('数组 x 和 y 的形状:')
print (x.shape, y.shape)

输出如下:

数组 x:
[[[0 1 2]
 [3 4 5]
 [6 7 8]]]

数组 y:
[[0 1 2]
 [3 4 5]
 [6 7 8]]

数组 x 和 y 的形状:
(1, 3, 3) (3, 3)

数组的连接

序号 数组及描述
1. concatenate沿着现存的轴连接数据序列
2. stack沿着新轴连接数组序列
3. hstack水平堆叠序列中的数组(列方向)
4. vstack竖直堆叠序列中的数组(行方向)

numpy.concatenate

数组的连接是指连接。 此函数用于沿指定轴连接相同形状的两个或多个数组。 该函数接受以下参数。

numpy.concatenate((a1, a2, ...), axis)

其中:

  • a1, a2, ... :相同类型的数组序列
  • axis :沿着它连接数组的轴,默认为 0

例子

import numpy as np
a = np.array([[1,2],[3,4]])

print ('第一个数组:')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])

print ('第二个数组:')
print (b)
print ('\n')
# 两个数组的维度相同

print ('沿轴 0 连接两个数组:')
print (np.concatenate((a,b)))
print ('\n')

print ('沿轴 1 连接两个数组:')
print (np.concatenate((a,b),axis = 1))

输出如下:

第一个数组:
[[1 2]
 [3 4]]

第二个数组:
[[5 6]
 [7 8]]

沿轴 0 连接两个数组:
[[1 2]
 [3 4]
 [5 6]
 [7 8]]

沿轴 1 连接两个数组:
[[1 2 5 6]
 [3 4 7 8]]

numpy.stack

此函数沿新轴连接数组序列。 此功能添加自 NumPy 版本 1.10.0。 需要提供以下参数。

numpy.stack(arrays, axis)

其中:

  • arrays :相同形状的数组序列
  • axis :返回数组中的轴,输入数组沿着它来堆叠
import numpy as np
a = np.array([[1,2],[3,4]])

print ('第一个数组:')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])

print ('第二个数组:')
print (b)
print ('\n')

print ('沿轴 0 堆叠两个数组:')
print (np.stack((a,b),0))
print ('\n')

print ('沿轴 1 堆叠两个数组:')
print (np.stack((a,b),1))

输出如下:

第一个数组:
[[1 2]
 [3 4]]

第二个数组:
[[5 6]
 [7 8]]

沿轴 0 堆叠两个数组:
[[[1 2]
 [3 4]]
 [[5 6]
 [7 8]]]

沿轴 1 堆叠两个数组:
[[[1 2]
 [5 6]]
 [[3 4]
 [7 8]]]

numpy.hstack

numpy.stack函数的变体,通过堆叠来生成水平的单个数组。

例子

import numpy as np
a = np.array([[1,2],[3,4]])

print ('第一个数组:')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])

print ('第二个数组:')
print (b)
print ('\n')

print ('水平堆叠:')
c = np.hstack((a,b))
print (c)
print ('\n')

输出如下:

第一个数组:
[[1 2]
 [3 4]]

第二个数组:
[[5 6]
 [7 8]]

水平堆叠:
[[1 2 5 6]
 [3 4 7 8]]

numpy.vstack

numpy.stack函数的变体,通过堆叠来生成竖直的单个数组。

import numpy as np
a = np.array([[1,2],[3,4]])

print ('第一个数组:')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])

print ('第二个数组:')
print (b)
print ('\n')

print ('竖直堆叠:')
c = np.vstack((a,b))
print (c)

输出如下:

第一个数组:
[[1 2]
 [3 4]]

第二个数组:
[[5 6]
 [7 8]]

竖直堆叠:
[[1 2]
 [3 4]
 [5 6]
 [7 8]]

数组分割

序号 数组及操作
1. split将一个数组分割为多个子数组
2. hsplit将一个数组水平分割为多个子数组(按列)
3. vsplit将一个数组竖直分割为多个子数组(按行)

numpy.split

该函数沿特定的轴将数组分割为子数组。函数接受三个参数:

numpy.split(ary, indices_or_sections, axis)

其中:

  • ary :被分割的输入数组
  • indices_or_sections :可以是整数,表明要从输入数组创建的,等大小的子数组的数量。 如果此参数是一维数组,则其元素表明要创建新子数组的点。
  • axis :默认为 0

例子

import numpy as np
a = np.arange(9)

print ('第一个数组:')
print (a)
print ('\n')

print ('将数组分为三个大小相等的子数组:')
b = np.split(a,3)
print (b)
print ('\n')

print ('将数组在一维数组中表明的位置分割:')
b = np.split(a,[4,7])
print (b)

输出如下:

第一个数组:
[0 1 2 3 4 5 6 7 8]

将数组分为三个大小相等的子数组:
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]

将数组在一维数组中表明的位置分割:
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8])]

numpy.hsplit

numpy.hsplitsplit()函数的特例,其中轴为 1 表示水平分割,无论输入数组的维度是什么。

import numpy as np
a = np.arange(16).reshape(4,4)

print ('第一个数组:')
print (a)
print ('\n')

print ('水平分割:')
b = np.hsplit(a,2)
print (b)
print ('\n')

输出:

第一个数组:
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]
 [12 13 14 15]]

水平分割:                                                         
[array([[ 0,  1],                                                             
       [ 4,  5],                                                              
       [ 8,  9],                                                              
       [12, 13]]), array([[ 2,  3],                                           
       [ 6,  7],                                                              
       [10, 11],                                                              
       [14, 15]])]

numpy.vsplit

numpy.vsplitsplit()函数的特例,其中轴为 0 表示竖直分割,无论输入数组的维度是什么。下面的例子使之更清楚。

import numpy as np
a = np.arange(16).reshape(4,4)

print ('第一个数组:')
print (a)
print ('\n')

print ('竖直分割:')
b = np.vsplit(a,2)
print (b)

输出如下:

第一个数组:
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]
 [12 13 14 15]]

竖直分割:                                                           
[array([[0, 1, 2, 3],                                                         
       [4, 5, 6, 7]]), array([[ 8,  9, 10, 11],                               
       [12, 13, 14, 15]])]

添加/删除元素

序号 元素及描述
1. resize返回指定形状的新数组
2. append将值添加到数组末尾
3. insert沿指定轴将值插入到指定下标之前
4. delete返回删掉某个轴的子数组的新数组
5. unique寻找数组内的唯一元素

numpy.resize

此函数返回指定大小的新数组。 如果新大小大于原始大小,则包含原始数组中的元素的重复副本。 该函数接受以下参数。

numpy.resize(arr, shape)

其中:

  • arr :要修改大小的输入数组
  • shape :返回数组的新形状

例子

import numpy as np
a = np.array([[1,2,3],[4,5,6]])

print ('第一个数组:')
print (a)
print ('\n')

print ('第一个数组的形状:')
print (a.shape)
print ('\n')
b = np.resize(a, (3,2))

print ('第二个数组:')
print (b)
print ('\n')

print ('第二个数组的形状:')
print (b.shape)
print ('\n')
# 要注意 a 的第一行在 b 中重复出现,因为尺寸变大了

print ('修改第二个数组的大小:')
b = np.resize(a,(3,3))
print (b)

输出如下:

第一个数组:
[[1 2 3]
 [4 5 6]]

第一个数组的形状:
(2, 3)

第二个数组:
[[1 2]
 [3 4]
 [5 6]]

第二个数组的形状:
(3, 2)

修改第二个数组的大小:
[[1 2 3]
 [4 5 6]
 [1 2 3]]

numpy.append

此函数在输入数组的末尾添加值。 附加操作不是原地的,而是分配新的数组。 此外,输入数组的维度必须匹配否则将生成ValueError

函数接受下列函数:

numpy.append(arr, values, axis)

其中:

  • arr :输入数组
  • values :要向 arr 添加的值,比如和 arr 形状相同(除了要添加的轴)
  • axis :沿着它完成操作的轴。如果没有提供,两个参数都会被展开。

例子

import numpy as np
a = np.array([[1,2,3],[4,5,6]])

print ('第一个数组:')
print (a)
print ('\n')

print ('向数组添加元素:')
print (np.append(a, [7,8,9]))
print ('\n')

print ('沿轴 0 添加元素:')
print (np.append(a, [[7,8,9]],axis = 0))
print ('\n')

print ('沿轴 1 添加元素:')
print (np.append(a, [[5,5,5],[7,8,9]],axis = 1))

输出如下:

第一个数组:
[[1 2 3]
 [4 5 6]]

向数组添加元素:
[1 2 3 4 5 6 7 8 9]

沿轴 0 添加元素:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

沿轴 1 添加元素:
[[1 2 3 5 5 5]
 [4 5 6 7 8 9]]

numpy.insert

此函数在给定索引之前,沿给定轴在输入数组中插入值。 如果值的类型转换为要插入,则它与输入数组不同。 插入没有原地的,函数会返回一个新数组。 此外,如果未提供轴,则输入数组会被展开。

insert()函数接受以下参数:

numpy.insert(arr, obj, values, axis)

其中:

  • arr :输入数组
  • obj :在其之前插入值的索引
  • values :要插入的值
  • axis :沿着它插入的轴,如果未提供,则输入数组会被展开

例子

import numpy as np
a = np.array([[1,2],[3,4],[5,6]])

print ('第一个数组:')
print (a)
print ('\n')

print ('未传递 Axis 参数。 在插入之前输入数组会被展开。')
print (np.insert(a,3,[11,12]))
print ('\n')
print ('传递了 Axis 参数。 会广播值数组来配输入数组。')

print ('沿轴 0 广播:')
print (np.insert(a,1,[11],axis = 0))
print ('\n')

print ('沿轴 1 广播:')
print (np.insert(a,1,11,axis = 1))

numpy.delete

此函数返回从输入数组中删除指定子数组的新数组。 与insert()函数的情况一样,如果未提供轴参数,则输入数组将展开。 该函数接受以下参数:

Numpy.delete(arr, obj, axis)

其中:

  • arr :输入数组
  • obj :可以被切片,整数或者整数数组,表明要从输入数组删除的子数组
  • axis :沿着它删除给定子数组的轴,如果未提供,则输入数组会被展开

例子

import numpy as np
a = np.arange(12).reshape(3,4)

print ('第一个数组:')
print (a)
print ('\n')

print ('未传递 Axis 参数。 在插入之前输入数组会被展开。')
print (np.delete(a,5))
print ('\n')

print ('删除第二列:')
print (np.delete(a,1,axis = 1))
print ('\n')

print ('包含从数组中删除的替代值的切片:')
a = np.array([1,2,3,4,5,6,7,8,9,10])
print (np.delete(a, np.s_[::2]))

输出如下:

第一个数组:
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]]

未传递 Axis 参数。 在插入之前输入数组会被展开。
[ 0 1 2 3 4 6 7 8 9 10 11]

删除第二列:
[[ 0 2 3]
 [ 4 6 7]
 [ 8 10 11]]

包含从数组中删除的替代值的切片:
[ 2 4 6 8 10]

numpy.unique

此函数返回输入数组中的去重元素数组。 该函数能够返回一个元组,包含去重数组和相关索引的数组。 索引的性质取决于函数调用中返回参数的类型。

numpy.unique(arr, return_index, return_inverse, return_counts)

其中:

  • arr :输入数组,如果不是一维数组则会展开
  • return_index :如果为 true ,返回输入数组中的元素下标
  • return_inverse :如果为 true ,返回去重数组的下标,它可以用于重构输入数组
  • return_counts :如果为 true ,返回去重数组中的元素在原数组中的出现次数

例子

import numpy as np
a = np.array([5,2,6,2,7,5,6,8,2,9])

print ('第一个数组:')
print (a)
print ('\n')

print ('第一个数组的去重值:')
u = np.unique(a)
print (u)
print ('\n')

print ('去重数组的索引数组:')
u,indices = np.unique(a, return_index = True)
print (indices)
print ('\n')

print ('我们可以看到每个和原数组下标对应的数值:')
print (a)
print ('\n')

print ('去重数组的下标:')
u,indices = np.unique(a,return_inverse = True)
print (u)
print ('\n')

print ('下标为:')
print (indices)
print ('\n')

print ('使用下标重构原数组:')
print (u[indices])
print ('\n')

print ('返回去重元素的重复数量:')
u,indices = np.unique(a,return_counts = True)
print (u)
print (indices)

输出如下:

第一个数组:
[5 2 6 2 7 5 6 8 2 9]

第一个数组的去重值:
[2 5 6 7 8 9]

去重数组的索引数组:
[1 0 2 4 7 9]

我们可以看到每个和原数组下标对应的数值:
[5 2 6 2 7 5 6 8 2 9]

去重数组的下标:
[2 5 6 7 8 9]

下标为:
[1 0 2 0 3 1 2 4 0 5]

使用下标重构原数组:
[5 2 6 2 7 5 6 8 2 9]

返回唯一元素的重复数量:
[2 5 6 7 8 9]
 [3 2 2 1 1 1]

results matching ""

    No results matching ""