深圳幻海软件技术有限公司 欢迎您!

详解Numpy中的数组

2023-02-28

Numpy定义NumPy(NumericalPython)是Python语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy通常与SciPy(ScientificPython)和Matplotlib(绘图库)一起使用,这种组合广泛用于替代MatLab

Numpy定义

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy 通常与 SciPy(Scientific Python)和 Matplotlib(绘图库)一起使用,这种组合广泛用于替代 MatLab,是一个强大的科学计算环境,有助于我们通过 Python 学习数据科学或者机器学习。

NumPy 主要应用包括:

机器学习模型:在编写机器学习算法时,需要对矩阵进行各种数值计算。例如矩阵乘法、换位、加法等。NumPy提供了一个非常好的库,用于简单(在编写代码方面)和快速(在速度方面)计算。NumPy数组用于存储训练数据和机器学习模型的参数。

图像处理和计算机图形学:计算机中的图像表示为多维数字数组。NumPy成为同样情况下最自然的选择。实际上,NumPy提供了一些优秀的库函数来快速处理图像。例如,镜像图像、按特定角度旋转图像等。

数学任务:NumPy对于执行各种数学任务非常有用,如数值积分、微分、内插、外推等。因此,当涉及到数学任务时,它形成了一种基于Python的MATLAB的快速替代。

为什么要用numpy

Python中提供了list容器,可以当作数组使用。但列表中的元素可以是任何对象,因此列表中保存的是对象的指针,这样一来,为了保存一个简单的列表[1,2,3]。就需要三个指针和三个整数对象。对于数值运算来说,这种结构显然不够高效。Python虽然也提供了array模块,但其只支持一维数组,不支持多维数组(在TensorFlow里面偏向于矩阵理解),也没有各种运算函数。因而不适合数值运算。NumPy的出现弥补了这些不足。(——摘自张若愚的《Python科学计算》)

详情请参考:

https://numpy.org/doc/stable/index.html

NumPy安装

因为numpy通常跟 scipy matplotlib一起使用,所以一起安装三个模块即可

pip3 install --user numpy scipy matplotlib

numpy array基础使用

np数组的创建

import numpy as np 
 
a = np.array([1,2,3,4]),#1行4列矩阵,即一维数组 
 
b = np.arange(4) # 1行4列矩阵,元素递增1的一维数组 
 
c = np.array([[1,2],[3,4]]) # 2行2列矩阵,即二维数组d = np.arange(4).reshape((2,2)) #变换输出 2行2列print (a) 
 
print(type(a)) #输出a的类型print (b) 
 
print (c) 
 
print (d) 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.

 分别输出:

[1 2 3 4] 
 
[0 1 2 3] 
 
[[1 2] 
 
[3 4]] 
 
[[0 1] 
 
[2 3]] 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.

np数组的广播

广播(Broadcast)是 numpy 对不同形状(shape)的数组进行数值计算的方式,对数组的算术运算通常在相应的元素上进行。如果两个数组 a 和 b 形状相同,即满足a.shape == b.shape,那么 a*b 的结果就是 a 与 b 数组对应位相乘。这要求维数相同,且各维度的长度相同。

例如代码

a = np.array([1,2,3]) 
b = np.array([10,20,30]) 
c = a * b 
print (c) 
  • 1.
  • 2.
  • 3.
  • 4.

 输出

[10 40 90] 
  • 1.

数组广播相加操作

a = np.array([[ 0, 0, 0], [10,10,10], [20,20,20], [30,30,30]]) #4x3 的二维数组 
b = np.array([1,2,3]) 
print(a + b) 
  • 1.
  • 2.
  • 3.

 输出

[[11 12 13] 
 
[2122 23]] 
  • 1.
  • 2.
  • 3.

 下面的图片展示了数组 b 如何通过广播来与数组 a 兼容。4x3 的二维数组与长为 3 的一维数组相加,等效于把数组 b 在二维上重复 4 次再运算:


np数组的切片和索引

ndarray对象的内容可以通过索引或切片来访问和修改,与 Python 中 list 的切片操作一样。ndarray数组可以基于0-n的下标进行索引,切片对象可以通过内置的 slice 函数,并设置 start, stop 及 step 参数进行,从原数组中切割出一个新数组。相信大家理解python list切片相关操作,一定会对该部分的内容感到熟悉,这里举几个经典的例子:

基础实例

import numpy as np 
a = np.arange(10) # [0 1 2 3 4 5 6 7 8 9] 
b = a[5] #下标5元素的值 
c = np.array([[1,2,3],[3,4,5],[6,7,8]])print(b) 
print(a[3:5]) #输出下标3-5的值,注意这里可以输出下限3,而不包括上限5 
print(c[0,0]) #输出第一行第一列的元素即[1,2,3]中的1 
print (c[...,1]) #第2列元素print (c[1,...]) # 第2行元素print (c[...,1:]) # 第2列及剩下的所有元素 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.

 输出


 
[3 4] 
 

 
[2 4 7] 
 
[3 4 5] 
 
[[2 3] 
 
[45] 
 
[78]] 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.

布尔索引实例

我们可以通过一个布尔数组来索引目标数组。布尔索引通过布尔运算(如:比较运算符)来获取符合指定条件的元素的数组。

c = np.array([[1,2,3],[3,4,5],[6,7,8]]) 
print (c[c > 3]) #打印出大于3的元素 
  • 1.
  • 2.

 输出

[4 5 6 7 8] 
  • 1.

numpy array遍历

直接上代码,普通一维数组

arr = np.array([1, 2, 3]) 
for x in arr: 
    print(x) 
  • 1.
  • 2.
  • 3.

 输出


 

 

  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

 定义一个numpy的二维数组,二维以上的数组这里不做讨论

arr = np.array([[1, 2, 3], [4, 5, 6]]) 
#遍历 
for x in arr: 
     print(x) 
  • 1.
  • 2.
  • 3.
  • 4.

 输出

[1 2 3] 
 
[4 5 6] 
  • 1.
  • 2.
  • 3.

如果想一个一个地输出每一个元素,可以这样编写代码

for x in arr: 
     for y in x: 
           print(y) 
  • 1.
  • 2.
  • 3.

 输出


 

 

 

 

 

  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.

 上面的方式比较麻烦,我们可以通过方法np.nditer实现一个一个地输出每一个元素

for x in np.nditer(arr): 
     print(x) 
  • 1.
  • 2.

 输出


 

 

 

 

 

  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.

numpy array元素过滤

实例,在np数组中,过滤大于2的元素

arr = np.array([1, 2, 3, 4]) 
newarr = arr[arr >2] 
print(newarr) 
  • 1.
  • 2.
  • 3.

 输出

[3 4] 
  • 1.

怎么样,是不是非常非常简单!

numpy array 关于字符的处理

如果np数组中存储的是字符,如果相对字符元素进行相关操作,需要使用api —np.char

有这样一个需求,把字符'0.01%','1.1%','1.21%' 中的%去掉,并把字符转型为float类型。如何实现呢?代码如下:

b=np.array(['0.01%','1.1%','1.21%']) 
newb=np.char.rstrip(b,'%').astype(float
print(newb) 
  • 1.
  • 2.
  • 3.

 输出

[0.01 1.1 1.21] 
  • 1.

其中:

rstrip表示删除某个字符

astype(float)表示把元素转型为float