numpy
提供了简单灵活的接口,用于优化数据数组的计算。
通用计算最大的优势在于通过向量化操作,将循环推送至numpy
之下的编译层,从而取得更快的执行效率。
numpy
的通用计算让我们计算数组时就像计算单独一个变量一样,
不用写循环去遍历数组中的各个元素。
比如,对于一般的python
二维数组,我们要给数组中每个值加1:
l = [[1, 2], [3, 4]]
print(l)
#运行结果
[[1, 2], [3, 4]]
for i in range(len(l)):
for j in range(len(l[i])):
l[i][j] += 1
print(l)
#运行结果
[[2, 3], [4, 5]]
如果用numpy的通用计算的话:
import numpy as np
l = np.array([[1,2], [3,4]])
print(l)
#运行结果
[[1, 2], [3, 4]]
l = l + 1
print(l)
#运行结果
[[2, 3], [4, 5]]
算术计算是最基本的,numpy
数组支持直接用运算符或者通用函数来进行运算。
运算符 | 通用函数 | 说明 |
---|---|---|
+ | np.add | 加法运算 |
- | np.subtract | 减法运算 |
* | np.multiply | 乘法运算 |
/ | np.divide | 除法运算 |
// | np.floor_divide | 向下整除运算 |
** | np.power | 指数运算 |
% | np.mod | 模运算 |
算术运算比较简单,就不一一演示各个运算符了。
需要注意的一点是,当numpy
数组和单一数字运算时,数组中每个元素都单独和此数字运算。
arr = np.array([[1,2], [3, 4]])
print(arr)
#运行结果
[[1 2]
[3 4]]
print(arr * 2)
#运行结果
[[2 4]
[6 8]]
arr * 2
相当于arr中每个元素都 * 2
。
当numpy
数组和另一个numpy
数组运算时,是两个数组对应位置的元素进行运算。
这就要求两个数组的 shape
要一样,否则会出错。
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[1, 0], [0, 1]])
print(arr1, arr2)
#运行结果
[[1 2]
[3 4]]
[[1 0]
[0 1]]
print(arr1 * arr2)
#运行结果
[[1 0]
[0 4]]
对应元素相乘,所以只保留了对角线上的元素。
除了常用的算术运算,numpy
的数组支持各类三角函数运算。
下面演示几个常用的三角函数:
arr = np.array([0, np.pi/6, np.pi/4, np.pi/2])
print("sin(arr) = ", np.sin(arr))
print("cos(arr) = ", np.cos(arr))
print("tan(arr) = ", np.tan(arr))
#运行结果
sin(arr) = [0. 0.5 0.70710678 1. ]
cos(arr) = [1.00000000e+00 8.66025404e-01 7.07106781e-01 6.12323400e-17]
tan(arr) = [0.00000000e+00 5.77350269e-01 1.00000000e+00 1.63312394e+16]
arr = np.array([-1, 0, 1])
print("arcsin(arr) = ", np.arcsin(arr))
print("arccos(arr) = ", np.arccos(arr))
print("arctan(arr) = ", np.arctan(arr))
#运行结果
arcsin(arr) = [-1.57079633 0. 1.57079633]
arccos(arr) = [3.14159265 1.57079633 0. ]
arctan(arr) = [-0.78539816 0. 0.78539816]
常用的指数和对数如下:
x = np.array([1, 2, 4, 10])
print("e^x = ", np.exp(x))
print("2^x = ", np.exp2(x))
print("3^x = ", np.power(3, x))
#运行结果
e^x = [2.71828183e+00 7.38905610e+00 5.45981500e+01 2.20264658e+04]
2^x = [ 2. 4. 16. 1024.]
3^x = [ 3 9 81 59049]
print("ln(x) = ", np.log(x))
print("log2(x) = ", np.log2(x))
print("log10(x) = ", np.log10(x))
#运行结果
ln(x) = [0. 0.69314718 1.38629436 2.30258509]
log2(x) = [0. 1. 2. 3.32192809]
log10(x) = [0. 0.30103 0.60205999 1. ]
除了通用的计算方法,还有一些特性也很有用。
下面介绍两个常用的特性,一个可以节约内存,提高程序的运行效率;另一个可以简化编码,提高程序的编写效率。
进行两个数组的计算时,比如x
数组和y
数组,计算的结果常常要用新的数组(比如z
数组)来保存。
如果计算之后x
数组或y
数组不再需要的话,我们可以把运算结果保存在x
数组或y
数组中,这样就不用申请信的内存。
x = np.random.randint(1, 10, (3,3))
y = np.random.randint(1, 10, (3,3))
print(x)
print(y)
#运行结果
[[3 9 3]
[8 6 9]
[9 7 4]]
[[4 4 5]
[1 6 6]
[2 5 6]]
np.multiply(x, y, out=y)
print(x)
print(y)
#运行结果
[[3 9 3]
[8 6 9]
[9 7 4]]
[[12 36 15]
[ 8 36 54]
[18 35 24]]
设置参数 out=y
,可以看到计算结果保存在了y
数组中。
对于任意一个数组,按行或者列聚合合计值时:
x = np.random.randint(1, 10, (3,3))
print(x)
#运行结果
[[8 6 5]
[4 8 4]
[9 2 3]]
#每列的合计值
print(np.add.reduce(x))
#运行结果
[21 16 12]
#每行的合计值
print(np.add.reduce(x, axis=1))
#运行结果
[19 16 14]
上面是用np.add
来聚合的,也可以使用 np.multiply
,np.divide
等等前面介绍的各种算术计算。
除了聚合合计值,numpy
还提供了一个可以计算合计过程中每步计算结果的方法accumulate
。
x = np.random.randint(1, 10, 5)
print(x)
#运算结果
[6 1 6 9 7]
print(np.add.accumulate(x))
#运算结果:[x[0], x[0]+x[1], x[0]+x[1]+x[2]...]
[ 6 7 13 22 29]
print(np.multiply.accumulate(x))
#运算结果:[x[0], x[0]*x[1], x[0]*x[1]*x[2]...]
[6 6 36 324 2268]
本篇主要介绍了 numpy
数组的通用计算方法,通用计算把数组元素循环的复杂度封装起来,让我们用直观的方式计算数组,更容易实现各种数学公式和定理。
本篇介绍的算术计算,三角函数,以及指数和对数等常用的方法,但不是全部的通用计算方法,更加复杂的微分和积分计算请参考官方的文档。