NumPy是Numerical Python的简称,是高性能科学计算和数据分析的基础包。NumPy主要功能包括:
ndarray:具有矢量运算和复杂广播能力的多维数组
用于对数组数据进行快速运算的标准数学函数
用于磁盘读写及内存映射文件的工具
线性代数、随机数生成及傅里叶变换
集成C、C++、Fortran等语言的代码工具
NumPy本身并没有提供高级的数据分析功能,但是理解Numpy数组以及面向数组的计算,将有助于高效的使用诸如pandas工具。
Numpy最重要的一个特点就是其N维数组对象(ndarray),它是一个快速而灵活的大数据集容器。
例如,[1,2,1]
是rank为1的数组,轴长为3.
[[ 1., 0., 0.],
[ 0., 1., 2.]]
是rank为2的数组,第1维长度为2,第2维长度为3.
ndarray是一个通用的同构数据多维容器,其中所有元素必须是相同类型。
每个数组都有一个shape(表示各维度大小)和一个dtype(表示数组数据类型)