用于 Python 数据分析的 Numpy(保姆级教程)

一、前言

在数据处理中,我们肯定离不开矩阵计算。那么在Python中如何操作矩阵呢?
那就有请今天的主角——numpy

二、前提准备

需要在你使用的Python解释器上,安装numpy包。
(1)Win + R

(2)然后在Windows终端中输入如下命令,回车即可。

pip install numpy

三、具体使用

1.numpy的属性

# coding:utf-8
import numpy as np
"""
    numpy的属性
"""

# 将列表转化成一个numpy的矩阵
array = np.array([[1, 2, 3],
                  [4, 5, 6]])
# 输出矩阵
print(array)
# 输出矩阵的维数
print("dim", array.ndim)
# 输出矩阵形状
print("shape", array.shape)
# 输出矩阵尺寸(元素总个数)
print("size", array.size)

2.numpy中的创建array

(1)矩阵和列表的区别

# coding:utf-8
import numpy as np

"""
    输出矩阵的各种形式!!!!
"""

#   矩阵输出出来,中间没有逗号;
#     而列表打印出来会有逗号
a_list = [1, 2, 3]
print(a_list)
a_np_array = np.array([1, 2, 3])
print(a_np_array)

(2)设定矩阵中数值的类型

# dtype是用来设定矩阵中数值的数据类型
a = np.array([[1, 2, 3], [4, 5, 6]], dtype=np.int64)
print(a.dtype)
print(a)

(3)生成规定形状的、元素都为0的矩阵

# 生成3行4列的零矩阵
b = np.zeros((3, 4))
print(b)

(4)生成规定形状的、元素都为1的矩阵

# 生成数值全部是1的矩阵
c = np.ones((2,4), dtype=np.int32)
print(c)

(5)生成规定形状的、元素都为empty(实际元素都接近于0)的矩阵

# # 输出empty的矩阵
d = np.empty((3,4))
print(d)

(6)生成顺序数值的矩阵

# 输出顺序的矩阵,生成数据类比range; 从10到20,左闭右开,步长为2
e = np.arange(10, 20, 2)
print(e)

(7)修改矩阵形状

# 输出顺序的矩阵,按顺序以三行四列的格式进行输出
f = np.arange(12).reshape(3, 4)
print(f)

(8)按规定生成“线段”数值的矩阵

# 输出线段,1是起始值,10是终止值,6是生成数值个数,从1到10生成6个数,并且他们之间是等距的
# 自动匹配步长
g = np.linspace(1, 10, 6).reshape(2, 3)
print(g)

3.numpy的基础运算

(1)矩阵减法(对应元素相减)

# coding:utf-8
import random

import numpy as np
"""
    numpy的基础运算
"""

a = np.array([10, 20, 30, 40])
b = np.arange(4)
print("a矩阵", a)
print("b矩阵", b)
# 矩阵减法
c = a - b
print("c矩阵", c)

(2)矩阵加法(对应元素相加)

# 矩阵加法
d = a + b
print("d矩阵", d)

(3)矩阵数值平方运算

# 进行平方
e = b**2
print("e矩阵", e)

(4)矩阵各个元素求三角函数

# 调用numpy中的三角函数, sin ,cos ,tan
f = np.sin(a)
print(f)

(5)判断矩阵中哪些值是小于某个数的

# 判断矩阵中哪些值是小于3的
# 小于号可以换成其他,比如==,>
print(b)
print(b<3)

(6)矩阵之间数值逐个相乘

g = np.array([[1, 1],
              [0, 1]])
h = np.arange(4).reshape((2,2))

print(g)
print(h)

# 每个元素挨个相乘
i = g * h
print(i)

(6)矩阵乘(线性代数中的矩阵乘)

# 矩阵相乘
j = np.dot(g, h)
print(j)

# 矩阵相乘的另一种形式
k = g.dot(h)
print(k)

(7)生成规定形状的随机数矩阵

# 生成随机数矩阵,(2,4)表示矩阵形状,元素值的范围是0~1
l = np.random.random((2,4))
print(l)

(8)矩阵中所有元素求和、求最大值、求最小值

# 对矩阵中的数值进行求和、求最大值、求最小值
# 矩阵中所有元素进行求和
print(np.sum(l))
# 矩阵中的最大值
print(np.max(l))
# 矩阵中的最小值
print(np.min(l))

(9)对矩阵中指定行和列进行求和、求最大值、求最小值

# 对指定行和列进行求和、求最大值、求最小值
# 其中axis参数值为0时,代表列;参数值为1时,代表行
print(np.sum(l, axis=1))
print(np.max(l, axis=0))
print(np.min(l, axis=1))

(10)求矩阵中最小值和最大值的索引

# coding:utf-8
import numpy as np
"""
    numpy中的运算
"""

# 生成顺序数值,并设定为三行四列
A = np.arange(2, 14).reshape(3, 4)
print(A)
# 输出矩阵中数值最小的那个值所在的索引
print(np.argmin(A))
# 最大值对应的索引
print(np.argmax(A))

(11)求矩阵中元素的平均数和中位数

# 输出矩阵中的平均数
print(np.mean(A))

# 另外几种形式
print(A.mean())
print(np.average(A))
# 输出矩阵中的中位数
print(np.median(A))

(12)矩阵中前几项的累计

# 矩阵中前几项的累计
print(np.cumsum(A))

(13)矩阵中元素后一项与前一项的差值

# 矩阵数值之间,每两个数值之间的差值
print(np.diff(A))

(14)以行数组和列数组,输出矩阵中非0数值

# 以行数组和列数组,输出矩阵中非0数值
print(np.nonzero(A))

(15)对矩阵进行逐行排序

B = np.array([[5, 9, 2],
              [1, 0, 7]])
print(B)
# 使用sort对矩阵数值进行 逐行排序
print(np.sort(B))

(16)对矩阵进行转置

# 对矩阵进行转置
print(np.transpose(A))
print(A.T)

(17)矩阵数值的“截断”

# 矩阵中小于5的值全部变成5;大于9的值全部变成9,位于5到9之间的数值,保持不变
print(np.clip(A, 5, 9))

(18)对矩阵中行元素求平均、对列元素求平均

# 对行算平均值,对列算平均值
# 参数为0是对行算平均值,参数为1是对列算平均值
print(np.mean(A, axis=0)) # 对列
print(np.mean(A, axis=1)) # 对行

4.numpy的索引

(1)通过索引输出矩阵中的对应值

# coding:utf-8
import numpy as np
"""
    numpy中的索引
"""
A = np.arange(3, 15).reshape((3, 4))
print(A)
# 矩阵中,指定索引的值
print(A[2])  # [11, 12, 13, 14]

# 输出指定索引对应的数值
print(A[1][1]) # 8
# 也可以是这种形式进行具体索引的输出
print(A[1, 1]) # 8

(2)矩阵中的“切片”

# 打印第二行的所有数
print(A[2, :])
# 打印第一列的所有数
print(A[:, 1])

# 在python中满足左闭右开的原则
print(A[1, 1:3])

(3)迭代矩阵的每一行

# 循环起来,打印行
print("#" * 20)
for row in A:
    print(row)

(4)迭代矩阵中的每一列

# 打印列
for column in A.T:
    print(column)

(5)迭代矩阵中的每一项数值(先将矩阵拉成只有一行的矩阵)

# 将矩阵拉直为一维矩阵
print(A.flatten())
# 矩阵
print(type(A.flatten()))
# 想要迭代每一个元素,需要这样
print("迭代每一个数值")
for item in A.flat:
    print(item)

5.numpy中array的合并

(1)两个矩阵,竖直方向上的合并

# coding:utf-8
import numpy as np
"""
    numpy中的合并
"""

# 竖直方向上的合并
A = np.array([1, 2, 3])
B = np.array([1, 1, 1])
print(np.vstack((A, B)))
# 输出矩阵形状
print(np.vstack((A, B)).shape)

(2)两个矩阵,水平方向上的合并

# 水平方向上的合并
print(np.hstack((A, B)))
print(np.hstack((A, B)).shape) # (6,)表示一行六列的矩阵

print("原来的A矩阵", A)
# 输出矩阵A的形状
print(A.shape)  # (3,)表示一行三列的矩阵

(3)给矩阵加维度

print("原来的矩阵", A)
# 给列加上维度
print(A[:, np.newaxis])
# 给行加上维度
print(A[np.newaxis, :])

(4)添加维度之后进行矩阵合并

# 当矩阵为1行是就默认为列表形式了,转置之后也是列表形式
# 比如说一行三列,转置之后仍然是一行三列
# 要想将一行三列变成三行一列,应该使用:加维度
print(A)
print(A.T)
A = np.array([1, 2, 3])[:, np.newaxis]

print(A)
print(type(A))
print(A.shape)
B = np.array([1, 1, 1])[:, np.newaxis]

C = np.hstack((A, B))
print("水平合并之后")
print(C)
D = np.vstack((A, B))
print("竖直合并之后")
print(D)

(5)多个矩阵的合并(自己设定竖直方向还是水平方向)

# 多个矩阵进行合并,竖直方向合并, 0代表竖直方向, 1代表水平方向
A = np.array([1, 2, 3])[:, np.newaxis]
B = np.array([1, 1, 1])[:, np.newaxis]
E = np.concatenate((A, B, A, A), axis=0)
F = np.concatenate((A, B, A, B), axis=1)
print("-" * 20)
print(E)
print("&" * 20)
print(F)

6.numpy中array的分割

(1)进行等分

# coding:utf-8
import numpy as np
"""
    分割矩阵
"""

# 生成一个三行四列的矩阵
A = np.arange(12).reshape((3, 4))
print(A)

# 对矩阵进行分割
# 第一个参数代表被分割的矩阵,第二个参数代表分割的块数,第三个参数代表分割的方向
# 0代表竖直分割,1代表水平分割
print(np.split(A, 2, axis=1))

# 纵向分割成三块
print(np.split(A, 3, axis=0))

(2)进行不等分

# split只能分割成相等的,不能不等分

# 使用array_split进行不等分割
print(np.array_split(A, 3, axis=1))

(3)另一种方式的分割函数的使用

# 横向纵向指的是最后如何排列的
# 或者这样理解,垂直切是在垂直方向上切的;水平切是在水平方向上切的
# 直接使用函数进行纵向分割
print("纵向分割---------------------------")
print(np.vsplit(A, 3))
# 直接使用函数进行横向分割
print("横向分割---------------------------")
print(np.hsplit(A, 2))

7. numpy中的深拷贝和浅拷贝

(1)矩阵赋值(浅拷贝)

# coding:utf-8
import numpy as np

"""
    numpy矩阵中的深拷贝和浅拷贝
"""

# 赋值,其实就还是公用一片内存
A = np.arange(5)
print("A矩阵", A)
B = A
C = A
print("B矩阵", B)
print("C矩阵", C)

# 改变A中数值,因为地址相同,所以其他浅拷贝之后的矩阵也都会发生改变
A[0] = 666
print("现在的A矩阵", A)
print("现在的B矩阵", B)
print("现在的C矩阵", C)

# 赋值是浅拷贝,地址其实一致
print(id(A))
print(id(B))
print(id(C))

(2)深拷贝

# 深度拷贝是,地址不一致, 新开辟了空间
D = A.copy()
print("A的地址是", id(A))
print("D的地址是", id(D))

print("A矩阵", A)
print("D矩阵", D)
# 改变A矩阵,深拷贝之后,他们并不公用内容,所以互不影响
A[1] = 999
print("现在的A矩阵", A)
print("现在的D矩阵", D)

四、附录

总结完毕,撒花撒花…

物联沃分享整理
物联沃-IOTWORD物联网 » 用于 Python 数据分析的 Numpy(保姆级教程)

发表评论