【Python算法】数值分析—列主元高斯消元法——附源码

2023-03-31

元素 list 矩阵

 一、背景        线性方程组有很多种解法，可以最简单的直接代入消元计算，但是运算量较大，且过程复杂不直观。        

一、背景

线性方程组有很多种解法，可以最简单的直接代入消元计算，但是运算量较大，且过程复杂不直观。

高斯消元法目的是预处理方程组的系数矩阵，将系数矩阵变换为上三角矩阵，这样整个方程就变得清晰直观很多，即使不借助计算机，也是可以很简单的手算出结果。

原方程：

高斯消元后的方程，这样最下行的方程只是一个简单的一元一次方程，倒数第二行是二元一次，依次倒着求解，整个过程变得清晰直观。（全部元素带撇“ ' ”，是因为消元涉及大量的对换两行元素的运算，所以方程的书写顺序是在不断被改变的，只是为了保持美观和一致，仍采用下标1234n的写法）

而列主元高斯消元法，是为了克服高斯消元法的”除法bug“的改进版本，因为消元过程中用到了除法，对于计算机来说，如果一个很小的值作为分母，则其在迭代中产生的误差，在做除法后会被放大很多倍。如0.0001与0.0002的误差小，但是1/0.0001与1/0.0002的误差巨大。列主元思想，就顺应而生，在消元前，把列中最大的元素所在行放到矩阵的最上方，那么就可以让较大值做分母，从而避免了误差被除法放大的问题。

二、方法逻辑（function文件，完整代码在文末）

1.寻找一列中的最大元素，并返回其所在行数


def get_max_row_in_column(matrix_a, j):
    """ 获取第j列中最大元素的所在行数
     此方法将被反复调用，所以每次运算时，不是从整个系数矩阵a中找最大行数，
     而是从可能已经做过几次消元的系数矩阵a的(j, j)子矩阵(尚未进行消元操作的部分)中寻找最大行数 """
    max_item = abs(matrix_a[j][j])
    max_row = j
    for i in list(range(j, matrix_a.shape[0])):
        if abs(matrix_a[i][j]) > abs(max_item):
            max_item = matrix_a[i][j]
            max_row = i
    return max_row

2.交换系数矩阵a的两行元素


def swap_row_in_matrix_a(matrix_a, max_row, i):
    """ 在系数矩阵a中交换某两行的元素 """
    for j in (list(range(i, matrix_a.shape[1]))):
        temp = matrix_a[i][j]
        matrix_a[i][j] = matrix_a[max_row][j]
        matrix_a[max_row][j] = temp

3.交换值矩阵b的两行元素


def swap_row_in_matrix_b(matrix_b, max_row, i):
    """ 在值矩阵b中交换某两行的元素 """
    temp = matrix_b[i][0]
    matrix_b[i][0] = matrix_b[max_row][0]
    matrix_b[max_row][0] = temp

4.高斯消元法主循环


def method_elimination_gauss(matrix_a, matrix_b):
    """ 高斯消元法主循环 """
    for i in list(range(0, matrix_a.shape[0])):  # 逐行处理矩阵数据
        max_row = get_max_row_in_column(matrix_a, i)  # 在当前系数矩阵的(i, i)子矩阵中获取第一列中最大元素所在行数，准备进行交换
        swap_row_in_matrix_a(matrix_a, max_row, i)  # 将最大元素所在行数交换至(i, i)子矩阵的第一行
        swap_row_in_matrix_b(matrix_b, max_row, i)  # 同时交换值矩阵b的元素，使方程的系数与值保持对应关系
 
        for k in list(range(i + 1, matrix_a.shape[0])):
            if matrix_a[i][i] != 0:  # 此时从系数矩阵的(i, i)子矩阵中获取的[i][i]元素已经是该列中绝对值最大的数，若为0，则奇异
                scale_factor = (-matrix_a[k][i]/matrix_a[i][i])  # 计算接下来消元需要用到的比例因子
            else:
                print('该矩阵奇异，无法求解方程组')
                sys.exit(0)
 
            for j in list(range(i, matrix_a.shape[1])):
                matrix_a[k][j] = scale_factor * matrix_a[i][j] + matrix_a[k][j]  # 消元，高斯消元法的核心之处
            matrix_b[k][0] = scale_factor * matrix_b[i] + matrix_b[k][0]  # 对b进行同样的”消元“

5.在上三角方程的基础上求解方程


def solve_equation(matrix_a, matrix_b):
    """ 求解消元后的上三角方程 """
    x = np.zeros((matrix_a.shape[0], 1))
    if matrix_a[-1][-1] != 0:
        x[-1] = matrix_b[-1] / matrix_a[-1][-1]
    else:  # 若此上三角方程的系数矩阵的最后一行最后一列元素为0，说明矩阵奇异，无数解
        print('该矩阵奇异，无法求解方程组')
        sys.exit(0)  # 强制退出
 
    for i in list(range(matrix_a.shape[0] - 2, -1, -1)):  # 从上三角方程最后一行开始解方程，倒着计算
        sum_a = 0
        for j in list(range(i + 1, matrix_a.shape[0])):
            sum_a += matrix_a[i][j] * x[j]
        x[i] = (matrix_b[i] - sum_a) / matrix_a[i][i]
    return x

三、最终实现（main文件，完整代码）


import numpy as np
import function as fun
 
 
# 为保证程序的连续性，一下两个矩阵均采用numpy库的矩阵形式输入，而不以数组形式输入
# 方程的系数矩阵a
matrix_a = np.array([[0.4096, 0.1234, 0.3678, 0.2943],
                     [0.2246, 0.3872, 0.4015, 0.1129],
                     [0.3645, 0.1920, 0.3781, 0.0643],
                     [0.1784, 0.4002, 0.2786, 0.3927]])
# 方程的值矩阵b
matrix_b = np.array([[1.1951],
                    [1.1262],
                    [0.9989],
                    [1.2499]])
 
# 输出结果
print("原系数矩阵a:")
print(matrix_a, "\n")
print("原值矩阵b:")
print(matrix_b, "\n")
fun.method_elimination_gauss(matrix_a, matrix_b)
print("消元后的系数矩阵a")
print(matrix_a, "\n")
print("消元后的值矩阵b")
print(matrix_b, "\n")
print("最终求解结果:")
print(fun.solve_equation(matrix_a, matrix_b))

测试结果：

function文件完整代码


import sys
import numpy as np
 
 
def get_max_row_in_column(matrix_a, j):
    """ 获取第j列中最大元素的所在行数
     此方法将被反复调用，所以每次运算时，不是从整个系数矩阵a中找最大行数，
     而是从可能已经做过几次消元的系数矩阵a的(j, j)子矩阵(尚未进行消元操作的部分)中寻找最大行数 """
    max_item = abs(matrix_a[j][j])
    max_row = j
    for i in list(range(j, matrix_a.shape[0])):
        if abs(matrix_a[i][j]) > abs(max_item):
            max_item = matrix_a[i][j]
            max_row = i
    return max_row
 
 
def swap_row_in_matrix_a(matrix_a, max_row, i):
    """ 在系数矩阵a中交换某两行的元素 """
    for j in (list(range(i, matrix_a.shape[1]))):
        temp = matrix_a[i][j]
        matrix_a[i][j] = matrix_a[max_row][j]
        matrix_a[max_row][j] = temp
 
 
def swap_row_in_matrix_b(matrix_b, max_row, i):
    """ 在值矩阵b中交换某两行的元素 """
    temp = matrix_b[i][0]
    matrix_b[i][0] = matrix_b[max_row][0]
    matrix_b[max_row][0] = temp
 
 
def method_elimination_gauss(matrix_a, matrix_b):
    """ 高斯消元法主循环 """
    for i in list(range(0, matrix_a.shape[0])):  # 逐行处理矩阵数据
        max_row = get_max_row_in_column(matrix_a, i)  # 在当前系数矩阵的(i, i)子矩阵中获取第一列中最大元素所在行数，准备进行交换
        swap_row_in_matrix_a(matrix_a, max_row, i)  # 将最大元素所在行数交换至(i, i)子矩阵的第一行
        swap_row_in_matrix_b(matrix_b, max_row, i)  # 同时交换值矩阵b的元素，使方程的系数与值保持对应关系
 
        for k in list(range(i + 1, matrix_a.shape[0])):
            if matrix_a[i][i] != 0:  # 此时从系数矩阵的(i, i)子矩阵中获取的[i][i]元素已经是该列中绝对值最大的数，若为0，则奇异
                scale_factor = (-matrix_a[k][i]/matrix_a[i][i])  # 计算接下来消元需要用到的比例因子
            else:
                print('该矩阵奇异，无法求解方程组')
                sys.exit(0)
 
            for j in list(range(i, matrix_a.shape[1])):
                matrix_a[k][j] = scale_factor * matrix_a[i][j] + matrix_a[k][j]  # 消元，高斯消元法的核心之处
            matrix_b[k][0] = scale_factor * matrix_b[i] + matrix_b[k][0]  # 对b进行同样的”消元“
 
 
def solve_equation(matrix_a, matrix_b):
    """ 求解消元后的上三角方程 """
    x = np.zeros((matrix_a.shape[0], 1))
    if matrix_a[-1][-1] != 0:
        x[-1] = matrix_b[-1] / matrix_a[-1][-1]
    else:  # 若此上三角方程的系数矩阵的最后一行最后一列元素为0，说明矩阵奇异，无数解
        print('该矩阵奇异，无法求解方程组')
        sys.exit(0)  # 强制退出
 
    for i in list(range(matrix_a.shape[0] - 2, -1, -1)):  # 从上三角方程最后一行开始解方程，倒着计算
        sum_a = 0
        for j in list(range(i + 1, matrix_a.shape[0])):
            sum_a += matrix_a[i][j] * x[j]
        x[i] = (matrix_b[i] - sum_a) / matrix_a[i][i]
    return x