一、背景
线性方程组有很多种解法,可以最简单的直接代入消元计算,但是运算量较大,且过程复杂不直观。
高斯消元法目的是预处理方程组的系数矩阵,将系数矩阵变换为上三角矩阵,这样整个方程就变得清晰直观很多,即使不借助计算机,也是可以很简单的手算出结果。
原方程:
高斯消元后的方程,这样最下行的方程只是一个简单的一元一次方程,倒数第二行是二元一次,依次倒着求解,整个过程变得清晰直观。(全部元素带撇“ ' ”, 是因为消元涉及大量的对换两行元素的运算,所以方程的书写顺序是在不断被改变的,只是为了保持美观和一致,仍采用下标1234n的写法)
而列主元高斯消元法,是为了克服高斯消元法的”除法bug“的改进版本, 因为消元过程中用到了除法,对于计算机来说,如果一个很小的值作为分母,则其在迭代中产生的误差,在做除法后会被放大很多倍。如0.0001与0.0002的误差小,但是1/0.0001与1/0.0002的误差巨大。列主元思想,就顺应而生,在消元前,把列中最大的元素所在行放到矩阵的最上方,那么就可以让较大值做分母,从而避免了误差被除法放大的问题。
二、方法逻辑(function文件,完整代码在文末)
1.寻找一列中的最大元素,并返回其所在行数
- def get_max_row_in_column(matrix_a, j):
- """ 获取第j列中最大元素的所在行数
- 此方法将被反复调用,所以每次运算时,不是从整个系数矩阵a中找最大行数,
- 而是从可能已经做过几次消元的系数矩阵a的(j, j)子矩阵(尚未进行消元操作的部分)中寻找最大行数 """
- max_item = abs(matrix_a[j][j])
- max_row = j
- for i in list(range(j, matrix_a.shape[0])):
- if abs(matrix_a[i][j]) > abs(max_item):
- max_item = matrix_a[i][j]
- max_row = i
- return max_row
2.交换系数矩阵a的两行元素
- def swap_row_in_matrix_a(matrix_a, max_row, i):
- """ 在系数矩阵a中交换某两行的元素 """
- for j in (list(range(i, matrix_a.shape[1]))):
- temp = matrix_a[i][j]
- matrix_a[i][j] = matrix_a[max_row][j]
- matrix_a[max_row][j] = temp
3.交换值矩阵b的两行元素
- def swap_row_in_matrix_b(matrix_b, max_row, i):
- """ 在值矩阵b中交换某两行的元素 """
- temp = matrix_b[i][0]
- matrix_b[i][0] = matrix_b[max_row][0]
- matrix_b[max_row][0] = temp
4.高斯消元法主循环
- def method_elimination_gauss(matrix_a, matrix_b):
- """ 高斯消元法主循环 """
- for i in list(range(0, matrix_a.shape[0])): # 逐行处理矩阵数据
- max_row = get_max_row_in_column(matrix_a, i) # 在当前系数矩阵的(i, i)子矩阵中获取第一列中最大元素所在行数,准备进行交换
- swap_row_in_matrix_a(matrix_a, max_row, i) # 将最大元素所在行数交换至(i, i)子矩阵的第一行
- swap_row_in_matrix_b(matrix_b, max_row, i) # 同时交换值矩阵b的元素,使方程的系数与值保持对应关系
-
- for k in list(range(i + 1, matrix_a.shape[0])):
- if matrix_a[i][i] != 0: # 此时从系数矩阵的(i, i)子矩阵中获取的[i][i]元素已经是该列中绝对值最大的数,若为0,则奇异
- scale_factor = (-matrix_a[k][i]/matrix_a[i][i]) # 计算接下来消元需要用到的比例因子
- else:
- print('该矩阵奇异,无法求解方程组')
- sys.exit(0)
-
- for j in list(range(i, matrix_a.shape[1])):
- matrix_a[k][j] = scale_factor * matrix_a[i][j] + matrix_a[k][j] # 消元,高斯消元法的核心之处
- matrix_b[k][0] = scale_factor * matrix_b[i] + matrix_b[k][0] # 对b进行同样的”消元“
5.在上三角方程的基础上求解方程
- def solve_equation(matrix_a, matrix_b):
- """ 求解消元后的上三角方程 """
- x = np.zeros((matrix_a.shape[0], 1))
- if matrix_a[-1][-1] != 0:
- x[-1] = matrix_b[-1] / matrix_a[-1][-1]
- else: # 若此上三角方程的系数矩阵的最后一行最后一列元素为0,说明矩阵奇异,无数解
- print('该矩阵奇异,无法求解方程组')
- sys.exit(0) # 强制退出
-
- for i in list(range(matrix_a.shape[0] - 2, -1, -1)): # 从上三角方程最后一行开始解方程,倒着计算
- sum_a = 0
- for j in list(range(i + 1, matrix_a.shape[0])):
- sum_a += matrix_a[i][j] * x[j]
- x[i] = (matrix_b[i] - sum_a) / matrix_a[i][i]
- return x
三、最终实现(main文件,完整代码)
- import numpy as np
- import function as fun
-
-
- # 为保证程序的连续性,一下两个矩阵均采用numpy库的矩阵形式输入,而不以数组形式输入
- # 方程的系数矩阵a
- matrix_a = np.array([[0.4096, 0.1234, 0.3678, 0.2943],
- [0.2246, 0.3872, 0.4015, 0.1129],
- [0.3645, 0.1920, 0.3781, 0.0643],
- [0.1784, 0.4002, 0.2786, 0.3927]])
- # 方程的值矩阵b
- matrix_b = np.array([[1.1951],
- [1.1262],
- [0.9989],
- [1.2499]])
-
- # 输出结果
- print("原系数矩阵a:")
- print(matrix_a, "\n")
- print("原值矩阵b:")
- print(matrix_b, "\n")
- fun.method_elimination_gauss(matrix_a, matrix_b)
- print("消元后的系数矩阵a")
- print(matrix_a, "\n")
- print("消元后的值矩阵b")
- print(matrix_b, "\n")
- print("最终求解结果:")
- print(fun.solve_equation(matrix_a, matrix_b))
测试结果:
function文件完整代码
- import sys
- import numpy as np
-
-
- def get_max_row_in_column(matrix_a, j):
- """ 获取第j列中最大元素的所在行数
- 此方法将被反复调用,所以每次运算时,不是从整个系数矩阵a中找最大行数,
- 而是从可能已经做过几次消元的系数矩阵a的(j, j)子矩阵(尚未进行消元操作的部分)中寻找最大行数 """
- max_item = abs(matrix_a[j][j])
- max_row = j
- for i in list(range(j, matrix_a.shape[0])):
- if abs(matrix_a[i][j]) > abs(max_item):
- max_item = matrix_a[i][j]
- max_row = i
- return max_row
-
-
- def swap_row_in_matrix_a(matrix_a, max_row, i):
- """ 在系数矩阵a中交换某两行的元素 """
- for j in (list(range(i, matrix_a.shape[1]))):
- temp = matrix_a[i][j]
- matrix_a[i][j] = matrix_a[max_row][j]
- matrix_a[max_row][j] = temp
-
-
- def swap_row_in_matrix_b(matrix_b, max_row, i):
- """ 在值矩阵b中交换某两行的元素 """
- temp = matrix_b[i][0]
- matrix_b[i][0] = matrix_b[max_row][0]
- matrix_b[max_row][0] = temp
-
-
- def method_elimination_gauss(matrix_a, matrix_b):
- """ 高斯消元法主循环 """
- for i in list(range(0, matrix_a.shape[0])): # 逐行处理矩阵数据
- max_row = get_max_row_in_column(matrix_a, i) # 在当前系数矩阵的(i, i)子矩阵中获取第一列中最大元素所在行数,准备进行交换
- swap_row_in_matrix_a(matrix_a, max_row, i) # 将最大元素所在行数交换至(i, i)子矩阵的第一行
- swap_row_in_matrix_b(matrix_b, max_row, i) # 同时交换值矩阵b的元素,使方程的系数与值保持对应关系
-
- for k in list(range(i + 1, matrix_a.shape[0])):
- if matrix_a[i][i] != 0: # 此时从系数矩阵的(i, i)子矩阵中获取的[i][i]元素已经是该列中绝对值最大的数,若为0,则奇异
- scale_factor = (-matrix_a[k][i]/matrix_a[i][i]) # 计算接下来消元需要用到的比例因子
- else:
- print('该矩阵奇异,无法求解方程组')
- sys.exit(0)
-
- for j in list(range(i, matrix_a.shape[1])):
- matrix_a[k][j] = scale_factor * matrix_a[i][j] + matrix_a[k][j] # 消元,高斯消元法的核心之处
- matrix_b[k][0] = scale_factor * matrix_b[i] + matrix_b[k][0] # 对b进行同样的”消元“
-
-
- def solve_equation(matrix_a, matrix_b):
- """ 求解消元后的上三角方程 """
- x = np.zeros((matrix_a.shape[0], 1))
- if matrix_a[-1][-1] != 0:
- x[-1] = matrix_b[-1] / matrix_a[-1][-1]
- else: # 若此上三角方程的系数矩阵的最后一行最后一列元素为0,说明矩阵奇异,无数解
- print('该矩阵奇异,无法求解方程组')
- sys.exit(0) # 强制退出
-
- for i in list(range(matrix_a.shape[0] - 2, -1, -1)): # 从上三角方程最后一行开始解方程,倒着计算
- sum_a = 0
- for j in list(range(i + 1, matrix_a.shape[0])):
- sum_a += matrix_a[i][j] * x[j]
- x[i] = (matrix_b[i] - sum_a) / matrix_a[i][i]
- return x
demo源码链接如下
github地址:https://github.com/method_elimination_gauss
gitee地址:https://gitee.com/darlingxyz/method_elimination_gauss
文章知识点与官方知识档案匹配,可进一步学习相关知识
算法技能树首页概览42563 人正在系统学习中