Note lại 1 số kiến thức nền về đại số tuyến tính có liên quan đến đủ mọi thứ như SVD, PCA, optimization ... (không đầy đủ, xem thêm trong các tài liệu khác).
Matrices
Ma trận một bảng (a table consists rows and columns) gồm m×n số thực được sắp xếp thành m dòng, n cột và gọi là ma trận cấp m×n.
Matrix notation
Ký pháp/ký hiệu biểu diễn ma trận
\(A = \left( {\begin{array}{*{20}{c}}{{{\rm{a}}_{11}}}&{{{\rm{a}}_{12}}}& \cdots &{{{\rm{a}}_{1{\rm{n}}}}\;}\\{{{\rm{a}}_{21}}}&{{{\rm{a}}_{22}}}& \cdots &{{{\rm{a}}_{2{\rm{n}}}}}\\ \vdots & \vdots & \ddots & \vdots \\{{{\rm{a}}_{{\rm{m}}1}}}&{{{\rm{a}}_{{\rm{m}}2}}}& \cdots &{{{\rm{a}}_{{\rm{mn}}}}}\end{array}\;} \right)\) hoặc \(A = \left[ {\begin{array}{*{20}{c}}{{{\rm{a}}_{11}}}&{{{\rm{a}}_{12}}}& \cdots &{{{\rm{a}}_{1{\rm{n}}}}\;}\\{{{\rm{a}}_{21}}}&{{{\rm{a}}_{22}}}& \cdots &{{{\rm{a}}_{2{\rm{n}}}}}\\ \vdots & \vdots & \ddots & \vdots \\{{{\rm{a}}_{{\rm{m}}1}}}&{{{\rm{a}}_{{\rm{m}}2}}}& \cdots &{{{\rm{a}}_{{\rm{mn}}}}}\end{array}} \right]\)
hoặc
\(A = {\left( {{a_{ij}}} \right)_{m \times n}}\)
Dãy số\(\;{A_{\left( i \right)}} = \left( {{a_{i1}}, \ldots ,{a_{in}}} \right)\) gọi là dòng thứ i của A và \({A^{\left( j \right)}} = \left( {{a_{1j}}, \ldots ,{a_{mj}}} \right)\) gọi là cột thứ j của A
Trong đó \({a_{ij}}\) là phần tử của ma trận nằm trên dòng i, cột j với \(i = 1,2,...,m\)và \(j = 1,2,...,n\)
Với ma trân vuông (square matrix) n×n, các phần tử \({a_{ii}}\)gọi là phần tử nằm trên đường chéo chính.
Diagonal matrix (ma trận chéo)
Ma trận (đường) chéo thường là ma trận vuông có các phần tử nằm trên đường chéo chính khác 0, mọi phần tử nằm ngoài đường chéo chính bằng 0.
\({d_{ij}} = 0,\;i \ne j\;\forall i,j \in \left\{ {1,2, \ldots ,n} \right\}\)
Ma trận đường chéo có dạng:
\(D = \left[ {\begin{array}{*{20}{c}}{{{\rm{a}}_{11}}}&0& \cdots &{0\;}\\0&{{{\rm{a}}_{22}}}& \cdots &0\\ \vdots & \vdots & \ddots & \vdots \\0&0& \cdots &{{{\rm{a}}_{{\rm{nn}}}}}\end{array}} \right]\)
Identity matrix (ma trận đơn vị)
Ma trận đơn vị (identity matrix còn gọi là unix matrix) cấp n là ma trận vuông n×n có mọi phần tử nằm trên đường chéo chính bằng 1, các phần tử khác bằng 0, và có dạng sau:
\({I_n} = \left[ {\begin{array}{*{20}{c}}1&0& \cdots &{0\;}\\0&1& \cdots &0\\ \vdots & \vdots & \ddots & \vdots \\0&0& \cdots &1\end{array}} \right]\)
Đôi khi sử dụng ký pháp/ký hiệu (notation) dùng mô tả ma trận (đường) chéo \({I_n} = diag\left( {1,1, \ldots ,1} \right)\)
hoặc dùng ký pháp Kronecker delta (Kronecker delta notation) \({\left( {{I_n}} \right)_{ij}} = {\delta _{ij}}\)
Matrix multiplication (nhân ma trận)
Tích của ma trận A mxp và ma trận B pxn là một ma trận kích thước m×n như sau:
\({\left[ {AB} \right]_{ij}} = {A_{i1}}{B_{1j}} + {A_{i2}}{B_{2j}} + ... + {A_{in}}{B_{nj}} = \sum\limits_{r = 1}^n {{A_{ir}}} {B_{rj}}\)
Tích hai ma trận AB có thể xác định (defined) trong khi BA không xác định. Cụ thể A là ma trận m×n và B là ma trận nxk tương ứng k ≠ n. Ngay cả khi AB và BA xác định thì thông thường AB ≠ BA.
\(A = \left[ {\begin{array}{*{20}{c}}2&1&4\\1&5&2\end{array}} \right]\)
\(B = \left[ {\begin{array}{*{20}{c}}3&2\\{ - 1}&4\\1&2\end{array}} \right]\)
\(AB = \left[ {\begin{array}{*{20}{c}}2&1&4\\1&5&2\end{array}} \right]\left[ {\begin{array}{*{20}{c}}3&2\\{ - 1}&4\\1&2\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}9&{16}\\0&{26}\end{array}} \right]\)
\({\left( {ab} \right)_{11}} = \left[ {\begin{array}{*{20}{c}}2&1&4\end{array}} \right]\left[ {\begin{array}{*{20}{c}}3\\{ - 1}\\{ - 1}\end{array}} \right] = 2\left( 3 \right) + 1\left( { - 1} \right) + 4\left( 1 \right) = 9\)
\({\left( {ab} \right)_{12}} = \left[ {\begin{array}{*{20}{c}}2&1&4\end{array}} \right]\left[ {\begin{array}{*{20}{c}}2\\4\\2\end{array}} \right] = 2\left( 2 \right) + 1\left( 4 \right) + 4\left( 2 \right) = 16\)
\({\left( {ab} \right)_{21}} = \left[ {\begin{array}{*{20}{c}}1&5&2\end{array}} \right]\left[ {\begin{array}{*{20}{c}}3\\{ - 1}\\{ - 1}\end{array}} \right] = 1\left( 3 \right) + 5\left( { - 1} \right) + 2\left( 1 \right) = 0\)
\({\left( {ab} \right)_{21}} = \left[ {\begin{array}{*{20}{c}}1&5&2\end{array}} \right]\left[ {\begin{array}{*{20}{c}}2\\4\\2\end{array}} \right] = 1\left( 2 \right) + 5\left( 4 \right) + 2\left( 2 \right) = 26\)
Transposition (chuyển vị ma trận)
Chuyển vị (chuyển đổi vị trí) của một ma trận A (the transpose of a matrix A) là một ma trận ký hiệu \({A^T}\) (có khi còn ký hiệu \(A\prime \), \({A^{tr}}\) hay \({A^t}\)) có các dòng là các cột của ma trận A (giữ nguyên thứ tự). Nếu A là một ma trận m×n thì \({A^T}\)là ma trận nxm.
\({\left[ {{A^T}} \right]_{ij}} = {\left[ A \right]_{ji}}\)
Ví dụ:
\(A = \left[ {\begin{array}{*{20}{c}}1&2&3\\4&5&6\end{array}} \right]\)thì chuyển vị của ma trận A là\({A^T} = \left[ {\begin{array}{*{20}{c}}1&4\\2&5\\3&6\end{array}} \right]\)
Một số tính chất
\({\left( {{A^T}} \right)^T} = A\)
\({\left( {A + B} \right)^T} = {A^T} + {B^T}\)
\({\left( {AB} \right)^T} = {B^T}{A^T}\)
\({\left( {cA} \right)^T} = c{A^T}\)
\(det({A^T}) = det(A)\) (với ma trận vuông xem
Determinant)
\({\left( {{A^T}} \right)^{ - 1}} = {\left( {{A^{ - 1}}} \right)^T}\)
Symmetric matrices (ma trận đối xứng)
Một ma trận vuông gọi là đối xứng (symmetric matrix) nếu chuyển vị của nó bằng chính nó \({A^T} = A\). Có thể tạo ma trận đối xứng từ một ma trận \({A_{m \times n}}\)bằng cách nhân nó với chuyển vị của nó: các ma trận\({B_{m \times m}} = A{A^T}\) và \({C_{n \times n}} = {A^T}A\) là các ma trận đối xứng.
Nếu A là ma trận vuông thì ma trận có được bằng cách cộng nó với chuyển vị của nó là ma trận đối xứng \({B_{n \times n}} = A + {A^T}\).
Nếu \({A^T} = - A\) thì \(A\) gọi là ma trận phản đối xứng/phản xứng (antisymmetric/antimetric hay skew-symmetric – đối xứng lệch).
Định lý (theorem):
1. Tất cả cả eigenvalues của ma trận đối xứng đều là số thực.
2.
Ma trận đới xứng thực cấp n×n có các eigenvectors (xem
Eigenvectors) ứng với các eigenvalues phân biệt thì trực giao lẫn nhau.
Chứng minh 1:
Cho A là ma trận đối xứng \({A^T} = A\).
Với \(\lambda \) là trị riêng của ma trận A: \(Ax = \lambda x\) với \(x \ne 0\)
Xét: \(\left\langle {Ax,x} \right\rangle = \left\langle {\lambda x,x} \right\rangle = \lambda \left\langle {x,x} \right\rangle \)
Mặt khác: \(\left\langle {Ax,x} \right\rangle = \left\langle {x,{A^T}x} \right\rangle = \left\langle {x,Ax} \right\rangle = \left\langle {x,\lambda x} \right\rangle = \bar \lambda \left\langle {x,x} \right\rangle \)
Do đó \((\lambda - \bar \lambda )\left\langle {x,x} \right\rangle = 0\) vì \(\left\langle {x,x} \right\rangle > 0\) nên \(\lambda \) là số thực.
Chứng minh 2:
Chứng minh các eigenvectors ứng với các eigenvalues phân biệt thì trực giao lẫn nhau.
Giả sử có \(A{v_1} = {\lambda _1}{v_1},A{v_2} = {\lambda _2}{v_2}\) với \({v_1} \ne 0,{v_2} \ne 0,{\lambda _1} \ne {\lambda _2}\).
Khi đó \(\left\langle {A{v_1},{v_2}} \right\rangle = \left\langle {{\lambda _1}{v_1},{v_2}} \right\rangle = {\lambda _1}\left\langle {{v_1},{v_2}} \right\rangle \).
Với \({A^T} = A\) và \(A{v_2} = {\lambda _2}{v_2}\) thì \(\left\langle {A{v_1},{v_2}} \right\rangle = \left\langle {{v_1},{A^T}{v_2}} \right\rangle = \left\langle {{v_1},A{v_2}} \right\rangle = {\lambda _2}\left\langle {{v_1},{v_2}} \right\rangle \).
Như vậy \({\lambda _1}\left\langle {{v_1},{v_2}} \right\rangle = {\lambda _2}\left\langle {{v_1},{v_2}} \right\rangle \) và do \({\lambda _1} \ne {\lambda _2}\) nên \(\left\langle {{v_1},{v_2}} \right\rangle = 0\).
Mở rộng eigenspaces tương ứng với \({\lambda _1},{\lambda _2}\) trực giao nhau.
Orthogonal matrix (ma trận trực giao)
Ma trận vuông A được gọi là ma trận trực giao nếu \({A^T}A = A{A^T} = I\)
Unitary matrix (ma trận Unitary/Unita)
Ma trận A được gọi là ma trận unitary nếu liên hợp chuyển vị của nó cũng chính là ma trận nghịch đảo của nó \({A^*}A = A{A^*} = I\).
Tính chất:
§ U khả nghịch và \({U^{ - 1}} = {U^*}\)
§ Với \(\forall x \in {C^n}\) thì \({\left\| {Ux} \right\|_2} = {\left\| x \right\|_2}\)
§ Với \(\forall x,y \in {C^n}\) thì \(\left\langle {Ux,Uy} \right\rangle = \left\langle {x,y} \right\rangle \)
§ Nếu
\(A = {A^*}\) là ma trận
Hermitian thì tồn tại một ma trận
unitary \(U\)sao cho
\({U^*}AU\)là ma trận chéo.
§ Với mọi ma trận \(A \in {R^{m \times n}}\)cả \({A^*}A \in {R^{n \times n}}\)và \(A{A^*} \in {R^{m \times m}}\) đều là ma trận Hermitian và có thể chéo hóa (diagonalized) bởi ma trận unitary.
Hermitian/Hermite matrix (ma trận Hermitian/Hermite)
Ma trận Hermitian/Hermite là một ma trận vuông có các phần tử là số phức bằng liên hợp chuyển vị (conjugate transpose) của nó, nghĩa là phần từ ở hàng i cột j bằng số phức liên hợp của phần tử ở hàng j cột i hay \(A = {A^*} \equiv {\bar A^T} = \overline {{A^T}} \).
Liên hợp chuyển vị còn gọi là liên hợp phức của ma trận chuyển vị (complex conjugate of the transpose) hay chuyển vị Hermitian (
Hermitian transpose). Ký hiệu
\(\bar A\)là ma trận liên hợp của A. Hai toán tử chuyển vị và liên hợp có thể giao hoán (commutable) nhau nên
\({A^*} \equiv {\bar A^T} = \overline {{A^T}} \). Liên hợp chuyển vị của ma trận A cũng hay được ký hiệu là
\({A^H}\).
Ví dụ:
\(A = \left[ {\begin{array}{*{20}{c}}1&{ - 2 - i}\\{1 + i}&i\end{array}} \right]\) thì \({A^T} = \left[ {\begin{array}{*{20}{c}}1&{1 + i}\\{ - 2 - i}&i\end{array}} \right]\) chuyển vị liên hợp của A là \({A^*} = \left[ {\begin{array}{*{20}{c}}1&{1 - i}\\{ - 2 + i}&{ - i}\end{array}} \right]\)
\(A = \left[ {\begin{array}{*{20}{c}}3&{2 + i}\\{2 - i}&1\end{array}} \right]\) là ma trận Hermitian.
Một ma trận A vuông đối xứng cấp n trên trường số thực (a symmetric n×n real matrix) được gọi là xác định dương (positive definite ký hiệu là PD) nếu vô hướng \({x^T}Ax\) dương với mọi vector cột khác không \(x \in {R^n}\) (\({x^T}\)là chuyển vị của x).
Tổng quát, một ma trận Hermitian A được gọi là positive definite nếu vô hướng \({x^*}Ax\)là số thực dương với mọi vector cột khác zero \(x \in {C^n}\) (\({x^*}\) là liên hợp chuyển vị – conjugate transpose của x). Khi đó ma trận A ký hiệu là \(A \succ 0\) (hay với positive semi-definite).
Các ma trận negative definite, positive semi-definite, và negative semi-definite được định nghĩa tương tự khi \({x^T}Ax\) hay \({x^*}Ax\)tương ứng phải âm, không âm hoặc không dương.
Ví dụ: ma trận đối xứng số thực \(A = \left[ {\begin{array}{*{20}{c}}2&{ - 1}&0\\{ - 1}&2&{ - 1}\\0&{ - 1}&2\end{array}} \right]\) là positive definite.
Với \(x = \left[ {\begin{array}{*{20}{c}}a\\b\\c\end{array}} \right] \ne 0\) thì \({x^T}Ax\) tính như sau:
\({x^T}Ax = ({x^T}A)x = 2{a^2} - 2ab + 2{b^2} - 2bc + 2{c^2}\)
\( = {a^2} + {(a - b)^2} + {(b - c)^2} + {c^2} > 0\) (a,b,c không đồng thời bằng 0).
Cho A là ma trận n×n Hermitian, nếu A positive definite:
§ Tất cả các giá trị riêng \({\lambda _1},{\lambda _2}, \ldots ,{\lambda _p}\) đều dương. Ngược lại nếu tất cả các trị riêng của ma trận A đối xứng vuông cấp n đều dương thì A gọi là positive definite matrix.
§ Với \(1 \le r \le n\) ma trận con (submatrix) r×r \({A_r}\) cũng positive definite.
§ Tồn tại duy nhất một phân tích/khai triển của A (a unique decomposition of A) dạng
\(A = L{L^*}\)với L là ma trận tam giác dưới (lower triangular matrix) còn gọi là phân tích Cholesky (
Cholesky decomposition) của ma trận A (
\({L^*}\) là conjugate transpose của L).
§ Tồn tại duy nhất một phân tích/khai triển của A dạng \(A = SS\) hay có thể viết \(S = {A^{1/2}}\)gọi là căn bậc 2 của ma trận A (matrix square root of A).
§ Tồn tại duy nhất một phân tích/khai triển của A dạng gọi là phân tích giá trị kỳ dị/đặc biệt/đơn (Singular value decomposition – SVD)
Trace (vết của ma trận)
Trace của một ma trận vuông cấp n được định nghĩa là tổng của các phần tử trên đường chéo chính (từ góc trên bên trái xuống góc dưới bên phải) ký hiệu là tr(A) hay sp(A) (spur trong tiếng Đức). Tương đương với vết của ma trận là tổng của các giá trị riêng eigenvalues (phức) (xem phần
Eigenvectors and Eigenvalues).
\(tr(A) = {a_{11}} + {a_{12}} + \ldots + {a_{nn}} = \sum\limits_{i = 1}^n {{a_{ii}}} \)
Một số tính chất:
\(tr(A) = tr({A^T})\)
Cho A là ma trận vuông bất kỳ cấp n. P là ma trận vuông khả nghịch. Liên hợp của A theo P là \({P^{ - 1}}AP\)
\(tr({P^{ - 1}}AP) = tr({P^{ - 1}}(AP)) = tr((AP){P^{ - 1}}) = tr(A(P{P^{ - 1}})) = tr(A)\)
Cho ma trận A là ma trận vuông m×n, chuẩn của ma trận A ký hiệu là \(\left\| A \right\|\)là một số không âm thỏa mãn:
1. Positivity:\(\left\| A \right\| \ge 0\) và \(\left\| A \right\| = 0\) khi và chỉ khi \(A = 0\)
2. Homogeneity: \(\left\| {\alpha A} \right\| = \left| \alpha \right|\left\| A \right\|\) với mọi \(\alpha \in R\)
3. Triangle inequality: \(\left\| {A + B} \right\| \le \left\| A \right\| + \left\| B \right\|\) (bất đẳng thức tam giác)
Induced norm/Operator norm (chuẩn toán tử)
Nếu có các chuẩn vector trên \({K^m}\) và \({K^n}\) (với K là trường số thực hay số phức), thì định nghĩa chuẩn toán tử của một ma trận m×n ứng với chuẩn p của vector như sau với bất kỳ \(x \in {K^n}\):
${\left\| A \right\|_p} = \mathop {\sup }\limits_{x \ne 0} \frac{{{{\left\| {Ax} \right\|}_p}}}{{{{\left\| x \right\|}_p}}}$
Trường hợp đặc biệt \(p = 1\), chuẩn toán tử trở thành chuẩn cực đại tổng theo cột
${\left\| A \right\|_1} = \mathop {\max }\limits_{1 \le j \le n} \sum\limits_{i = 1}^m {\left| {{a_{ij}}} \right|} $
Trường hợp\(p = \infty \), chuẩn toán tử trở thành chuẩn cực đại tổng theo dòng
${\left\| A \right\|_\infty } = \mathop {\max }\limits_{1 \le i \le m} \sum\limits_{j = 1}^n {\left| {{a_{ij}}} \right|} $
Trường hợp \(p = 2\)
\({\left\| A \right\|_2} \le {\left( {\sum\limits_{i = 1}^k {\sum\limits_{j = 1}^n | } {a_{ij}}{|^2}} \right)^{1/2}} = {\left\| A \right\|_F}\)
Trường hợp đặc biệt $p=2$ và \(m = n\)là dạng chuẩn Euclidean (Euclidean Norm) của ma trận còn gọi là chuẩn phổ (spectral norm). Spectral norm của ma trận là giá trị lớn nhất trong các giá trị kỳ dị/đơn của nó hay bằng căn bậc 2 của giá trị riêng (eigenvalue) lớn nhất của ma trận \({A^*}A\) trong đó \({A^*}\)là ma trận liên hợp chuyển vị của A (conjugate transpose).
\({\left\| A \right\|_2} = \mathop {\sup }\limits_{x \ne 0} \frac{{{{\left\| {Ax} \right\|}_2}}}{{{{\left\| x \right\|}_2}}} = \sqrt {{\lambda _{\max }}({A^*}A)} = {\sigma _{\max }}(A)\)
“Entrywise” norm/“Element-wise” norm (chuẩn theo phần tử)
Áp dụng chuẩn p của vector đối với từng phần tử của ma trận khi xem ma trận như một vector kích thước m×n.
${\left\| A \right\|_p} = {(\sum\limits_{i = 1}^m {\sum\limits_{j = 1}^n {{{\left| {{a_{ij}}} \right|}^p}} } )^{1/p}}$
Mặc dù có cùng một ký hiệu như chuẩn này khác với chuẩn p-norm ở trên và Schatten p-norm.
Với \(p = 2\), chuẩn trên gọi là chuẩn Frobenius (còn gọi là chuẩn Hilbert–Schmidt) hay chuẩn F và với \(p = \infty \)là chuẩn cực đại.
Frobenius Norm
${\left\| A \right\|_F} = {(\sum\limits_{i = 1}^m {\sum\limits_{j = 1}^n {{{\left| {{a_{ij}}} \right|}^2}} } )^{1/2}} = \sqrt {tr({A^*}A)} = \sqrt {\sum\nolimits_{i = 1}^{\min \{ m,n\} } {\sigma _i^2} } $
Frobenius norm bằng căn bậc hai của vết (matrix trace) ma trận \(A{A^*}\)với \({A^*}\)là liên hợp chuyển vị (conjugate transpose) của ma trận A.
Ký hiệu \(\bar A\)là ma trận liên hợp của A. Hai toán tử chuyển vị và liên hợp có thể giao hoán (commutable) nhau nên\({A^*} \equiv {\bar A^T} = \overline {{A^T}} \).
Ký hiệu \({\sigma _i}\)là các giá trị kỳ dị/đơn (singular values) của ma trận A.
Schatten norm (chuẩn Schatten)
Chuẩn p Schatten có được bằng các áp dụng chuẩn vector cho vector tạo thành bởi các giá trị kỳ dị/đơn (singular values) của ma trận. Nếu các giá trị kỳ dị ký hiệu là $\sigma_i$ thì công thức chuẩn p Schatten như sau:
${\left\| A \right\|_p} = {\left( {\sum\nolimits_{i = 1}^{\min \{ m,n\} } {{\sigma _i}^p} } \right)^{1/p}}$
Trường hợp với \(p = 2\) chuẩn Schatten cũng chính là chuẩn Frobenius.
Với $p=\infty$ chuẩn \(\infty \) Schatten là chuẩn 2 toán tử
Invertible matrix (ma trận khả nghịch)
Một ma trận vuông A n×n gọi là khả nghịch (invertible) hay không suy biến (non-singular or non-degenerate) nếu tồn tại một ma trận vuông B sao cho:
\(AB = BA = {I_n}\)
Nếu tồn tại B thì B là duy nhất và được xác định bởi A ký hiệu là\({A^{ - 1}}\)gọi là ma trận nghịch đảo của A. Một ma trận vuông không khả nghịch được gọi là ma trận kỳ dị/đặc biệt/đơn (singular) hay ma trận suy biến/thoái hóa (degenerate).
Một ma trận không phải ma trận vuông thì không khả nghịch nhưng có thể có nghịch đảo trái hoặc nghịch đảo phải ví dụ ma trận A m×n với m ≠ n có nghịch đảo phải B nxm khi \(AB = {I_m}\)
§ Phần lớn các trường hợp xét ma trận trên số thực hoặc số phức (trên một trường F) thì A là khả nghịch khi và chỉ khi định thức của nó khác 0.
§ Ma trận đơn vị là ma trận khả nghịch.
§ Nếu A, B là các ma trận khả nghịch thì AB khả nghịch và\({(AB)^{ - 1}} = {B^{ - 1}}{A^{ - 1}}\)
Tính ma trận nghịch đảo theo adjugate matrix
\({A^{ - 1}} = \frac{1}{{{\rm{det}}\left( A \right)}}\left[ {\begin{array}{*{20}{c}}{{{\rm{A}}_{11}}}&{{{\rm{A}}_{21}}}& \cdots &{{{\rm{A}}_{{\rm{n}}1}}\;}\\{{{\rm{A}}_{12}}}&{{{\rm{A}}_{22}}}& \cdots &{{{\rm{A}}_{{\rm{n}}2}}}\\ \vdots & \vdots & \ddots & \vdots \\{{{\rm{A}}_{1{\rm{n}}}}}&{{{\rm{A}}_{2{\rm{n}}}}}& \cdots &{{{\rm{A}}_{{\rm{nn}}}}}\end{array}} \right] = \frac{1}{{{\rm{det}}\left( A \right)}}adj(A)\)
Các bước tìm ma trận nghịch đảo:
§ Tính định thức nếu \(det(A) = 0\) không khả nghịch, \(det(A) \ne 0\) khả nghịch
§ Lập ma trận phụ/liên hợp (adjugate matrix) của: \(adj(A)\)
§ Tính ma trận nghịch đảo bằng công thức
Ví dụ:
\(A = \left[ {\begin{array}{*{20}{c}}1&{ - 2}&0\\3&2&1\\0&1&2\end{array}} \right]\)
\(\det \left( A \right) = \left( 1 \right)\left| {\begin{array}{*{20}{c}}2&1\\1&2\end{array}} \right| - \left( 3 \right)\left| {\begin{array}{*{20}{c}}{ - 2}&0\\1&2\end{array}} \right| + \left( 0 \right)\left| {\begin{array}{*{20}{c}}{ - 2}&0\\2&1\end{array}} \right| = 1\left( 3 \right) - 3\left( { - 4} \right) = 15\)
\(adj\left( A \right) = \left[ {\begin{array}{*{20}{c}}3&4&{ - 2}\\{ - 6}&2&{ - 1}\\3&{ - 1}&8\end{array}} \right]\)
\({A^{ - 1}} = \frac{1}{{15}}\left[ {\begin{array}{*{20}{c}}3&4&{ - 2}\\{ - 6}&2&{ - 1}\\3&{ - 1}&8\end{array}} \right]\)
Determinant (định thức ma trận)
Định thức ma trận (công thức xác định) là một hàm cho/của ma trận vuông trả về một số (vô hướng). Định thức của ma trận A được viết là \(\left| A \right|\)hay det(A). Nếu A chỉ chứa một phần tử 1x1 là a thì\(\left| A \right| = a\). Nếu A là ma trận 2x2 công thức tính định thức của A:
\(\det \left( A \right) = \left| A \right| = \left| {\begin{array}{*{20}{c}}a&b\\c&d\end{array}} \right| = ad - bc\) (chéo chính trừ chéo phụ)
\(\left| A \right| = \left| {\begin{array}{*{20}{c}}4&1\\1&2\end{array}} \right| = 4\left( 2 \right) - 1\left( 1 \right)\)
Nếu A là ma trận 3x3
\(\left| A \right| = \left| {\begin{array}{*{20}{c}}a&b&c\\d&e&f\\g&h&i\end{array}} \right| = a\left| {\begin{array}{*{20}{c}}e&f\\h&i\end{array}} \right| - b\left| {\begin{array}{*{20}{c}}d&f\\g&i\end{array}} \right| + c\left| {\begin{array}{*{20}{c}}d&e\\g&h\end{array}} \right| = aei + bfg + dhc - ceg - bdi - fha\)
Công thức tổng quát liên quan đến khái niệm dấu của hoán vị (permutation). Định thức của ma trận vuông cấp n là tổng đại số của n! (n giai thừa) số hạng, mỗi số hạng là tích của n phần tử lấy trên các hàng và các cột khác nhau của ma trận A, mỗi tích được nhân với phần tử dấu là +1 hoặc -1 theo phép thế tạo bởi các chỉ số hàng và chỉ số cột của các phần tử trong tích. Gọi \({S_n}\) là tập hợp các hoán vị của n phần tử 1,2,...,n. Công thức tính định thức Leibniz (Leibniz formula hay Laplace formula).
\(\left| A \right| = \sum\limits_{\sigma \in {S_n}} s gn\left( \sigma \right)\prod\limits_{i = 1}^n {{a_{i,{\sigma _i}}}} \)
Mỗi hoán vị là một sắp xếp thứ tự của các phần tử trong tập hợp. Các giá trị ở vị trí thứ i sau khi sắp xếp được ký hiệu là \({\sigma _i}\). Ví dụ với n = 3 dãy số 1, 2, 3 có thể được sắp xếp \(\sigma = \left[ {2,3,1} \right],{\sigma _1} = 2,{\sigma _2} = 3,{\sigma _3} = 1\). Với mỗi \(\sigma \) ký hiệu \(sgn\left( \sigma \right)\) thể hiện dấu của \(\sigma \) và có giá trị +1 khi việc sắp xếp thứ tực của \(\sigma \) có thể đạt được bằng một số chẵn lần hoán đổi hai phần tử và -1 nếu hóa đổi một số lẻ lần.
\(\left| A \right| = \sum\limits_{\sigma \in {S_n}} s gn\left( \sigma \right)\prod\limits_{i = 1}^n {{a_{i,{\sigma _i}}}} \)
\( = sgn\left( {\left[ {1,2,3} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {1,2,3} \right]}_i}}}} + sgn\left( {\left[ {1,3,2} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {1,3,2} \right]}_i}}}} \)\( + sgn\left( {\left[ {2,1,3} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {2,1,3} \right]}_i}}}} + sgn\left( {\left[ {2,3,1} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {2,3,1} \right]}_i}}}} \)\( + sgn\left( {\left[ {3,1,2} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {3,1,2} \right]}_i}}}} + sgn\left( {\left[ {3,2,1} \right]} \right)\prod\limits_{i = 1}^n {{a_{i,{{\left[ {3,2,1} \right]}_i}}}} \)
\( = \prod\limits_{i = 1}^n {{a_{i,{{\left[ {1,2,3} \right]}_i}}}} - \prod\limits_{i = 1}^n {{a_{i,{{\left[ {1,3,2} \right]}_i}}}} \)\( - \prod\limits_{i = 1}^n {{a_{i,{{\left[ {2,1,3} \right]}_i}}}} + \prod\limits_{i = 1}^n {{a_{i,{{\left[ {2,3,1} \right]}_i}}}} \)\( + \prod\limits_{i = 1}^n {{a_{i,{{\left[ {3,1,2} \right]}_i}}}} - \prod\limits_{i = 1}^n {{a_{i,{{\left[ {3,2,1} \right]}_i}}}} \)
\( = {a_{11}}{a_{22}}{a_{33}} - {a_{11}}{a_{23}}{a_{32}} - {a_{12}}{a_{21}}{a_{31}} + {a_{12}}{a_{23}}{a_{31}} + {a_{13}}{a_{21}}{a_{32}} - {a_{13}}{a_{22}}{a_{31}}\)
Định thức của ma trận A có thể định nghĩa bằng quy nạp (định lý Laplace hay
Laplace expansion/ cofactor expansion) như sau:
§ n = 1: \(A = \left[ a \right],\left| A \right| = a\)
§ n > 1: \(\left| A \right| = {\left( { - 1} \right)^{i + 1}}{a_{i1}}\left| {{A_{i1}}} \right| + {\left( { - 1} \right)^{i + 2}}{a_{i2}}\left| {{A_{i2}}} \right| + ... + {\left( { - 1} \right)^{i + j}}{a_{ij}}\left| {{A_{ij}}} \right| + ... + {\left( { - 1} \right)^{i + n}}{a_{in}}\left| {{A_{in}}} \right|\) tức tính định thức theo cách khai triển theo dòng i từ 1 đến n.
Có thể chọn dòng hoặc cột để khai triển công thức tính định thức.
Trong đó
§ \({\left( { - 1} \right)^{i + j}}\) là dấu chỉ số tương ứng phần tử dòng i, cột j
§ \({a_{ij}}\)là phần tử dòng i, cột j
§ \({A_{ij}} = \left| {{M_{ij}}} \right|\)là định thức con (minor) của ma trận \({M_{ij}}\)cấp n - 1 được lập bằng cách bỏ dòng i, cột j
§ \({\left( { - 1} \right)^{i + j}}{A_{ij}}\)là phần bù đại số của \({a_{ij}}\) hay hệ số liên hợp/hệ số kép (cofactor) bằng minor nhân với chỉ số dấu
Ví dụ: khai triển tính định thức A theo dòng
\(\left| A \right| = \left| {\begin{array}{*{20}{c}}{ - 1}&4&3\\2&6&4\\3&{ - 2}&8\end{array}} \right| = \left( { - 1} \right)\left| {\begin{array}{*{20}{c}}6&4\\{ - 2}&8\end{array}} \right| - \left( 2 \right)\left| {\begin{array}{*{20}{c}}4&3\\{ - 2}&8\end{array}} \right| + \left( 3 \right)\left| {\begin{array}{*{20}{c}}4&3\\6&4\end{array}} \right|\)
\( = - 1[{\rm{6}}({\rm{8}}) - {\rm{4}}( - 2)] - {\rm{2}}[{\rm{4}}({\rm{8}}) - {\rm{3}}( - {\rm{2}})] + {\rm{3}}[{\rm{4}}({\rm{4}}) - {\rm{3}}({\rm{6}})] = - 138\)
Một số tính chất:
§ \({\rm{det}}\left( {{I_n}} \right) = 1\)
§ A là ma trận vuông có ma trận chuyển vị\({A^T}\)thì \({\rm{det}}\left( {{A^T}} \right) = {\rm{det}}\left( A \right)\)
§ \({\rm{det}}\left( {{A^{ - 1}}} \right) = 1/{\rm{det}}\left( A \right) = {\rm{det}}{\left( A \right)^{ - 1}}\)
§ \(\det \left( {AB} \right) = \det \left( A \right)\det \left( B \right)\) với mọi ma trận A, B khả tích AB
§ \(\det \left( {cA} \right) = {c^n}{\rm{det}}\left( A \right)\)
§ Nếu dòng thứ i nào đó có tính chất là tổng của hai số hạng thì ta có thể tách định thức của ma trận đó thành tổng của hai định thức
§ Nếu đổi vị trí hai dòng hoặc hai cột của một định thức thì giá trị định thức sẽ đổi dấu.
§ Nếu ma trận có hai dòng hoặc hai cột tỉ lệ với nhau hoặc bằng nhau thì định thức của nó sẽ bằng 0.
§ Một định thức sẽ không thay đổi nếu ta thực hiện nhân một dòng hoặc một cột nào đó với một số khác 0 rồi cộng vào các dòng hoặc các cột khác.
Adjugate matrix (ma trận phụ/liên hợp)
Ma trận phụ/liên hợp (adjugate matrix còn gọi là adjoint) là chuyển vị của ma trận được tính bằng cách thay mỗi phần tử của ma trận ban đầu bằng giá trị cofactor ứng với phần tử đó.
\(A = \left[ {\begin{array}{*{20}{c}}2&0&1\\3&0&0\\5&1&1\end{array}} \right]\)
\({A_{11}} = \left| {\begin{array}{*{20}{c}}0&0\\1&1\end{array}} \right| = 0\) \({A_{12}} = - \left| {\begin{array}{*{20}{c}}3&0\\5&1\end{array}} \right| = - 3\) \({A_{13}} = \left| {\begin{array}{*{20}{c}}3&0\\5&1\end{array}} \right| = 3\)
\({A_{21}} = - \left| {\begin{array}{*{20}{c}}0&1\\1&1\end{array}} \right| = 1\) \({A_{22}} = \left| {\begin{array}{*{20}{c}}2&1\\5&1\end{array}} \right| = - 3\) \({A_{23}} = - \left| {\begin{array}{*{20}{c}}2&0\\5&1\end{array}} \right| = - 2\)
\({A_{31}} = \left| {\begin{array}{*{20}{c}}0&1\\0&0\end{array}} \right| = 0\) \({A_{32}} = - \left| {\begin{array}{*{20}{c}}2&1\\3&0\end{array}} \right| = 3\) \({A_{33}} = \left| {\begin{array}{*{20}{c}}2&0\\3&0\end{array}} \right| = 0\)
Matrix of minors
Ma trận tạo từ các định thức con
\(\left[ {\begin{array}{*{20}{c}}0&3&3\\{ - 1}&{ - 3}&2\\0&{ - 3}&0\end{array}} \right]\)
Matrix of cofactors
Kết hợp với dấu của cofactors sẽ được matrix of cofactors
\(\left[ {\begin{array}{*{20}{c}} + & - & + \\ - & + & - \\ + & - & + \end{array}} \right]\), matrix of cofactors \(\left[ {\begin{array}{*{20}{c}}0&{ - 3}&3\\1&{ - 3}&{ - 2}\\0&3&0\end{array}} \right]\)
Ma trận phụ/liên hợp là transpose của matrix of cofactors.
\(adj\left( A \right) = \left[ {\begin{array}{*{20}{c}}0&1&0\\{ - 3}&{ - 3}&3\\3&{ - 2}&0\end{array}} \right]\)
System of linear equations (hệ phương trình tuyến tính)
Hệ phương trình tuyến tính là tập hợp các phương trình tuyến tính cùng những biến số. Một hệ gồm m phương trình của n ẩn số \({x_1},{x_2},{x_3},...,{x_n}\) có dạng:
\(\left\{ {\begin{array}{*{20}{c}}{{a_{11}}{x_1} + ... + {a_{1n}}{x_n} = {b_1}}\\ \cdots \\{{a_{m1}}{x_1} + ... + {a_{mn}}{x_n} = {b_m}}\end{array}} \right.\)
trong đó: \({a_{ij}},{b_i}(i = \overline {1,m} ;j = \overline {1,n} ) \in R(C){\rm{\;}}\), \({a_{ij}}\) – hệ số (của ẩn), \({b_i}\) – hệ số tự do.
Ví dụ:
\(\left\{ {\begin{array}{*{20}{c}}{3x + 2y - z = 0}\\{2x - 2y + 4z = 0}\\{ - x + (1/2)y - z = 0}\end{array}} \right.\)gồm 3 phương trình và 3 biến số x, y, z.
Với
\(A = {({a_{ij}})_{mxn}} = \left[ {\begin{array}{*{20}{c}}{{a_{11}}}&{{a_{12}}}& \ldots &{{a_{1n}}}\\{{a_{21}}}&{{a_{22}}}& \ldots &{{a_{2n}}}\\ \vdots & \vdots & \ldots & \vdots \\{{a_{m1}}}&{{a_{m2}}}& \ldots &{{a_{mn}}}\end{array}} \right]\)
\(X = \left[ {\begin{array}{*{20}{c}}{{x_1}}\\{{x_2}}\\ \vdots \\{{x_n}}\end{array}} \right]\) và \(B = \left[ {\begin{array}{*{20}{c}}{{b_1}}\\{{b_2}}\\ \vdots \\{{b_m}}\end{array}} \right]\)
hệ phương trình trên có thể viết thành phương trình ma trận: AX = B và được gọi là dạng ma trận của hệ phương trình. Trong đó: A – ma trận hệ số của, X – ma trận ẩn số (cột ẩn số), B – ma trận tự do (cột tự do)
Ma trận \(\bar A = [A|B]\) được gọi là ma trận mở rộng (ma trận bổ sung)
Theo công thức của phép nhân ma trận thì: \({A_{mxn}}.{X_{nx1}} = {B_{mx1}}\)
Hệ này chỉ có 3 trường hợp xảy ra:
§ Hệ vô nghiệm
§ Hệ có duy nhất 1 nghiệm
§ Hệ có vô số nghiệm
Trong trường hợp tổng quát, hệ có nghiệm khi và chỉ khi hạng của hai ma trận \(A\) và \(\bar A\) bằng nhau
Cụ thể:
§ Nếu \(r = rank(A) < rank(\bar A)\) thì hệ vô nghiệm
§ Nếu \(rank(A) = rank(\bar A) = r\)hệ có nghiệm:
o \(rank(A) = rank(\bar A) = r = n\)hệ có nghiệm duy nhất
o \(rank(A) = rank(\bar A) = r < n\)hệ có vô số nghiệm phụ thuộc \(n - r\) ẩn tự do
§ Không xảy ra trường hợp \(r = rank(A) > rank(\bar A)\)
Trường hợp đặc biệt số phương trình bằng số ẩn
\(m = n\)và ma trận A khả nghịch (hay không suy biến
\(det(A) \ne 0\)) thì hệ có nghiệm duy nhất
\(x = {A^{ - 1}}B\) (xem
Cramer’s rule).
Với hệ phương trình gồm n phương trình, n ẩn số:
§ Nếu \(D = det(A) \ne 0\) thì hệ có nghiệm duy nhất
§ Với \({D_j}\) là định thức có được từ D bằng cách thay cột j của ma trận hệ số A bằng cột ma trận tự do B \(\forall j = \overline {1,n} \), nếu \(D = det(A) = 0\)và tồn tại \({D_j} \ne 0\) thì hệ vô nghiệm
§ \(D = {D_j} = 0,\forall j = \overline {1,n} \)thì hệ vô định
Homogeneous systems (hệ phương trình tuyến tính thuần nhất)
Nếu \({b_i} = 0,\forall i = \overline {1;m} \) thì hệ phương trình trở thành \(AX = {0_{mx1}}\)
\(\left\{ {\begin{array}{*{20}{c}}{{a_{11}}{x_1} + ... + {a_{1n}}{x_n} = 0}\\ \cdots \\{{a_{m1}}{x_1} + ... + {a_{mn}}{x_n} = 0}\end{array}} \right.\) gọi là hệ phương trình tuyến tính thuần nhất.
Hệ phương trình tuyến tính thuần nhất luôn có ít nhất một nghiệm gọi là nghiệm tầm thường (zero solution or trivial solution) \({x_1} = {x_2} = \ldots = {x_n} = 0\). Nếu hệ có ma trận không suy biến (non-singular matrix) (khi det(A) ≠ 0) thì hệ có nghiệm duy nhất.
Hệ phương trình tuyến tính thuần nhất n phương trình n ẩn có nghiệm không tầm thường khi và chỉ khi định thức của ma trận các hệ số bằng 0.
Linearly dependent/Linearly independent (phụ thuộc/độc lập tuyến tính)
Cho n vector \({X_1},{X_2},...,{X_n}\) của không gian vector V trên trường K được gọi là phụ thuộc tuyến tính nếu tồn tại các vô hướng \({c_1},{c_2},...,{c_n} \in K\) không phải tất cả đều bằng 0 sao cho:
\(\sum\limits_{i = 1}^n {{c_i}} {X_i} = 0\)
Nếu không có các vô hướng nào thỏa mãn, hệ các vector gọi là không phụ thuộc tuyến tính hay là hệ độc lập tuyến tính (linearly independent). Nếu hệ các vector phụ thuộc tuyến tính thì điều kiện được viết lại như sau:
\({c_1}\left[ {\begin{array}{*{20}{c}}{{x_{11}}}\\{{x_{21}}}\\ \vdots \\{{x_{n1}}}\end{array}} \right] + {c_2}\left[ {\begin{array}{*{20}{c}}{{x_{12}}}\\{{x_{22}}}\\ \vdots \\{{x_{n2}}}\end{array}} \right] + \ldots + {c_n}\left[ {\begin{array}{*{20}{c}}{{x_{1n}}}\\{{x_{2n}}}\\ \vdots \\{{x_{nn}}}\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}0\\0\\ \vdots \\0\end{array}} \right]\)
\(\left[ {\begin{array}{*{20}{c}}{{x_{11}}}&{{x_{12}}}& \ldots &{{x_{1n}}}\\{{x_{21}}}&{{x_{22}}}& \ldots &{{x_{2n}}}\\ \vdots & \vdots & \ldots & \vdots \\{{x_{n1}}}&{{x_{n2}}}& \ldots &{{x_{nn}}}\end{array}} \right]\left[ {\begin{array}{*{20}{c}}{{c_1}}\\{{c_2}}\\ \vdots \\{{c_n}}\end{array}} \right] = \left[ {\begin{array}{*{20}{c}}0\\0\\ \vdots \\0\end{array}} \right]\)
Hệ các vector \({X_1},{X_2},...,{X_n}\) phụ thuộc tuyến tính \({c_1}{X_1} + {c_2}{X_2} + ... + {c_n}{X_n} = 0\) thì tồn tại ít nhất 1 hệ số \({c_i} \ne 0\). Giả sử đó là \({c_n} \ne 0\). Khi đó\({X_n} = - \frac{{{c_1}}}{{{c_n}}}{X_1} - \frac{{{c_2}}}{{{c_n}}}{X_2} - ... - \frac{{{c_{n - 1}}}}{{{c_n}}}{X_{n - 1}}\)
Có nghĩa là các vector \({X_1},{X_2},...,{X_n}\) phụ thuộc tuyến tính thì tồn tại ít nhất một vector là tổ hợp tuyến tính của các vector còn lại.
Các vector\({X_1},{X_2},...,{X_n}\) độc lập tuyến tính nếu và chỉ nếu
\(\forall ({c_1},{c_2},...,{c_n}) \in {K^n},\sum\limits_{i = 1}^n {{c_i}{X_i} = 0} \Rightarrow {c_i} = 0,\forall i = 1,...,n\)
Nói một cách khác, phương trình \({c_1}{X_1} + {c_2}{X_2} + ... + {c_n}{X_n} = 0\)có nghiệm duy nhất là \({c_1} = {c_2} = \ldots = {c_n} = 0\).
Để hệ phương trình ma trận (hệ thuần nhất) có nghiệm không tầm thường thì hệ phải có định thức ma trận phải bằng 0, khi đó các vector là phụ thuộc tuyến tính và ngược lại nếu định thức ma trận khác 0 thì các vector là độc lập tuyến tính.
Ví dụ: hệ vector \(\{ {u_1} = (1,1,0);{u_2} = (0,1,1);{u_3} = (1,0,1)\} \) có độc lập tuyến tính hay không?
Do \(\left| {\begin{array}{*{20}{c}}1&1&0\\0&1&1\\1&0&1\end{array}} \right| = 2 \ne 0\) nên hệ vector đã cho là độc lập tuyến tính.
Rank (hạng của ma trận)
Các hàng/dòng của A (m×n) có thể viết dưới dạng m vector \(\{ {r_1},{r_2},...,{r_m}\} \).. Các cột của ma trận A (m×n) có thể viết theo n vector \(\{ {c_1},{c_2},...,{c_n}\} \).
Không gian dòng (row space) của ma trận A là không gian vector (vector space) được tạo bởi sự kết hợp/tổ hợp tuyến tính (linear combinations) của các vector dòng. Một kết hợp tuyến tính của các vector cột \(\{ {c_1},{c_2},...,{c_n}\} \) là bất kỳ một vector nào có thể biểu diễn dưới dạng:
\(A\left[ {\begin{array}{*{20}{c}}{{\alpha _1}}\\ \vdots \\{{\alpha _n}}\end{array}} \right] = {\alpha _1}{c_1} + ... + {\alpha _n}{c_n}\) với \(\{ {\alpha _1},{\alpha _2},...,{\alpha _n}\} \) là các số vô hướng.
Tập hợp các kết hợp/ tổ hợp tuyến tính của \(\{ {c_1},{c_2},...,{c_n}\} \) gọi là không gian cột (column space).
Submatrics (ma trận con)
Cho A là ma trận m×n, k là một số tự nhiên \(1 \le k \le \min \{ m,n\} \). Chọn k dòng và k cột bất kỳ của A, các phần tử thuộc giao của k dòng và k cột này tạo thành một ma trận vuông cấp k được gọi là ma trận con cấp k của A. Định thức của ma trận này gọi là định thức con cấp k của A.
Rank (hạng của ma trận)
Hạng cột (column rank) của A là số chiều (dimension) không gian cột (column space) của A hay là số lớn nhất/tối đa các cột độc lập tuyến tính (linearly independent) của A. Tương tự hạng dòng (row rank) của A là số chiều không gian dòng (row space) của A hay là số lớn nhất/tối đa các dòng độc lập tuyến tính.
Hạng của ma trận A là số lớn nhất các vector hàng độc lập tuyến tính của ma trận, và cũng bằng số lớn nhất các vector cột độc lập tuyến tính của nó.
Định nghĩa khác về hạng của ma trận như sau: cho A là ma trận m×n, hạng của ma trận A, ký hiệu là rank(A) hay r(A) là một số tự nhiên r: \(1 \le r \le \min \{ m,n\} \) thỏa mãn các điều kiện sau:
1. Tồn tại ít nhất một định thức con cấp r của A khác 0.
2. Mọi định thức con cấp cao hơn r (nếu có) đều bằng 0.
Hay hạng của A là cấp cao nhất của các định thức con khác không của ma trận A.