Содержание
В этом документе собраны основные сведения из алгебры матриц и векторов, которые используются в хемометрике. Приведенный текст не может служить учебником по матричной алгебре — он скорее является конспектом, справочником в этой области. Более глубокое и систематическое изложение может быть найдено в литературе.
Текст разбит на две части названные — “Базовые сведения” и “Дополнительная информация”. В первой части изложены положения, минимально необходимые для понимания хемометрики, а во второй части — факты, которые необходимо знать для более глубокого постижения методов многомерного анализа. Изложение иллюстрируется примерами, выполненными в рабочей книге Excel Matrix.xls, которая сопровождает этот документ.
Ссылки на примеры помещены в текст как объекты Excel. Эти примеры имеют абстрактный характер, они никак не привязаны к задачам аналитической химии. Реальные примеры использования матричной алгебры в хемометрике рассмотрены в других текстах, посвященных разнообразным хемометрическим приложениям.
Большинство измерений, проводимых в аналитической химии, являются не прямыми, а косвенными . Это означает, что в эксперименте вместо значения искомого аналита C (концентрации) получается другая величина x (сигнал), связанная, но не равная C, т.е. x (C) ≠ С. Как правило, вид зависимости x (C) не известен, однако, к счастью, в аналитической химии большинство измерений пропорциональны. Это означает, что при увеличении концентрации С в a раз, сигнал X увеличится на столько же., т.е. x ( a C) = a x (C). Кроме того, сигналы еще и аддитивны, так что сигнал от пробы, в которой присутствуют два вещества с концентрациями C 1 и C 2 , будет равен сумме сигналов от каждого компонента, т.е. x (C 1 + C 2 ) = x (C 1 )+ x (C 2 ). Пропорциональность и аддитивность вместе дают линейность . Можно привести много примеров, иллюстрирующих принцип линейности, но достаточно упомянуть два самых ярких примера — хроматографию и спектроскопию. Вторая особенность, присущая эксперименту в аналитической химии — это многоканальность . Современное аналитическое оборудование одновременно измеряет сигналы для многих каналов. Например, измеряется интенсивность пропускания света сразу для нескольких длин волн, т.е. спектр. Поэтому в эксперименте мы имеем дело со множеством сигналов x 1 , x 2 . x n , характеризующих набор концентраций C 1 ,C 2 , . C m веществ, присутствующих в изучаемой системе.
Итак, аналитический эксперимент характеризуется линейностью и многомерностью. Поэтому удобно рассматривать экспериментальные данные как векторы и матрицы и манипулировать с ними, используя аппарат матричной алгебры. Плодотворность такого подхода иллюстрирует пример, показанный на Рис. 1, где представлены три спектра, снятые для 200 длин волн от 4000 до 4796 cm −1 . Первый ( x 1 ) и второй ( x 2 ) спектры получены для стандартных образцов, в которых концентрация двух веществ A и B, известны: в первом образце [A] = 0.5, [B] = 0.1, а во втором образце [A] = 0.2, [B] = 0.6. Что можно сказать о новом, неизвестном образце, спектр которого обозначен x 3 ?
Рассмотрим три экспериментальных спектра x 1 , x 2 и x 3 как три вектора размерности 200. Средствами линейной алгебры можно легко показать, что x 3 = 0.1 x 1 +0.3 x 2 , поэтому в третьем образце очевидно присутствуют только вещества A и B в концентрациях [A] = 0.5×0.1 + 0.2×0.3 = 0.11 и [B] = 0.1×0.1 + 0.6×0.3 = 0.19.
1. Базовые сведения
1.1 Матрицы
Матрицей называется прямоугольная таблица чисел, например
Матрицы обозначаются заглавными полужирными буквами ( A ), а их элементы — соответствующими строчными буквами с индексами, т.е. a ij . Первый индекс нумерует строки, а второй — столбцы. В хемометрике принято обозначать максимальное значение индекса той же буквой, что и сам индекс, но заглавной. Поэтому матрицу A можно также записать как < a ij , i = 1. I ; j = 1. J >. Для приведенной в примере матрицы I = 4, J = 3 и a 23 = −7.5.
Пара чисел I и J называется размерностью матрицы и обознается как I × J . Примером матрицы в хемометрике может служить набор спектров, полученный для I образцов на J длинах волн.
1.2. Простейшие операции с матрицами
Матрицы можно умножать на числа. При этом каждый элемент умножается на это число. Например —
Рис. 3 Умножение матрицы на число
Две матрицы одинаковой размерности можно поэлементно складывать и вычитать. Например,
Рис. 4 Сложение матриц
В результате умножения на число и сложения получается матрица той же размерности.
Нулевой матрицей называется матрица, состоящая из нулей. Она обозначается O . Очевидно, что A + O = A , A − A = O и 0 A = O .
Матрицу можно транспонировать . При этой операции матрица переворачивается, т.е. строки и столбцы меняются местами. Транспонирование обозначается штрихом, A ‘ или индексом A t . Таким образом, если A = < a ij , i = 1. I ; j = 1. J >, то A t = < a ji , j = 1. J ; i = 1. I >. Например
Рис. 5 Транспонирование матрицы
Очевидно, что ( A t ) t = A , ( A + B ) t = A t + B t .
1.3. Умножение матриц
Матрицы можно перемножать, но только в том случае, когда они имеют соответствующие размерности. Почему это так, будет ясно из определения. Произведением матрицы A , размерностью I × K , и матрицы B , размерностью K × J , называется матрица C , размерностью I × J , элементами которой являются числа
Таким образом для произведения AB необходимо, чтобы число столбцов в левой матрице A было равно числу строк в правой матрице B . Пример произведения матриц —
Рис.6 Произведение матриц
Правило перемножения матриц можно сформулировать так. Для того, чтобы найти элемент матрицы C , стоящий на пересечении i -ой строки и j -ого столбца ( c ij ) надо поэлементно перемножить i -ую строку первой матрицы A на j -ый столбец второй матрицы B и сложить все результаты. Так в показанном примере, элемент из третьей строки и второго столбца, получается как сумма поэлементных произведений третьей строки A и второго столбца B
Рис.7 Элемент произведения матриц
Произведение матриц зависит от порядка, т.е. AB ≠ BA , хотя бы по соображениям размерности. Говорят, что оно некоммутативно. Однако произведение матриц ассоциативно. Это означает, что ABC = ( AB ) C = A ( BC ). Кроме того, оно еще и дистрибутивно, т.е. A ( B + C ) = AB + AC . Очевидно, что AO = O .
1.4. Квадратные матрицы
Если число столбцов матрицы равно числу ее строк ( I = J = N ), то такая матрица называется квадратной. В этом разделе мы будем рассматривать только такие матрицы. Среди этих матриц можно выделить матрицы, обладающие особыми свойствами.
Единичной матрицей (обозначается I, а иногда E ) называется матрица, у которой все элементы равны нулю, за исключением диагональных, которые равны 1, т.е.
Очевидно AI = IA = A .
Матрица называется диагональной , если все ее элементы, кроме диагональных ( a ii ) равны нулю. Например
Рис. 8 Диагональная матрица
Матрица A называется верхней треугольной , если все ее элементы, лежащие ниже диагонали, равны нулю, т.е. a ij = 0, при i > j . Например
Рис. 9 Верхняя треугольная матрица
Аналогично определяется и нижняя треугольная матрица.
Матрица A называется симметричной , если A t = A . Иными словами a ij = a ji . Например
Рис. 10 Симметричная матрица
Матрица A называется ортогональной , если
Матрица называется нормальной если
1.5. След и определитель
Следом квадратной матрицы A (обозначается Tr( A ) или Sp( A )) называется сумма ее диагональных элементов,
Рис. 11 След матрицы
Sp(α A ) = α Sp( A ) и
Sp( A + B ) = Sp( A )+ Sp( B ).
Можно показать, что
Sp( A ) = Sp( A t ), Sp( I ) = N ,
Другой важной характеристикой квадратной матрицы является ее определитель (обозначается det( A )). Определение определителя в общем случае довольно сложно, поэтому мы начнем с простейшего варианта — матрицы A размерностью (2×2). Тогда
Для матрицы (3×3) определитель будет равен
В случае матрицы ( N × N ) определитель вычисляется как сумма 1·2·3· . · N = N ! слагаемых, каждый из которых равен
Индексы k 1 , k 2 . k N определяются как всевозможные упорядоченные перестановки r чисел в наборе (1, 2, . , N ). Вычисление определителя матрицы — это сложная процедура, которую на практике осуществляется с помощью специальных программ. Например,
Рис. 12 Определитель матрицы
Отметим только очевидные свойства:
det( I ) = 1, det( A ) = det( A t ),
det( AB ) = det( A )det( B ).
1.6. Векторы
Если матрица состоит только из одного столбца ( J = 1), то такой объект называется вектором . Точнее говоря, вектором-столбцом. Например
Можно рассматривать и матрицы, состоящие из одной строки, например
Этот объект также является вектором, но вектором-строкой . При анализе данных важно понимать, с какими векторами мы имеем дело — со столбцами или строками. Так спектр, снятый для одного образца можно рассматривать как вектор-строку. Тогда набор спектральных интенсивностей на какой-то длине волны для всех образцов нужно трактовать как вектор-столбец.
Размерностью вектора называется число его элементов.
Ясно, что всякий вектор-столбец можно превратить в вектор-строку транспонированием, т.е.
В тех случаях, когда форма вектора специально не оговаривается, а просто говорится вектор, то имеют в виду вектор-столбец. Мы тоже будем придерживаться этого правила. Вектор обозначается строчной прямой полужирной буквой. Нулевым вектором называется вектор, все элементы которого раны нулю. Он обозначается 0 .
1.7. Простейшие операции с векторами
Векторы можно складывать и умножать на числа так же, как это делается с матрицами. Например,
Рис. 13 Операции с векторами
Два вектора x и y называются колинеарными , если существует такое число α, что
1.8. Произведения векторов
Два вектора одинаковой размерности N можно перемножить. Пусть имеются два вектора x = ( x 1 , x 2 . x N ) t и y = ( y 1 , y 2 . y N ) t . Руководствуясь правилом перемножения “строка на столбец”, мы можем составить из них два произведения: x t y и xy t . Первое произведение
называется скалярным или внутренним . Его результат — это число. Для него также используется обозначение ( x , y ) = x t y . Например,
Рис. 14 Внутреннее (скалярное) произведение
называется внешним . Его результат — это матрица размерности ( N × N ). Например,
Рис. 15 Внешнее произведение
Векторы, скалярное произведение которых равно нулю, называются ортогональными .
1.9. Норма вектора
Скалярное произведение вектора самого на себя называется скалярным квадратом. Эта величина
определяет квадрат длины вектора x . Для обозначения длины (называемой также нормой вектора) используется обозначение
Рис. 16 Норма вектора
Вектор единичной длины (|| x || = 1) называется нормированным. Ненулевой вектор ( x ≠ 0 ) можно нормировать, разделив его на длину, т.е. x = || x || ( x/ || x ||) = || x || e . Здесь e = x/ || x || — нормированный вектор.
Векторы называются ортонормированными, если все они нормированы и попарно ортогональны.
1.10. Угол между векторами
Скалярное произведение определяет и угол φ между двумя векторами x и y
Если вектора ортогональны, то cosφ = 0 и φ = π/2, а если они колинеарны, то cosφ = 1 и φ = 0.
1.11. Векторное представление матрицы
Каждую матрицу A размера I × J можно представить как набор векторов
Здесь каждый вектор a j является j -ым столбцом, а вектор-строка b i является i -ой строкой матрицы A
1.12. Линейно зависимые векторы
Векторы одинаковой размерности ( N ) можно складывать и умножать на число, также как матрицы. В результате получится вектор той же размерности. Пусть имеется несколько векторов одной размерности x 1 , x 2 . x K и столько же чисел α α 1 , α 2 . α K . Вектор
y = α 1 x 1 + α 2 x 2 +. + α K x K
называется линейной комбинацией векторов x k .
Если существуют такие ненулевые числа α k ≠ 0, k = 1. K , что y = 0 , то такой набор векторов x k называется линейно зависимым . В противном случае векторы называются линейно независимыми. Например, векторы x 1 = (2, 2) t и x 2 = (−1, −1) t линейно зависимы, т.к. x 1 +2 x 2 = 0
1.13. Ранг матрицы
Рассмотрим набор из K векторов x 1 , x 2 . x K размерности N . Рангом этой системы векторов называется максимальное число линейно-независимых векторов. Например в наборе
имеются только два линейно независимых вектора, например x 1 и x 2 , поэтому ее ранг равен 2.
Очевидно, что если векторов в наборе больше, чем их размерность ( K > N ), то они обязательно линейно зависимы.
Рангом матрицы (обозначается rank( A )) называется ранг системы векторов, из которых она состоит. Хотя любую матрицу можно представить двумя способами (векторы столбцы или строки), это не влияет на величину ранга, т.к.
rank( A ) = rank( A t ).
1.14. Обратная матрица
Квадратная матрица A называется невырожденной, если она имеет единственную обратную матрицу A -1 , определяемую условиями
Обратная матрица существует не для всех матриц. Необходимым и достаточным условием невырожденности является
det( A ) ≠ 0 или rank( A ) = N .
Обращение матрицы — это сложная процедура, для выполнения которой существуют специальные программы. Например,
Рис. 17 Обращение матрицы
Приведем формулы для простейшего случая — матрицы 2×2
Если матрицы A и B невырождены, то
1.15. Псевдообратная матрица
Если матрица A вырождена и обратная матрица не существует, то в некоторых случаях можно использовать псевдообратную матрицу, которая определяется как такая матрица A + , что
Псевдобратная матрица — не единственная и ее вид зависит от способа построения. Например для прямоугольной матрицы можно использовать метод Мура-Пенроуза.
Если число столбцов меньше числа строк, то
A + =(A t A) −1 A t
Рис. 1 7a Псевдообращение матрицы
Если же число столбцов больше числа строк, то
A + =A t (AA t ) −1
1.16. Умножение вектора на матрицу
Вектор x можно умножать на матрицу A подходящей размерности. При этом вектор-столбец умножается справа Ax , а вектор строка — слева x t A . Если размерность вектора J , а размерность матрицы I × J то в результате получится вектор размерности I . Например,
Рис. 18 Умножение вектора на матрицу
Если матрица A — квадратная ( I × I ), то вектор y = Ax имеет ту же размерность, что и x . Очевидно, что
A (α 1 x 1 + α 2 x 2 ) = α 1 Ax 1 + α 2 Ax 2 .
Поэтому матрицы можно рассматривать как линейные преобразования векторов. В частности Ix = x , Ox = 0 .
2. Дополнительная информация
2.1. Системы линейных уравнений
Пусть A — матрица размером I × J , а b — вектор размерности J . Рассмотрим уравнение
относительно вектора x , размерности I . По сути — это система из I линейных уравнений с J неизвестными x 1 . x J . Решение существует в том, и только в том случае, когда
rank( A ) = rank( B ) = R ,
где B — это расширенная матрица размерности I ×( J+1 ), состоящая из матрицы A , дополненной столбцом b , B = ( A b ). В противном случае уравнения несовместны.
Если R = I = J , то решение единственно
Если R I , то существует множество различных решений, которые можно выразить через линейную комбинацию J − R векторов. Система однородных уравнений Ax = 0 с квадратной матрицей A ( N × N ) имеет нетривиальное решение ( x ≠ 0 ) тогда и только тогда, когда det( A ) = 0. Если R = rank( A ) N , то существуют N − R линейно независимых решений.
2.2. Билинейные и квадратичные формы
Если A — это квадратная матрица , а x и y — вектора соответствующей размерности, то скалярное произведение вида x t Ay называется билинейной формой , определяемой матрицей A . При x = y выражение x t Ax называется квадратичной формой.
2.3. Положительно определенные матрицы
Квадратная матрица A называется положительно определенной, если для любого ненулевого вектора x ≠ 0 ,
Аналогично определяются отрицательно ( x t Ax x t Ax ≥ 0) и неположительно ( x t Ax ≤ 0) определенные матрицы.
2.4. Разложение Холецкого
Если симметричная матрица A положительно определена, то существует единственная треугольная матрица U с положительными элементами, для которой
Рис. 19 Разложение Холецкого
2.5. Полярное разложение
Пусть A — это невырожденная квадратная матрица размерности N × N . Тогда существует однозначное полярное представление
где S — это неотрицательная симметричная матрица, а R — это ортогональная матрица. Матрицы S и R могут быть определены явно:
S 2 = AA t или S = ( AA t ) ½ и R = S −1 A = ( AA t ) −½ A .
Рис. 20 Полярное разложение
Если матрица A вырождена, то разложение не единственно — а именно: S по-прежнему одна, а вот R может быть много. Полярное разложение представляет матрицу A как комбинацию сжатия/растяжения S и поворота R .
2.6. Собственные векторы и собственные значения
Пусть A — это квадратная матрица. Вектор v называется собственным вектором матрицы A , если
где число λ называется собственным значением матрицы A . Таким образом преобразование, которое выполняет матрица A над вектором v , сводится к простому растяжению или сжатию с коэффициентом λ. Собственный вектор определяется с точностью до умножения на константу α ≠ 0, т.е. если v — собственный вектор, то и α v — тоже собственный вектор.
2.7. Собственные значения
У матрицы A , размерностью ( N × N ) не может быть больше чем N собственных значений. Они удовлетворяют характеристическому уравнению
являющемуся алгебраическим уравнением N -го порядка. В частности, для матрицы 2×2 характеристическое уравнение имеет вид
Рис. 21 Собственные значения
Набор собственных значений λ 1 . λ N матрицы A называется спектром A .
Спектр обладает разнообразными свойствами. В частности
det( A ) = λ 1 ×. ×λ N , Sp( A ) = λ 1 +. +λ N .
Собственные значения произвольной матрицы могут быть комплексными числами, однако если матрица симметричная ( A t = A ), то ее собственные значения вещественны.
2.8. Собственные векторы
У матрицы A , размерностью ( N × N ) не может быть больше чем N собственных векторов, каждый из которых соответствует своему собственному значению. Для определения собственного вектора v n нужно решить систему однородных уравнений
Она имеет нетривиальное решение, поскольку det( A − λ n I ) = 0.
Рис. 22 Собственные вектора
Собственные вектора симметричной матрицы ортогональны.
2.9. Эквивалентные и подобные матрицы
Две прямоугольные матрицы A и B одной размерности I × J эквивалентны , если существуют такие квадратные матрицы S , размерности I × I , и T , размерности J × J , что
Эквивалентные матрицы имею один и тот же ранг.
Две прямоугольные матрицы A и B одной размерности N × N подобны , если существует такая невырожденная матрица T , что
Матрица T называется преобразованием подобия.
Подобные матрицы имеют один и тот же ранг, след, определитель и спектр.
2.10. Приведение матрицы к диагональному виду
Нормальную (в частности симметричную) матрицу A можно привести к диагональному виду преобразованием подобия —
Здесь Λ = diag(λ 1 . λ N ) — это диагональная матрица, элементами которой являются собственные значения матрицы A , а T — это матрица, составленная из соответствующих собственных векторов матрицы A , т.е. T = ( v 1 . v N ).
Рис. 23 Приведение к диагональному виду
2.11. Разложение по сингулярным значениям (SVD)
Пусть имеется прямоугольная матрица A размерностью I × J ранга R ( I ≤ J ≤ R ). Ее можно разложить в произведение трех матриц P R ( I × R ), D R ( R × R ) и Q R ( J × R ) —
.
Здесь P R — матрица, образованная R ортонормированными собственными векторами p r матрицы AA t , соответствующим R наибольшим собственным значениям λ r ;
AA t p r = λ r p r ;
Q R — матрица, образованная R ортонормированными собственными векторами q r матрицы A t A ;
A t Aq r = λ r q r .
D R = diag (σ 1 . σ R ) — положительно определенная диагональная матрица , элементами которой являются σ 1 ≥. ≥σ R ≥0 — сингулярные значения матрицы A , равные квадратным корням из собственных значений матрицы A t A —
Рис. 24 SVD разложение
Дополняя матрицы P R и Q R ортонормированными столбцами, а матрицу D R нулевыми значениями, можно сконструировать матрицы P ( I × J ), D ( J × J ) и Q ( J × J ) такие, что
2.12. Линейное пространство
Рассмотрим все возможные векторы размерности N . Это множество называется линейным пространством размерности N и обозначается R N . Так как в R N включены все возможные векторы, то любая линейная комбинация векторов из R N будет также принадлежать этому пространству.
2.13. Базис линейного пространства
Любой набор из N линейно независимых векторов называется базисом в пространстве R N . Простейший пример базиса — это набор векторов
в каждом из которых только один элемент равен 1, а остальные равны нулю. Тогда любой вектор x = ( x 1 , x 2 . x N ) t может быть представлен как линейная комбинация x = x 1 e 1 + x 2 e 2+ . + x N e N базисных векторов.
Базис, составленный из попарно ортогональных векторов, называется ортогональным , а если базисные вектора еще и нормированы, то этот базис называется ортонормированным .
2.14. Геометрическая интерпретация
Линейному пространству можно дать удобную геометрическую интерпретацию. Представим себе N -мерное пространство, в котором базисные вектора задают направления осей координат. Тогда произвольный вектор x = ( x 1 , x 2 . x N ) t можно изобразить точкой в этом пространстве с координатами ( x 1 , x 2 . x N ).
Рис. 25 Координатное пространство
2.15. Множественность базисов
В линейном пространстве могут быть неограниченное число базисов. Так, в пространстве R 3 помимо обычного ортонормированного базиса
можно установить и другой ортонормированный базис, например
Каждый базис можно представить матрицей B = ( b 1 . b N ), составленной из базисных векторов. Переход от одного базиса к другому осуществляется с помощью невырожденной квадратной матрицы T , т.е. B 2 = TB 1 .
2.16. Подпространство
Пусть имеется набор из K линейно независимых векторов x 1 , x 2 . x K в пространстве R N . Рассмотрим все возможные линейные комбинации этих векторов
x = α 1 x 1 + α 2 x 2 +. + α K x K
О получившимся множестве Q говорят, что оно является линейной оболочкой или что оно натянуто на векторы x 1 , x 2 . x K . По определению линейного пространства это множество Q само является линейным пространством размерности K . При этом оно принадлежит пространству R N , поэтому Q называется линейным подпространством R K в пространстве R N .
2.17. Проекция на подпространство
Рассмотрим подпространство R K , натянутое на векторы X = ( x 1 , x 2 . x K ) в пространстве R N . Матрица базиса X имеет размерность ( N × K ). Любой вектор y из R N может быть спроецирован на подпространство R K , т.е. представлен в виде
где вектор y || принадлежит R K , а вектор y ⊥ ортогонален y || .
Рис. 26 Проекция на подпространство
Проекцию y || можно представить как результат действия проекционной матрицы P
Проекционная матрица определяется как
Рис. 27 Проекционное разложение
Заключение
Матричные методы активно используются при анализе данных, в том числе и хемометрическими методами.
Матрица линейного оператора примеры
Построение матрицы по заданной формуле отображения.
Пусть отображение задано с помощью формулы:
то есть для координат произвольного исходного вектора определены координаты его образа. Тогда, рассматривая вместо произвольного вектора x вектор , найдём его образ, это будет вектор . Для этого в формуле, задающей образ вектора, полагаем , ,…, . Аналогично находим образы для ,…, . Из координат образа вектора составляем 1-й столбец матрицы линейного оператора, аналогично из координат последующих векторов – остальные столбцы. Рассмотрим на примере.
Пример 1. Пусть оператор задан с помощью формулы:
.
Прежде всего, докажем, что это отображение – действительно линейный оператор.
Отобразим сумму векторов:
Теперь каждую координату получившегося вектора можем преобразовать:
.
Аналогично для умножения на константу:
Для того чтобы найти матрицу этого линейного оператора, нужно, как было сказано выше, подставить значения x1 = 1, x2 = 0, а затем x1 = 0, x2 = 1. В этом примере образы базисных векторов – соответственно (3, 1) и (2, -1).
Поэтому матрица линейного оператора будет иметь вид:
.
Аналогичным способом решается задача и для 3 и большего количества переменных.
Пример 2. .
Построим матрицу оператора. Отображая вектор (1,0,0), получаем (1,4,-1), соответственно (0,1,0) переходит в (2,1,-2), а вектор (0,0,1) – в (-1,1,3).
Матрица линейного оператора:
.
2.2. Построение матрицы оператора в случае, когда известен исходный базис и система векторов, в которую он отображается.
Если задана система из n векторов, образующих базис, и какая-нибудь произвольная система n векторов (возможно, линейно-зависимая), то однозначно определён линейный оператор, отображающий каждый вектор первой системы в соответствующий вектор второй системы.
Матрицу этого оператора можно найти двумя способами: с помощью обратной матрицы и с помощью системы уравнений.
Пусть – матрица оператора в базисе . По условию, для всех индексов . Данные n равенств можно записать в виде одного матричного равенства: , при этом столбцы матрицы – это векторы , а столбцы матрицы – векторы . Тогда матрица может быть найдена в виде .
Пример. Найти матрицу линейного оператора, отображающего базис
в систему векторов .
Здесь , , , и получаем:
.
Проверка осуществляется умножением получившейся матрицы на каждый вектор: .
Аналогично решаются подобные задачи и для трёхмерного пространства. В приложении (§5) есть несколько вариантов таких задач.
2.3. Прочие способы нахождения матрицы оператора.
Существуют также примеры, где линейный оператор задаётся другими способами, отличными от рассмотренных в п. 2.1 и 2.2.
Пример. Линейными операторами являются как правое, так и левое векторное умножение на фиксированный вектор в трёхмерном пространстве, то есть отображения вида и . Построим матрицу одного из этих операторов, . Для этого найдём образы всех трёх базисных векторов линейного пространства.
.
Аналогично, ,
.
Координаты полученных векторов запишем в виде столбцов матрицы оператора.
Матрица оператора: .
Аналогично можно построить матрицу линейного оператора :
.
Пример. Линейный оператор дифференцирования в пространстве всех многочленов степени не более n. Это пространство размерности n + 1. Возьмём в качестве базиса элементы , , ,…, .
, , , аналогично получим ,…, .
Матрица этого линейного оператора:
Линейные операторы могут отображать не только пространства конечной размерности, но и бесконечномерные пространства. Так, оператор дифференцирования может рассматриваться также в пространстве всех непрерывных функций. (В этом пространстве нет конечного базиса). В этом случае, очевидно, оператор не может быть задан матрицей конечного порядка.
Не нашли то, что искали? Воспользуйтесь поиском:
Лучшие изречения: Для студента самое главное не сдать экзамен, а вовремя вспомнить про него. 10219 – | 7588 – или читать все.
91.146.8.87 © studopedia.ru Не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования. Есть нарушение авторского права? Напишите нам | Обратная связь.
Отключите adBlock!
и обновите страницу (F5)
очень нужно
Матрица линейного оператора
Определение 1. Если задан закон, который каждому вектору x?? ставит в соот ветствие вектор y . то говорят, что в линейном пространстве ? задан оператор A , при этом пишут:
Определение 2. Оператор A называется линейным, если для любых x 1 ?? и x 2 ?? и произвольного числа ? выполняются условия:
Рассмотрим теперь в евклидовом пространстве E n базис e 1 ,e 2 . e n и пусть в этом пространстве определён линейный оператор A : y = A x .
Разложим векторы x и y по базису e 1 ,e 2 . e n :
В силу линейности оператора A можно написать
Заметим, что каждый вектор , следовательно, его также можно разложить по базису e 1 ,e 2 . e n , т.е.
В силу единственности разложения по данному базису мы можем при равнять коэффициенты при базисных векторах в правых частях формул (1) и (2); тогда получим:
Получили, что линейному оператору A в данном базисе соответствует квадратная матрица
которая называется матрицей линейного оператора A , i -й столбец которой состоит из координат вектора Ae i (i = 1,2. n ) относительно данного базиса. Отметим, что матрица A оператора A зависит от выбора базиса e 1 ,e 2 . e n .
Итак, мы показали, что всякому линейному оператору A в евклидовом пространстве E n соответствует матрица A ; можно доказать и обратное утверждение: всякую квадратную матрицу A можно рассматривать как матрицу некоторого линейного оператора A в данном базисе e 1 ,e 2 . e n .
Представляют интерес невырожденные линейные операторы, т.е. такие операторы, матрицы которых имеют обратную A -1 , т.е. также являются невырожденными. В этом случае каждому вектору y (образу), определённому соотношением, отвечает единственный вектор x (прообраз) и при этом имеет место матричное равенство: X = A -1 ? Y .
Примеры линейных операторов
1. В пространстве 2-мерных векторов линейным оператором является правило
связывающее вектор-прообраз с вектором-образом
2. В пространстве бесконечно дифференцируемых функций линейным оператором является операция дифференцирования, ставящая в соответствие каждому элементу этого простран ства его производную функцию.
3. В пространстве многочленов P n (t) линейным оператором является операция умножения многочлена на независимую переменную t .
Пример: Известны образы базисных векторов E 3 под действием оператора A :
Найти матрицу этого оператора в исходном базисе.
Решение: По определению y = A x, значит в матричном виде можно записать, что A = X -1 Y . Для нашего примера получаем
Действия над операторами
Сложение линейных операторов. Пусть x?E n , A и B – два линейных оператора в этом пространстве.
Определение 1. Суммой линейных операторов A и B в E n называется оператор C, определяемый равенством Cx = A x + Bx , где x – любой вектор из E n .
Сумма линейных операторов является линейным оператором, причём его матрица C = A + B, где A и B – матрицы линейных операторов A и B .
Умножение линейного оператора на число. Пусть x?E n , линейный оператор A определён в E n , ? – некоторое число.
Определение 2. Произведением линейного оператора A на число ? называется оператор ?A , определяемый равенством .
?A является линейным оператором, а матрица этого линейного оператора получается из матрицы A умножением её на число ? , т.е. она равна ? ? A.
Умножение линейных операторов. Пусть x? E n , y ? E n , z ? E n и кроме того в E n определены линейные операторы A и B таким образом, что y = Bx, z = A y .
Определение 3. Произведением A ? B линейных операторов A и B называется оператор C, определяемый соотношением Cx = A (Bx) .
Таким образом, перемножение линейных операторов состоит в последовательном их применении по отношению к вектору x .
Рассмотрим матрицы – столбцы:
и обозначим через A, B и C – соответственно матрицы линейных операторов A, B и C. Тогда Z = A ? (B ? X) = (A ? B) ? X = C ? X , таким образом, C = A ? B, т.е. матрица произведения линей ных операторов также является линейным оператором.
a) (A ? B)(x + y) = A (B(x + y)) = A (Bx + By) = A (Bx) + A (By) = = (A ? B) ? x + (A ? B) ? y
б) (A ? B)(? x) = A (B(? x)) = A (?Bx) =?A (Bx) =? (A ? B)x
Свойства умножения линейных операторов вытекают из свойств умножения матриц.
Определение 4. Линейные операторы A и В называются равными, если . Равенство операторов обозначается как A = B .
Определение 5. Оператор E называется единичным (или тождественным) оператором, если каждому элементу x линейного пространства он ставит в соответствие тот же самый элемент, то есть
1. Понятие линейного оператора
Пусть R и S линейные пространства, которые имеют размерность n и m соответственно. Оператором A действующим из R в S называется отображение вида , сопоставляющее каждому элементу x пространства R некоторый элемент y пространства S. Для этого отображения будем использовать обозначение y= A(x) или y= Ax.
Определение 1. Оператор A действующий из R в S называется линейным, если для любых элементов x1 и x2 пространства R и любого λ из числового поля K выполняются соотношения
Если пространство S совпадает с пространством R, то линейный оператор, который действует из R в R называют линейным преобразованием пространства R.
Пусть заданы два векторных пространства n-мерный R и m-мерный S, и пусть в этих пространствах заданы базисы и соответственно. Пусть задано отображение
где A – m×n -матрица с коэффициентами из поля K. Тогда каждому элементу из R соответствует элемент y=Ax из S. Отображение (1) определяет оператор A. Покажем, что этот оператор обладает свойством линейности. Действительно, учитывая свойства умножения матриц, можно записать:
Покажем теперь обратное, т.е. что для любого линейного оператора A, отображающего пространство R в S и произвольных базисов и в R и S соответственно, существует такая матрица A с элементами из численного поля K, что определяемое этой матрицей линейное отображение (1) выражает координаты отображенного вектора y через координаты исходного вектора x.
Пусть x − произвольный элемент в R. Тогда
(3) |
является разложением x в по базису .
Применим оператор A к базисным векторам :
(4) |
где aij − координаты полученного вектора в базисе .
Тогда применяя оператор A к элементу x и учитывая (3) и (4), имеем
Сделаем следующее обозначение:
(6) |
Тогда равенство (5) примет следующий вид:
(7) |
Из равенства (7) следует, что любой элемент из пространства R при отображении оператором A, в пространстве S и в базисе имеет координаты yi, i=1,2. m. В свою очередь, из (6) следует, что этим координатам соответствуют линейные комбинации координатов элемента xj, j=1,2. n с коэффициентами aij i=1,2. m; j=1,2. n.
Построим матрицу A с элементами aij:
(8) |
Тогда выражение (6) можно записать в матричном виде:
Матрица A называется матрицей линейного оператора в заданных базисах и .
2. Сложение линейных операторов
Пусть A и B два линейных оператора действующих из R в S и пусть A и B – mxn − матрицы соответствующие этим операторам.
Определение 2. Суммой линейных операторов A и B называется оператор C, определяемый равенством
где x∈R означает, что x принадлежит пространстве R.
Сумма линейных операторов обозначается так C=A+B. Легко убедится, что сумма линейных операторов также является линейным оператором.
Применим оператор C к базисному вектору ej, тогда:
Cej= Aej+ Bej= | n | (aij+bij) ej |
∑ | ||
j= 1 |
Следовательно оператору C отвечает матрица ,где i=1,2. m, j=1,2. n, т.е.
3. Умножение линейных операторов
Пусть заданы три линейных пространства R, S и T. Пусть линейный оператор B отображает R в S, а линейный оператор A отображает S в T.
Определение 3. Произведением операторов A и B называется оператор C, для которого выполняется следующее равенство при любом x из R:
Произведение линейных операторов обозначается C=AB. Легко убедится, что произведение линейных операторов также является линейным оператором.
Таким образом оператор C отображает пространство R в T. Выберем в пространствах R, S и T базисы и обозначим через A, B и C матрицы операторов A, B и C соответствующие этим базисам. Тогда отображения линейных операторов A, B, C
можно записать в виде матричных равенств
где x, y, z − векторы x, y, z − представленные в виде координатных столбцов. Тогда
Учитывая произвольность х, получим
Следовательно произведению операторов C=AB соответствует матричное произведение C=AB.
4. Умножение линейного оператора на число
Пусть задан линейный оператор A отображающий R в S и некоторое число λ из поля K.
Определение 4. Произведением оператора A на число λ называется оператор C, для которого выполняется следующее равенство при любом x из R:
Таким образом оператор C отображает пространство R в S. Выберем в пространствах R и S базисы и обозначим через A матрицу оператора A соответствующее этим базисам векторные равенства
можно записать в виде матричных равенств
где x, y, z − векторы x, y, z − представленные в виде координатных столбцов. Тогда
Учитывая произвольность х, получим
Следовательно произведению оператора C на число λ соответствует произведение матрицы A на число λ.
5. Нулевой оператор
Оператор, отображающий все элементы пространства R в нулевой элемент пространства S называется нулевым оператором и обозначается через O. Действие нулевого оператора можно записать так:
6. Противоположный оператор
Противоположным оператору A называется оператор −A удовлетворяющий равенству:
7. Ядро линейного оператора
Определение 5. Ядром линейного оператора A называется множество всех тех элементов x пространства R, для которых выполняется следующее равенство: Ax=0.
Ядро линейного оператора также называют дефектом оператора. Ядро линейного оператора обозначается символом ker A.
8. Образ линейного оператора
Определение 6. Образом линейного оператора A называется множество всех элементов y пространства R, для которых выполняется следующее равенство: y=Ax для всех x из R.
Образ линейного оператора обозначается символом im A.
9. Ранг линейного оператора
Определение 7. Рангом линейного оператора A обозначаемое символом rang A называется число равное размерности образа im A оператора A, т.е.: rang A=dim(im A).
Примеры решения матриц с ответами
Простое объяснение принципов решения матриц и 10 наглядных примеров. В каждом примере поэтапный ход решения и ответ.
Алгоритм решения матриц
Матрица – это математическая таблица с числовыми значениями. Обозначаются матрицы латинскими буквами.
Есть два отличия между матрицами:
- Комплексные матрицы. Это когда хотя бы одно число равно комплексному.
- Действительные матрицы. Это когда в матрице содержаться действительные числа.
С матрицей можно выполнять самые наипростейшие действия: умножение, деление, сложение, вычитание и трансформация.
Сложение и вычитание
Данные действия можно совершать тогда, когда матрицы равны между собой, чтобы в конце получилось выражение аналогичной размерности. Сложение и вычитание выполняются по аналогии друг друга.
Задание
Даны две матрицы, найдите их сумму.
Решение
Элемент первой строки складывается с элементом второй. Абсолютно также совершается вычитание, только вместо плюса, нужно поставить минус.
Задание
Даны две матрицы, найдите их разность.
Решение
Задание
Найдите C=2A +3B, если :
Решение
Нужна помощь в написании работы?
Мы – биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.
Умножение
В математике умножать таблицу с числами можно абсолютно любую. В таком случае число умножается с показателем. Умножаем первое число на первой строке с числом второго столбца и так далее.
Задание
Даны две матрицы. Умножьте их друг на друга.
Решение
Матрицы можно перемножать друг на друга, только если количество столбцов в первой матрице, равно количеству строк второй. Элемент матрицы будет равняться сумме произведений (Aji), где i – строки в таблице; j – строки чисел второй таблицы.
Возведение матрицы в степень
Данную формулу используют лишь в случаях, если матрица стоит в квадратном выражении. Важно знать, что степень должна быть у таких выражений натуральной!
Если число не будет натуральным, то это усложняет возведение матрицы в степень, так как степень n придётся умножить саму на себя n количество раз. Но если у Вас такой случай, то используется следующая формула.
Задание
Решение
В первую очередь найдём, для этого нужно будет просто умножить её саму на себя.
После по формуле подставляем числовые значения.
Расчёт определителя
В математике линейной есть два понятия – определитель и детерминант. Определитель – это какое-либо число, которое ставится в соответствии с квадратной матрицей. Определитель используется при решении многих задач. Найти его можно с помощью формулы.
А детерминант находиться с помощью перемножения простых матриц, используются числа только с побочной и главной диагоналях.
Есть вероятность, что произведения матрицы будут значительно отличаться друг от друга. Если индекс чётный, то число будет со знаком плюс, если нечётный, то число будет со знаком минус. Обозначается определитель det А, а круглые скобки меняются на квадратные.
Дано
Решение
Пользуемся свойствам степеней – A^<3>=A^<2>*A
Далее используем свойство степеней
Ответ
Задание
Найдите определитель матрицы А.
Решение
Обратная матрица
Перед тем, как речь непосредственно пойдёт о самой обратной связи матрицы, давайте разберём алгоритм трансформирования матрицы. Во время трансформации столбцы и строки меняются местами.
Задание
Найти обратную матрицу А.
Решение
Приписываем к матрице А матрицу третьего ряда.
Переводим всё в единичную матрицу.
Ответ
Обратная матрица
Обратная матрица схожа с алгоритмом нахождения обратных чисел. К примеру, если умножить матричную таблицу на обратную матрицу, то в итоге мы получаем A*A(-1)=E. Но чтобы перейти уже к нахождению обратной матрицы, нам придётся найти её определитель. Мы рассмотрим самый простой способ – алгебраических дополнений.
Задание
В пример возьмём квадратную матрицу, она находиться с помощью следующей формулы:
-транспортированные матрицы;|А| – определитель.
Рассмотрим самый простейший пример, где размер таблицы 2*2.
Найти обратную матрицу
Решение
Для начала находим определитель матрицы.
Если ответ равен нулю, то обратной матрицы нет! Так как наш ответ равен -2, то всё в порядке. Следующим действием нам нужно будет рассчитать матрицу миронов. Таблица элементов при этом не изменяется. Где прописан нужным нам элемент, нужно вычеркнуть строчку или столбец, оставшееся число и будет являться мироном.
Подставляем числа, возвращаясь к матрица, которая указана выше.
Всегда начинаем с левого верхнего угла и делаем следующее:
← линиями показано, что нужно и как зачеркнуть.
Как итог, у нас остаётся число 4
Теперь мы переходим к нахождению алгебраических дополнений.
Первым делом нужно поменять знаки у двух чисел в мироне.
← подчёркнуты те числа, у которых мы будем менять знаки.
, вот что у нас получилось.
И наконец-то мы переходим к завершающему этапу, к нахождению транспортированной матрице.
, вспоминаем формулу нахождения, и подставляем числовые значения
В завершении желательно проверить правильно ли мы нашли числовую таблицу. Это делать не обязательно, но рекомендуется, чтобы удостовериться в том, то ответ верный.
Задание
Найдите матрицу А.
Решение
Начинаем с определения матрицы.
Дело осталось за малым – осталось начти алгебраическое дополнение матрицы А:
[spoiler title=”источники:”]
http://planshet-info.ru/kompjutery/matrica-linejnogo-operatora-primery
http://nauchniestati.ru/spravka/primery-resheniya-matricz-s-otvetami/
[/spoiler]
1 / 1 / 1 Регистрация: 21.12.2010 Сообщений: 160 |
|
1 |
|
Найти матрицу по её собственным векторам12.06.2016, 15:16. Показов 3613. Ответов 2
Привет всем. Собственные значения у меня одна идея и D = диагнализированнаяя матрица
0 |
6352 / 4061 / 1509 Регистрация: 09.10.2009 Сообщений: 7,550 Записей в блоге: 4 |
|
12.06.2016, 15:33 |
2 |
Сообщение было отмечено Julila как решение Решение Не понятно, что такое диагонализированная матрица и зачем она здесь нужна…
1 |
3968 / 2948 / 893 Регистрация: 19.11.2012 Сообщений: 6,061 |
|
14.06.2016, 12:54 |
3 |
и зачем она здесь нужна… Нужна, нужна. Ваша матрица T=(v1 v2) – это матрица перехода от первоначального базиса к базису из собственных векторов искомой матрицы, в котором матрица имеет вид D=diag(1,2). Отсюда A=TDT-1. Это и есть ваша формула. Ну а термин на совести ТС.
0 |
IT_Exp Эксперт 87844 / 49110 / 22898 Регистрация: 17.06.2006 Сообщений: 92,604 |
14.06.2016, 12:54 |
Помогаю со студенческими работами здесь Найти координаты вектора a, перпендикулярного векторам b,c Найти орт вектора e, перпендикулярный векторам Найти вектор d, если он перпендикулярен к векторам a и b Найти вектор x, зная, что он перпендикулярен к векторам a, b Как найти четвертый вектор d перпендикулярный к векторам a и b Найти вектор, ортогональный двум данным векторам Искать еще темы с ответами Или воспользуйтесь поиском по форуму: 3 |
4.3.5 Линейный оператор и его матрица
Определение. Пусть даны два пространства и . Если по закону каждому вектору поставлен в соответствие вектор , то говорят, что задан оператор (функция, отображение), отображающий в и пишут .
Обозначение: ; – образ, – прообраз.
Определение. Если для любых и из и любых вещественных чисел и имеет место , то оператор называется линейным.
Произвольные отображения линейных пространств изучаются в курсе математического анализа. В курсе линейной алгебры изучаются лишь линейные отображения.
Пример 6. Оператор действует из в по закону , где , и – фиксированный вектор, например, . Оператор переводит вектор из в другой вектор из . Докажем, что он линейный: . Здесь воспользовались свойствами векторного произведения.
Пример 7. Линеен ли оператор , где произвольный вектор, а вектор – фиксированный?
Решение. , так как , . Следовательно, оператор – нелинейный.
Пусть даны два пространства и и оператор , действующий из в . Пусть в есть базис , а в – базис .
Подействовав оператором на базисные векторы пространства , получим векторы из , которые можно разложить по базису с коэффициентами линейных комбинаций :
Строим матрицу таким образом, чтобы в ее столбцах стояли координаты образов базисных векторов пространства относительно базисных векторов пространства :
.
Матрица называется матрицей линейного оператора , действующего из в . Таким образом, если оператор , то матрица этого оператора имеет размер , то есть у нее строк и столбцов.
Замечание. Если в и выбрать другие базисы, то в этих базисах матрица линейного оператора будет иметь другой вид.
Из определения матрицы линейного оператора следует, что, зная закон (оператор), по которому вектору сопоставляется вектор , можно построить матрицу, и наоборот, любой матрице соответствует некоторый линейный оператор.
Пример 8. Построить матрицу линейного оператора, действующего из в по закону , где векторы и заданы относительно канонического базиса.
Решение. Подействуем оператором на базисные векторы :
;
;
.
Таким, образом, – искомая матрица.
Пример 9. Пусть в выбран базис , , , а в выбран базис , . Найти матрицу линейного оператора, действующего из в по закону , где .
Решение. ; ;
; .
Пример 10. Дана матрица . Найти линейный оператор (закон, по которому действует оператор).
Решение. Матрица – это матрица линейного оператора, действующего из в . Пусть в базис , в базис . Так как в столбцах матрицы стоят координаты векторов относительно базиса , то
(1)
Пусть произвольный вектор из , где – координаты этого вектора в базисе , тогда . Действуя оператором на вектор и учитывая линейность оператора, получим: .
Учитывая (1), имеем:
.
Таким образом, оператор действует по закону
.
Зная матрицу оператора , результат его действия на вектор можно найти в матричной форме. Пусть известна матрица оператора размера с элементами . В этом случае оператор с такой матрицей действует из в . Если – любой вектор из , то результат действия оператора на вектор можно найти по формуле:
,
Где – координаты вектора .
Пример 11. Операторы и действуют в пространстве по законам , , где ; ( – скалярное произведение векторов и ). Найти координаты вектора в каноническом базисе.
Решение. Координаты вектора можно найти двумя способами:
А) найдем матрицу .
Строим матрицу в каноническом базисе:
; ;
.
.
Строим матрицу в каноническом базисе:
; ;
.
;
.
.
Этот способ решения называется матричным;
Б) операторный способ.
. Подействуем оператором на вектор :
, теперь на полученный вектор подействуем оператором :
.
Для самостоятельной работы.
1. Оператор действует по закону:
.
Найти его матрицу в каноническом базисе.
Ответ: .
2. Оператор действует в плоскости и осуществляет зеркальное отражение относительно прямой . Доказать, что он линейный и найти его матрицу в каноническом базисе.
Ответ: .
3. Дана матрица .
А) Найти оператор, матрицей которого является матрица .
Б) Найти образ вектора .
Ответ: .
Как найти матрицу линейного оператора в базисе
Построение матрицы по заданной формуле отображения.
Пусть отображение задано с помощью формулы:
то есть для координат произвольного исходного вектора определены координаты его образа. Тогда, рассматривая вместо произвольного вектора x вектор , найдём его образ, это будет вектор . Для этого в формуле, задающей образ вектора, полагаем , ,…, . Аналогично находим образы для ,…, . Из координат образа вектора составляем 1-й столбец матрицы линейного оператора, аналогично из координат последующих векторов – остальные столбцы. Рассмотрим на примере.
Пример 1. Пусть оператор задан с помощью формулы:
Прежде всего, докажем, что это отображение – действительно линейный оператор.
Отобразим сумму векторов:
Теперь каждую координату получившегося вектора можем преобразовать:
Аналогично для умножения на константу:
Для того чтобы найти матрицу этого линейного оператора, нужно, как было сказано выше, подставить значения x1 = 1, x2 = 0, а затем x1 = 0, x2 = 1. В этом примере образы базисных векторов – соответственно (3, 1) и (2, -1).
Поэтому матрица линейного оператора будет иметь вид:
Аналогичным способом решается задача и для 3 и большего количества переменных.
Пример 2. .
Построим матрицу оператора. Отображая вектор (1,0,0), получаем (1,4,-1), соответственно (0,1,0) переходит в (2,1,-2), а вектор (0,0,1) – в (-1,1,3).
Матрица линейного оператора:
2.2. Построение матрицы оператора в случае, когда известен исходный базис и система векторов, в которую он отображается.
Если задана система из n векторов, образующих базис, и какая-нибудь произвольная система n векторов (возможно, линейно-зависимая), то однозначно определён линейный оператор, отображающий каждый вектор первой системы в соответствующий вектор второй системы.
Матрицу этого оператора можно найти двумя способами: с помощью обратной матрицы и с помощью системы уравнений.
Пусть — матрица оператора в базисе . По условию, для всех индексов . Данные n равенств можно записать в виде одного матричного равенства: , при этом столбцы матрицы — это векторы , а столбцы матрицы — векторы . Тогда матрица может быть найдена в виде .
Пример. Найти матрицу линейного оператора, отображающего базис
в систему векторов .
Здесь , , , и получаем:
Проверка осуществляется умножением получившейся матрицы на каждый вектор: .
Аналогично решаются подобные задачи и для трёхмерного пространства. В приложении (§5) есть несколько вариантов таких задач.
2.3. Прочие способы нахождения матрицы оператора.
Существуют также примеры, где линейный оператор задаётся другими способами, отличными от рассмотренных в п. 2.1 и 2.2.
Пример. Линейными операторами являются как правое, так и левое векторное умножение на фиксированный вектор в трёхмерном пространстве, то есть отображения вида и . Построим матрицу одного из этих операторов, . Для этого найдём образы всех трёх базисных векторов линейного пространства.
Координаты полученных векторов запишем в виде столбцов матрицы оператора.
Аналогично можно построить матрицу линейного оператора :
Пример. Линейный оператор дифференцирования в пространстве всех многочленов степени не более n. Это пространство размерности n + 1. Возьмём в качестве базиса элементы , , ,…, .
Матрица этого линейного оператора:
Линейные операторы могут отображать не только пространства конечной размерности, но и бесконечномерные пространства. Так, оператор дифференцирования может рассматриваться также в пространстве всех непрерывных функций. (В этом пространстве нет конечного базиса). В этом случае, очевидно, оператор не может быть задан матрицей конечного порядка.
Не нашли то, что искали? Воспользуйтесь поиском:
Лучшие изречения: Только сон приблежает студента к концу лекции. А чужой храп его отдаляет. 8829 — | 7543 — или читать все.
78.85.5.224 © studopedia.ru Не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования. Есть нарушение авторского права? Напишите нам | Обратная связь.
Отключите adBlock!
и обновите страницу (F5)
очень нужно
Матрица линейного оператора
Определение 1. Если задан закон, который каждому вектору x?? ставит в соот ветствие вектор y . то говорят, что в линейном пространстве ? задан оператор A , при этом пишут:
Определение 2. Оператор A называется линейным, если для любых x 1 ?? и x 2 ?? и произвольного числа ? выполняются условия:
Рассмотрим теперь в евклидовом пространстве E n базис e 1 ,e 2 . e n и пусть в этом пространстве определён линейный оператор A : y = A x .
Разложим векторы x и y по базису e 1 ,e 2 . e n :
В силу линейности оператора A можно написать
Заметим, что каждый вектор , следовательно, его также можно разложить по базису e 1 ,e 2 . e n , т.е.
В силу единственности разложения по данному базису мы можем при равнять коэффициенты при базисных векторах в правых частях формул (1) и (2); тогда получим:
Получили, что линейному оператору A в данном базисе соответствует квадратная матрица
которая называется матрицей линейного оператора A , i -й столбец которой состоит из координат вектора Ae i (i = 1,2. n ) относительно данного базиса. Отметим, что матрица A оператора A зависит от выбора базиса e 1 ,e 2 . e n .
Итак, мы показали, что всякому линейному оператору A в евклидовом пространстве E n соответствует матрица A ; можно доказать и обратное утверждение: всякую квадратную матрицу A можно рассматривать как матрицу некоторого линейного оператора A в данном базисе e 1 ,e 2 . e n .
Представляют интерес невырожденные линейные операторы, т.е. такие операторы, матрицы которых имеют обратную A -1 , т.е. также являются невырожденными. В этом случае каждому вектору y (образу), определённому соотношением, отвечает единственный вектор x (прообраз) и при этом имеет место матричное равенство: X = A -1 ? Y .
Примеры линейных операторов
1. В пространстве 2-мерных векторов линейным оператором является правило
связывающее вектор-прообраз с вектором-образом
2. В пространстве бесконечно дифференцируемых функций линейным оператором является операция дифференцирования, ставящая в соответствие каждому элементу этого простран ства его производную функцию.
3. В пространстве многочленов P n (t) линейным оператором является операция умножения многочлена на независимую переменную t .
Пример: Известны образы базисных векторов E 3 под действием оператора A :
Найти матрицу этого оператора в исходном базисе.
Решение: По определению y = A x, значит в матричном виде можно записать, что A = X -1 Y . Для нашего примера получаем
Действия над операторами
Сложение линейных операторов. Пусть x?E n , A и B — два линейных оператора в этом пространстве.
Определение 1. Суммой линейных операторов A и B в E n называется оператор C, определяемый равенством Cx = A x + Bx , где x – любой вектор из E n .
Сумма линейных операторов является линейным оператором, причём его матрица C = A + B, где A и B — матрицы линейных операторов A и B .
Умножение линейного оператора на число. Пусть x?E n , линейный оператор A определён в E n , ? — некоторое число.
Определение 2. Произведением линейного оператора A на число ? называется оператор ?A , определяемый равенством .
?A является линейным оператором, а матрица этого линейного оператора получается из матрицы A умножением её на число ? , т.е. она равна ? ? A.
Умножение линейных операторов. Пусть x? E n , y ? E n , z ? E n и кроме того в E n определены линейные операторы A и B таким образом, что y = Bx, z = A y .
Определение 3. Произведением A ? B линейных операторов A и B называется оператор C, определяемый соотношением Cx = A (Bx) .
Таким образом, перемножение линейных операторов состоит в последовательном их применении по отношению к вектору x .
Рассмотрим матрицы – столбцы:
и обозначим через A, B и C — соответственно матрицы линейных операторов A, B и C. Тогда Z = A ? (B ? X) = (A ? B) ? X = C ? X , таким образом, C = A ? B, т.е. матрица произведения линей ных операторов также является линейным оператором.
a) (A ? B)(x + y) = A (B(x + y)) = A (Bx + By) = A (Bx) + A (By) = = (A ? B) ? x + (A ? B) ? y
б) (A ? B)(? x) = A (B(? x)) = A (?Bx) =?A (Bx) =? (A ? B)x
Свойства умножения линейных операторов вытекают из свойств умножения матриц.
Определение 4. Линейные операторы A и В называются равными, если . Равенство операторов обозначается как A = B .
Определение 5. Оператор E называется единичным (или тождественным) оператором, если каждому элементу x линейного пространства он ставит в соответствие тот же самый элемент, то есть
        7.31 .
Решение
        Составим матрицу перехода из координатных столбцов векторов         в базисе         . Получим . Найдём обратную матрицу, используя метод элементарных преобразований над строками. Припишем единичную матрицу справа от матрицы перехода         Первую строку прибавим ко второй и вычтем из третьей, получим         Вторую строку прибавим к первой и дважды вычтем из третьей, получим         Третью строку умножим на (-1). Третью строку, умноженную на (-1) прибавим к первой, получим         Поменяем местами вторую и третью строки         Получилась матрица, которая содержит единичную матрицу слева. Следовательно, в правой части стоит искомая обратная матрица         Сделаем проверку:         Следовательно, обратная матрица найдена верно.
        Матрицу преобразования в базисе         найдём по формуле        
        Ищем произведение
        Тогда
ВНИМАНИЕ! Обратная матрица для всех задач найдена на этой странице. См. выше.
    Вариант 3     Вариант 4     Вариант 6     Вариант 7     Вариант 9     Вариант 11
    Вариант 14     Вариант 18     Вариант 19     Вариант 20     Вариант 21     Вариант 24
    Вариант 25     Вариант 26     Вариант 30     Вариант 31
Линейный оператор
Линейное отображение линейного (векторного) пространства $ mathbb V_ $ в себя $$ mathcal A : mathbb V longmapsto mathbb V $$ называется линейным преобразованием $ mathbb V_ $ или линейным оператором 1) на $ mathbb V_ $.
Напомню свойство линейности: $$ mathcal A (X_1 +X_2)= mathcal A(X_1) + mathcal A(X_2),quad mathcal A (alpha_1 X_1)= alpha_1 mathcal A (X_1), $$ или, в эквивалентном виде: $$ mathcal A(alpha_1 X_1 + alpha_2 X_2)= alpha_1 mathcal A(X_1) + alpha_2 mathcal A(X_2) $$ для $ forall subset mathbb V, forall subset mathbb R mbox mathbb C $ (здесь $ alpha_1,alpha_ 2 $ — константы из $ mathbb R_ $ если $ mathbb V_ $ вещественное пространство, и из $ mathbb C_ $, если оно комплексное).
Примеры линейных операторов
Бóльшую часть примеров пункта ☞ ПРИМЕРЫ ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ представляют именно линейные операторы. Укажу еще несколько, к которым буду часто обращаться.
Все это — примеры линейных операторов. Но вот отображение сдвига $ (x,y,z) mapsto (x+1,y,z+2) $ оператором не является поскольку $$ alpha > (x,y,z) = ( alpha > x, alpha > y, alpha > z) mapsto ( alpha > x+1, alpha > y, alpha > z+2) ne alpha > (x+1,y,z+2) . $$
Пример 2. В пространстве $ mathbb R^ $ отображение ортогонального проецирования на плоскость $ x+y-7, z=0 $ будет линейным оператором (а вот на плоскость $ x+y-7, z=1 $ — не будет!). Вообще, в произвольном пространстве $ mathbb V_ $ разбитом в прямую сумму нетривиальных подпространств $ mathbb V= mathbb V_1 oplus mathbb V_2 $ отображение, сопоставляющее вектору $ X_ $ его проекцию на подпространство $ mathbb V_1 $ параллельно подпространству $ mathbb V_2 $, будет оператором.
Пример 3. В пространстве $ mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ le 3 $ отображение $ mathcal A_ $ действует по правилу
$$ mathcal A (f(x)) = f(x) (x^2-2) pmod , $$ т.е. полином $ f_(x) $ отображается в остаток от деления произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Это отображение будет оператором в $ mathbb P_3 $. Действительно, если $$ beginf_1(x)(x^2-2) equiv q_1(x)(x^4-x^3-x^2+x)+ r_1(x), , \ f_2(x)(x^2-2) equiv q_2(x)(x^4-x^3-x^2+x)+ r_2(x) , end $$ при $ subset mathbb R[x], deg r_1(x) le 3, deg r_2(x) le 3 $, то $$ (alpha_1 f_1(x)+alpha_2 f_2(x)) (x^2-2) equiv (alpha_1 q_1(x)+alpha_2 q_2(x))(x^4-x^3-x^2+x)+ (alpha_1 r_1(x)+alpha_2 r_2(x)) ; $$ очевидно, что $ deg (alpha_1 r_1(x)+alpha_2 r_2(x)) le 3 $. ♦
Пример 4. Задачу интерполяции можно интерпретировать как построение некоторого отображения. В интерполяционной таблице
$$ beginx & x_1 & x_2 & dots & x_n \ hline y & y_1 & y_2 &dots & y_n end qquad npu qquad , dots, x_, y_,dots,y_ > subset mathbb C $$ будем считать узлы $ _^n $ фиксированными, а значения $ _^n $ — переменными. Эта таблица однозначно определяет интерполяционный полином $ f(x)=A_+A_1x+dots+A_x^ $ со свойством $ f(x_j)=y_j $ при $ j in $. При этом $ >_^ subset mathbb C $. Будет ли получившееся отображение $$ (y_1,dots,y_n) mapsto (A_0,A_1,dots,A_) $$ оператором на $ mathbb C^n $? Покажем, что отображение $$ mathcal A(y_1,dots,y_n) = f(x) in mathbb C[x] $$ является линейным отображением. Действительно, решением задачи интерполяции для таблицы $$ beginx & x_1 & x_2 & dots & x_n \ hline y & alpha y_1 & alpha y_2 &dots & alpha y_n end qquad npu qquad forall alpha in mathbb C $$ является полином $ alpha f(x) $. Если же, вдобавок, решением задачи интерполяции для таблицы $$ beginx & x_1 & x_2 & dots & x_n \ hline y & z_1 & z_2 &dots & z_n end qquad npu qquad ,dots,z_ > subset mathbb C $$ является полином $ g(x)in mathbb C[x], deg g(x) le n-1 $, то решением задачи интерполяции для таблицы $$ beginx & x_1 & x_2 & dots & x_n \ hline y & y_1+z_1 & y_2+z_2 &dots & y_n+z_n end qquad $$ будет полином $ f(x)+g(x) $ и этот полином будет единственным решением среди полиномов степеней $ le n-1 $. Таким образом, линейность отображения $ mathcal A $ установлена. Далее, множество $ mathbb P_ $ полиномов из $ mathbb C[x] $ степеней $ le n-1 $ изоморфно пространству $ mathbb C^n $. Следовательно, «сложное» отображение $$ (y_1,dots,y_n) mapsto f(x)=A_+A_1x+dots+A_x^ mapsto (A_0,A_1,dots,A_) $$ является линейным отображением из $ mathbb C^n $ в $ mathbb C^n $, т.е. оператором на $ mathbb C^n $.
По аналогии с задачей алгебраической интерполяции, можно поставить и задачу тригонометрической интерполяции. Имеем здесь «точку входа» в теорию дискретного преобразования Фурье. ♦
В пространстве $ mathbb P_2 $ оператор действует следующим образом:
$$ mathcal A (x^2+x+1) =2,x+1, mathcal A (x^2-x-1) =2,x^2-1, mathcal A (x+1) =-x^2+x+1 . $$ Вычислить $ mathcal A (x^2) $ и $ mathcal A (x^2+1) $.
Пример 5. В пространстве полиномов степени не выше $ n_ $ с вещественными коэффициентами от $ m_ $ переменных $ x_1,x_2,dots,x_ $ отображение
$$ f(x_1,x_2,dots,x_m) mapsto frac +frac+ dots+ frac $$ яыляется линейным оператором. Этот оператор известен как оператор Лапласа и для него используется символьное обозначение $$ Delta = frac +frac+ dots+ frac , . $$
Пример 6. В линейном пространстве квадратных матриц порядка $ n_ $ с вещественными элементами рассмотрим коммутирующее отображение
$$ mathcal K (X) = AX-XA , $$ а также отображение Ляпунова $$ mathcal V (X) = A^X+XA $$ при произвольной фиксированной квадратной матрице $ A_ $ и $ ^ $ означающем транспонирование. Легко проверить, что оба отображения $ mathcal K $ и $ mathcal V $ являются операторами. ♦
Основные определения
Все введенные для линейного отображения понятия переносятся на этот частный случай. Например, ядром оператора называется множество векторов, отображаемых оператором в нулевой вектор: $$mathcaler (mathcal A)= left ; $$ а образом оператора называется множество всех векторов из $ mathbb V_ $, для каждого из которых существует прообраз в том же пространстве: $$mathcalm (mathcal A)= left .$$
Теорема 1. Множества $ mathcaler (mathcal A) $ и $ mathcalm (mathcal A) $ являются подпространствами пространства $ mathbb V_ $.
Доказать, что для оператора в $ mathbb R^4 $
$$ mathcal A left(beginx_1 \ x_2 \ x_3 \ x_4 end right)= left(beginx_3 \ x_4 \ 0 \ 0 end right) $$ имеет место равенство $ mathcaler (mathcal A) = mathcalm (mathcal A) $.
Для оператора $ mathcal A_ $ его дефектом его называется размерность ядра, а его рангом — размерность образа: $$ operatorname(mathcal A )=dim (mathcaler (mathcal A )) , operatorname(mathcal A )= dim (mathcalm (mathcal A )) . $$ Оператор называется невырожденным если $ operatorname(mathcal A )=0 $.
Пример. В пространстве $ mathbb R^ $ оператор проецирования на плоскость:
$$ mathcal A left(x, y, zright) longmapsto left(x, y, 0 right) $$ является вырожденным поскольку его ядро нетривиально: $ mathcaler (mathcal A)= $. ♦
Следующий результат является следствием теоремы $ 4 $ из ☞ ПУНКТА.
Теорема 2. Имеет место равенство:
$$ dim mathbb V=dim left( mathcaler (mathcal A) right) + dim left( mathcalm (mathcal A) right) = operatorname(mathcal A )+ operatorname(mathcal A ) .$$
Отображение $ mathcal P: mathbb V longmapsto mathbb V $ называется произведением оператора $ mathcal A $ на оператор $ mathcal B $ если $ mathcal P(X)=mathcal A (mathcal B(X)) $ для любого $ Xin mathbb V_ $. Записывать этот факт будем в виде $ mathcal P=mathcal A , mathcal B $.
Теорема 3. Произведение операторов является оператором на $ mathbb V_ $. Операция произведения ассоциативна.
Доказательство. Имеем на основании свойства линейности $$mathcal P (alpha_1X_1+alpha_2X_2)= mathcal A (mathcal B(alpha_1X_1+alpha_2X_2))=mathcal A (alpha_1mathcal B(X_1)+ alpha_2mathcal B(X_2))=$$ $$=alpha_1mathcal A (mathcal B(X_1))+ alpha_2mathcal A (mathcal B(X_2))=alpha_1mathcal P(X_1)+alpha_2(X_2).$$
Далее, для любого вектора $ X_ $: $$mathcal A_1(mathcal A_2mathcal A_3(X))= mathcal A_1(mathcal A_2(mathcal A_3(X)))=mathcal A_1mathcal A_2(_3(X)) ,$$ откуда и следует ассоциативность. ♦
Говорят, что операторы $ mathcal A $ и $ mathcal B $ коммутируют если $ mathcal A , mathcal B = mathcal B , mathcal A $.
Пример. В пространстве полиномов $ mathbb P_ $ рассмотрим дифференциальный оператор
$$mathcal A = xfractimes Box — 1times Box : mathcal A(p(x)) = x p'(x) — p(x) .$$ Этот оператор не коммутирует с обычным оператором дифференцирования $ displaystyle mathcal B= frac$: $$mathcal A (x^2)=x^2, quad mathcal B (mathcal A(x^2))=2,x, quad mathcal B (x^2)=2,x, quad mathcal A (mathcal B (x^2))=0 .$$ ♦
Оператор $ mathcal E $, отображающий произвольный вектор $ Xin mathbb V_ $ в себя : $ mathcal E(X)= X $, называется тождественным на $ mathbb V_ $. Оператор $ mathcal B $ называется (левым) обратным оператору $ mathcal A_ $, если $ mathcal Bmathcal A=mathcal E $. В этом случае оператор $ mathcal A_ $ называют обратимым и записывают: $ mathcal B=mathcal A^ $.
Не всякий оператор обратим.
Пример. В пространстве $ mathbb R^ $ для оператора проецирования на плоскость:
$$ mathcal A left(x, y, zright) longmapsto left(x, y, 0 right) $$ обратного не существует, т.к. $ mathcal A(0,0,1)=(0,0,0) $ и ни при каком выборе оператора $ mathcal B $ нельзя добиться выполнения равенства $ mathcal B(0,0,0)=(0,0,1) $. ♦
Показать, что обратным для оператора
$$fracint_0^x : p(x) longmapsto fracint_^ p(t) d, t ,$$ на $ mathbb P_ $ является оператор $$ fracleft(xtimes Box right) : p(x) longmapsto (xp(x))’ .$$
Теорема 4. Оператор $ mathcal A_ $ обратим тогда и только тогда, когда когда он невырожден: $ operatorname (mathcal A) =0 $. В этом случае $ mathcal A^ $ единствен и коммутирует с $ mathcal A $.
При $ Kin mathbb N $ и $ K>1 $, $ K_ $-я степень оператора $ mathcal A $ определяется рекурсивной формулой $$mathcal A^=mathcal A (mathcal A^) .$$ Если, вдобавок, $ mathcal A $ невырожден, то отрицательная степень оператора определяется формулой $$mathcal A^=left(mathcal A^right)^K . $$ Полагают также $ mathcal A^= $ для любого $ mathcal A ne $.
Теорема 5. Степени оператора $ mathcal A $ коммутируют:
$$mathcal A^ mathcal A^=mathcal A^mathcal A^=mathcal A^ .$$
Пример. $ K_ $-й степенью оператора дифференцирования в пространстве полиномов $ mathbb P_ $ будет оператор нахождения $ K_ $-й производной:
$$left( fracright)^K = frac .$$ Очевидно, что при $ K_>n $ этот оператор будет нулевым. ♦
Пример. В произвольном пространстве $ mathbb V_ $ разбитом в прямую сумму нетривиальных подпространств $ mathbb V= mathbb V_1 oplus mathbb V_2 $ оператор проецирования $ mathcal P $ на подпространство $ mathbb V_1 $ параллельно подпространству $ mathbb V_2 $ обладает свойством $ mathcal P^2 = mathcal P $ (проецирование проекции оставляет ее на месте). ♦
Оператор $ mathcal A $, обладающий свойством $ mathcal A^2 = mathcal A $, называется идемпотентным 3) .
Пример. В пространстве $ mathbb P_3 $ полиномов с вещественными коэффициентами степени $ le 3 $ отображение $ mathcal A_ $ действует по правилу
$$ mathcal A (f(x)) = f(x) (x^2-2) pmod , $$ т.е. полином $ f_(x) $ отображается в остаток от деления произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Для этого оператора $ K_ $-й его степенью является оператор $$ mathcal B (f(x)) = f(x) (x^2-2)^K pmod . $$ Действительно, если $$ f(x)(x^2-2) equiv q(x)(x^4-x^3-x^2+x)+ r(x) $$ при $ subset mathbb R[x] $ и $ deg r(x) le 3 $, то $$ f(x)(x^2-2)^2 equiv q(x)(x^4-x^3-x^2+x)(x^2-2)+ r(x)(x^2-2) . $$ Но тогда $$ mathcal A^2 (f(x))= mathcal A (r(x)) = r(x) (x^2-2) pmod equiv $$ $$ equiv f(x)(x^2-2)^2 pmod . $$ Завершает доказательство святая индукция по степени $ K_ $… ♦
Пусть задан произвольный полином $ g(x)=b_x^m+b_1x^+dots+b_m $ из $ mathbb R[x] $ или $ mathbb C[x] $. Выражение $$g(mathcal A )= b_0mathcal A^+b_1mathcal A^+dots+b_m$$ будем называть операторным полиномом.
Доказать, что операторные полиномы коммутируют: $ g_1(mathcal A )g_2(mathcal A )=g_2(mathcal A )g_1(mathcal A ) $.
Доказать, что для любого $ mathcal A in om(mathbb V,mathbb V) $ всегда найдется полином $ g_(x) $, $ deg g le n^2+1 $ такой, что $ g(mathcal A)= $.
Сформулируем еще один результат, являющийся частным случаем приведенного в пункте ☞ СВОЙСТВА ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ.
Теорема 6. Пусть $ $ — произвольный базис $ mathbb V_ $, а $ Y_1,Y_2,dots,Y_n $ — произвольные векторы того же пространства. Существует единственный оператор $ mathcal A: mathbb V longmapsto mathbb V $ такой, что
$$ mathcal A(X_1)=Y_1,mathcal A(X_2)=Y_2, dots,mathcal A(X_n)=Y_n .$$
Доказательство. Искомый оператор строится следующим образом. Если $ X=x_1X_1+x_2X_2+dots+x_nX_n $ — разложение произвольного вектора $ X in mathbb V $ по базису, то $$ mathcal A(X)=x_1 Y_1+x_2Y_2+dots+ x_nY_n . $$ Единственность этого оператора доказывается от противного. Любой другой оператор $ mathcal B $, удовлетворяющий условиям $ _^n $, будет действовать на тот же вектор $ X_ $ с тем же результатом: $$ mathcal B(X)=x_1 mathcal B(X_1)+x_2mathcal B(X_2) +dots+ x_nmathcal B(X_n)= x_1 Y_1+x_2Y_2+dots+ x_nY_n= mathcal A(X) . $$ ♦
Таким образом, оператор — как функция, действующая в $ n_ $-мерном линейном пространстве, однозначно определяется заданием на $ n_ $ линейно независимых векторах. В доказательстве теоремы дается и конструктивный способ представления оператора по этим значениям (т.е. строится его “интерполяционная формула” ).
Матрица оператора
Рассмотрим оператор $ mathcal A $ на $ mathbb V_ $ и пусть $ $ — базис $ mathbb V_ $. Являясь частным случаем линейного отображения, оператор должен обладать и соответствующей матрицей. Существенной особенностью, отличающей наш случай от рассмотренного в пункте ☞ МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ, является невозможность произвола при выборе базиса для $ mathcalm (mathcal A) $. Поскольку $ mathcalm (mathcal A) $ является подпространством $ mathbb V_ $, то было бы слишком большой роскошью иметь два разных базиса для одного и того же пространства.
Найдем координаты образов базисных векторов $ mathcal A (X_1),dots,mathcal A (X_n) $ в том же базисе $ $: $$ left mathcal A(X_1)&=& alpha >>_X_1+ alpha >>_X_2+dots+ alpha >>_X_n, \ mathcal A(X_2)&=& alpha >>_X_1+ alpha >>_X_2+dots+ alpha >>_X_n, \ dots & & qquad dots , \ mathcal A(X_n)&=&alpha_X_1+alpha_X_2+dots+alpha_X_n. end right. $$ Матрица $$ mathbf A= left(beginalpha >>_ & alpha >>_& dots & alpha_ \ alpha >>_ & alpha >>_& dots & alpha_ \ dots & & & dots \ alpha >>_ & alpha >>_& dots & alpha_ end right)_, $$ в столбцах которой стоят координаты образов базисных векторов, называется матрицей оператора $ mathcal A_ $ в базисе $ $.
Пример. Известны образы базисных векторов $ mathbb R^ $ под действием оператора $ mathcal A_ $:
$$mathcal A left( begin5 \ 3 \ 1 endright)= left( begin-2 \ 1 \ 0 endright) , mathcal A left( begin1 \ -3 \ -2 endright) = left( begin-1 \ 3 \ 0 endright) , mathcal A left( begin1\ 2 \ 1 endright)= left( begin-2 \ -3 \ 0 endright) . $$ Найти матрицу этого оператора в исходном базисе.
Решение. Элементы матрицы $ $ ищутся по формулам из определения, которые можно переписать в матричном виде: $$left[ X_1,dots,X_n right] =left[ mathcal A (X_1),dots,mathcal A (X_n) right] .$$ Откуда $$= left[ X_1,dots,X_n right]^ left[ mathcal A (X_1),dots,mathcal A (X_n) right] ,$$ и для нашего примера эта формула дает $$ = left(begin5&1&1 \ 3&-3&2 \ 1&-2&1 endright)^ left(begin-2&-1&-2 \ 1&3&-3 \ 0&0&0 endright) = $$ $$ =left(begin1&-3&5\ -1&4&-7\ -3&11&-18 endright) left(begin-2&-1&-2 \ 1&3&-3 \ 0&0&0 endright) = left(begin-5&-10&7\ 6&13&-10\ 17&36&-27 end right). $$ ♦
В пространстве $ mathbb P_3 $ полиномов с вещественными коэффициентами степени $ le 3 $ оператор $ mathcal A_ $ действует по правилу
$$ mathcal A (f(x)) = f(x) (x^3+2,x^2+1) pmod , $$ т.е. полином $ f_(x) $ отображается в остаток от деления произведения $ f(x) (x^3+2,x^2+1) $ на $ x^4+4 $. Найти матрицу оператора $ mathcal A_ $ в базисе $ $.
Ответ. $$ left(begin1 & -4 & -8 & 0 \ 0 & 1 & -4 & -8 \ 2& 0 & 1 & -4 \ 1 & 2 & 0 & 1 end right) . $$
Теорема 1. Координаты произвольного вектора $ X=x_1X_1+dots+x_nX_n $ и его образа $ Y=mathcal A(X)=y_1X_1+dots+y_nX_n $ связаны формулой
$$ left(beginy_1 \ vdots \ y_n end right) = left(beginx_1 \ vdots \ x_n end right) . $$
Как изменяется матрица оператора при переходе к новому базису?
Доказательство ☞ ЗДЕСЬ.
Пример. Оператор $ mathcal A $ в базисе пространства $ mathbb R^ $
Матрицы $ $ и $ $, связанные соотношением $ =C^cdot cdot C $ при какой-то неособенной матрице $ C_ $, называются подобными, этот факт будем записывать: $ doteq $.
Доказать, что отношение подобия есть отношение эквивалентности, и если $ doteq $ то $ g()doteq g() $ при любом полиноме $ g_(x) $.
Теорема 3. Для оператора $ mathcal A_ $ ранг его матрицы является инвариантом, т.е. не зависит от выбора базиса пространства. Этот ранг совпадает с рангом оператора $ mathcal A_ $.
Доказательство. Если $ $ и $ $ — матрицы оператора в двух разных базисах, то они являются подобными: $ =C^ C $. По свойству ранга матрицы имеем: $ operatorname( )= operatorname() $. ♦
Дефект оператора $ mathcal A_ $ совпадает с дефектом его матрицы в произвольном базисе пространства.
Теорема 4. Для оператора $ mathcal A_ $ определитель и след его матрицы являются инвариантами, т.е. не зависят от выбора базиса пространства.
Доказательство. Действительно, для подобных матриц $ $ и $ $, на основании теоремы Бине-Коши имеем: $$ det () = det (C^ C) = det (C^) cdot det () cdot det (C) =det () . $$ Далее, по свойству следа матрицы: $$ operatorname() = operatorname(C^ C)=operatorname( cdot C cdot C^)=operatorname() . $$ ♦
Этот результат позволяет ввести понятие определителя и следа оператора $ mathcal A_ $ — посредством матрицы этого оператора в произвольном базисе пространства. Такое определение оказывается корректным поскольку оба значения не зависят от выбора базиса.
— Для ответа на этот вопрос рассмотрим оператор в $ mathbb R^2 $, заданный формулой: $$ left(beginy_1 \ y_2 end right)= left(begin1 & — 3 \ 1 & -1 end right) left(beginx_1 \ x_2 end right) . $$ Свойство линейности оператора как отображения плоскости проявляется в том, что параллельные отрезки он отображает в параллельные же отрезки (см. упражнение к теореме 2 из ☞ ПУНКТА ), и, следовательно, любой параллелограмм отображается им в параллелограмм. Площади соответствующих параллелограммов оказываются связанными через определитель матрицы — более точно, через модуль этого определителя. В частном случае настоящего примера это проверяется непосредственно; что касается обобщения на произвольное евклидово пространство, в котором понятие объема вводится аксиоматически то сошлюсь на упражнение 3 ☞ ЗДЕСЬ.
Иными словами: «физический» смысл определителя оператора заключается в том, что модуль его значения представляет коэффициент расширения 4) объема (в настоящем примере — площади) тела (соответственно, плоской фигуры) под воздействием этого оператора.
Теорема 5. Оператор обратим тогда и только тогда, когда когда его определитель отличен от нуля.
Теорема 6. Линейное пространство $ om(mathbb V,mathbb V) $ операторов на $ mathbb V_, dim mathbb V = n $ изоморфно линейному пространству квадратных матриц порядка $ n_ $ (с элементами из $ mathbb R_ $ или из $ mathbb C_ $).
Это утверждение является простым следствием теоремы 2, приведенной в пункте ☞ МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ. Однако в случае операторов установленный изоморфизм сохранит не только результат операции сложения, но и результат операции умножения: $$ . mbox mathcal A_1 leftrightarrow mathbf A_1, mathcal A_2 leftrightarrow mathbf A_2, mbox mathcal A_1+ mathcal A_2 leftrightarrow mathbf A_1 + mathbf A_2, lambda mathcal A_1 leftrightarrow lambda mathbf A_1 , mathcal A_1 mathcal A_2 leftrightarrow mathbf A_1 mathbf A_2 . $$ Я сформулирую этот «усиленный вариант» изоморфизма в виде набора свойств, которыми буду пользоваться по мере возникновения потребности.
Теорема 7. В любом базисе пространства
а) матрица нулевого оператора $ mathcal O $ является нулевой матрицей $ mathbb O_ $, а матрица тождественного оператора $ mathcal E $ является единичной матрицей $ E_ $; обратно: если матрица оператора в этом базисе — нулевая (единичная), то оператор является нулевым (соответственно, тождественным);
б) матрица произведения операторов совпадает с произведением матриц этих операторов 5) ;
в) коммутирующим операторам соответствуют коммутирующие матрицы;
г) если $ $ — матрица оператора, то $ ^ $ — матрица обратного оператора;
д) если $ $ — матрица оператора $ mathcal A $, то матрицей операторного полинома $ g (mathcal A) $ является матрица $ g() $ .
Матрица оператора и матрица перехода от базиса к базису
Эти матрицы как-то взаимодействовали между собой в предыдущем пункте, хотя вторая была определена совершенно в другом разделе. Обе матрицы квадратные, обе имеют в определении «завязку» на базис пространства $ mathbb V_ $. У начинающих изучать теорию часто возникает путаница при различении этих определений.
«Физический» смысл этих понятий различен. Образно говоря, если рассматривать оператор как процесс (точнее: установленную связь между входными и выходными значениями процесса), то выбор базиса можно интерпретировать как выбор точки зрения на этот процесс (можно трактовать эти слова как формализацию выражения «рассмотрим этот процесс под другим углом»).
Тем не менее, с чисто формальной точки зрения, матрица $ C_ $ перехода от базиса $ $ пространства $ mathbb V_ $ к какому-то другому базису $ $ того же пространства может считаться матрицей некоторого оператора, действующего в этом пространстве. В самом деле, на основании теоремы, приведенной в конце ☞ ПУНКТА, существует единственный оператор $ mathcal C $, переводящий старые базисные векторы в новые, взятые в той же последовательности: $$ mathcal C (X_1)=mathfrak X_1, mathcal C (X_2)= mathfrak X_2, dots, mathcal C (X_n)= mathfrak X_n . $$ Но тогда, по определению, матрица оператора $ mathcal C $ в базисе $ $ совпадает с матрицей $ C_ $ перехода от базиса $ $ к базису $ $.
Я буду записывать матрицы операторов и матрицы переходов от базиса к базису в разных стилях: $ mathbf A, mathbf B,dots $ и, соответственно, $ C, P, T, dots $ — с целью быстрого распознавания их «физической» сущности.
Матрица оператора проецирования
Настоящий пункт может быть пропущен при первоначальном чтении.
Теорема. Рассмотрим линейную оболочку линейно независимой системы столбцов $ subset mathbb R^n $.
$$ mathbb M =left subset mathbb R right>= mathcal L (Y_1,dots,Y_k) , . $$ Пусть скалярное произведение векторов $ X_ $ и $ Y_ $ задается стандартным способом, т.е. $ langle X,Y rangle =x_1y_1+dots+x_ny_n $. Ближайшей к точке $ X_0 subset mathbb R^n $ точкой многообразия (или ортогональной проекцией точки $ X_0 $ на многообразие) $ mathbb M_ $ является $$ X_ = mathbf L (mathbf L^ mathbf L )^ mathbf L^ X_0 , . $$ Здесь $ mathbf L=[Y_1 |dots |Y_k]_ $.
Доказательство. Пусть $ X_0=X_0^>+X_0^> $, где $ X_0^> $ — ортогональная проекция точки $ X_0 $ на $ mathbb M $, а $ X_0^> $ — ортогональная составляющая. Тогда $$ mathbf L^ X_0^>=mathbb O $$ поскольку $ Y_1^ X_0^>=0,dots, Y_k^ X_0^>=0 $. Далее, $ X_0^> $ можно разложить по базису $ $: $$ X_0^>=alpha_1 Y_1+dots+ alpha_k Y_k quad npu quad subset mathbb R , . $$ Следовательно, $$ mathbf L^ X_0=mathbf L^ (X_0^>+X_0^>)=mathbf L^ X_0^>= mathbf L^ (alpha_1 Y_1+dots+ alpha_k Y_k)= $$ $$ =left( beginalpha_1 Y_1^ Y_1 +dots + alpha_k Y_1^ Y_k \ alpha_1 Y_2^ Y_1 +dots + alpha_k Y_2^ Y_k \ dots \ alpha_1 Y_k^ Y_1 +dots + alpha_k Y_k^ Y_k end right)= mathbf L^ mathbf L left( beginalpha_1 \ alpha_2 \ vdots \ alpha_k end right), . $$ Тогда $$ mathbf L (mathbf L^ mathbf L )^ mathbf L^ X_0= mathbf L left( beginalpha_1 \ alpha_2 \ vdots \ alpha_k end right) =alpha_1 Y_1+dots+ alpha_k Y_k= X_0^> , . $$ На основании теорем $ 1_ $ и $ 2_ $, приведенных ☞ ЗДЕСЬ, точка $ X_0^> $ является ближайшей точкой многообразия $ mathbb M $ к точке $ X_ $. ♦
Матрица $ P=mathbf L (mathbf L^ mathbf L )^ mathbf L^ $ является матрицей оператора ортогонального проецирования на многообразие $ mathbb M_ $ в стандартном базисе $$ bigg_j = big[underbrace_,0,dots,0big]^ bigg>_^n , . $$ Она симметрична и идемпотентна, т.е. обладает свойством $ P^2=P $.
Пример. В $ mathbb R^ $ найти матрицу проецирования на плоскость $ x+y+z=0 $.
Решение. Параметрическое задание плоскости: $$ mathbb M=>_ + lambda_2 underbrace>_ big| subset mathbb R > , . $$ Имеем: $$ mathbf L= left(begin1 & 0 \ -1 & 1 \ 0 & -1 end right) Rightarrow mathbf L^ mathbf L= left(begin2 & -1 \ -1 & 2 end right) Rightarrow (mathbf L^ mathbf L )^= left(begin2/3 & 1/3 \ 1/3 & 2/3 end right) Rightarrow $$ $$ Rightarrow mathbf L (mathbf L^ mathbf L )^ mathbf L^= frac left(begin2 & -1 & -1 \ -1& 2 & -1 \ -1 & -1 & 2 end right) , . $$ ♦
Матрица оператора отражения (оператора Хаусхолдера)
Настоящий пункт может быть пропущен при первоначальном чтении.
В пространстве $ mathbb R^n $ со стандартным скалярным произведением рассмотрим плоскость, заданную уравнением $$ C^X= c_1x_1+c_2x_2+dots+c_nx_n = 0 $$ при векторе нормали $ C^=(c_1,c_2,dots,c_n) $ единичной длины: $ |C|^2= C^C=1 $. Действие оператора зеркального отражения или оператора Хаусхолдера 6) относительно этой плоскости на вектор (точку) $ X in mathbb R^n $ определим правилом $$ mathcal H( X^> + X^>)= X^> — X^> ; $$ здесь $ X^> $ — ортогональная проекция вектора $ X_ $ на заданную плоскость, а $ X^> $ — ортогональная составляющая вектора $ X_ $ относительно этой плоскости.
Теорема. Оператор $ mathcal H $ задается уравнением
$$ mathcal H(X)=X-2, langle X,C rangle C=X-2, C (C^X)= X-2, C^XC , . $$
Доказательство. $$ mathcal H( X^> + X^>)=X^> + X^>-2, langle X^>,C rangle C-2, langle X^>,C rangle C = $$ Поскольку $ X^> $ ортогонален, а вектор $ X^> $ коллинеарен вектору $ C $ единичной длины, то $$= X^> + X^> — 2, X^> = X^> — X^> , . $$ ♦
Теорема. Матрица оператора $ mathcal H $ в стандартном базисе
$$ bigg_j = big[underbrace_,0,dots,0big]^ bigg>_^n , . $$ имеет вид $$ mathbf H_= E-2, C cdot C^ = left( begin1-2c_1^2 & -2,c_1c_2 & dots & — 2 c_1 c_n \ -2,c_1c_2 & 1-2c_2^2 & dots & — 2 c_2 c_n \ vdots & & & vdots \ — 2 c_1 c_n & — 2 c_2 c_n & dots & 1-2c_n^2 end right) , . $$
Пример. Найти зеркальное отражение точки $ [3,2,3] $ относительно плоскости $ 2,x-2,y+z = 0 $.
Решение. Здесь $ C^=[2/3,-2/3,1/3] $ и $$ mathcal H(X)= left( begin3 \ 2 \ 3 end right) — 2([3,2,3],[2/3,-2/3,1/3]) left( begin2/3\ -2/3 \ 1/3 end right)= left( begin7/9 \ 38/9 \ 17/9 end right) , . $$ Проверим результат посредством матричного представления: $$ mathbf H_C= left( begin1/9 & 8/9 & -4/9 \ 8/9 & 1/9 & 4/9 \ -4/9 & 4/9 & 7/9 end right) quad Rightarrow quad mathbf H left( begin3 \ 2 \ 3 end right)= left( begin7/9 \ 38/9 \ 17/9 end right) , . $$ ♦
Матрица $ mathbf H_ $ одновременно симметрична и ортогональна, и $ det mathbf H_=-1 $. Следовательно, ей обратная существует и совпадает с ней самой: $$ mathbf H_^= mathbf H_ , . $$
Инвариантное подпространство
Задача. Подобрать базис пространства $ mathbb V_ $ так, чтобы матрица заданного оператора $ mathcal A_ $ имела наиболее простой вид.
Исследуем действие оператора $ mathcal A $ на произвольное подпространство $ mathbb V_1 subset mathbb V $: $$mathcal A (mathbb V_1)= left .$$ Вообще говоря, множества $ mathbb V_1 $ и $ mathcal A (mathbb V_1) $ будут различными, т.е. $ exists X_1 in mathbb V_1 $ такой, что $ mathcal A (X_1)notin mathbb V_1 $.
Подпространство $ mathbb V_1 $ называется инвариантным подпространством оператора $ mathcal A $, если оно отображается этим оператором в себя: $$ mathcal A(mathbb V_1)subset mathbb V_1 .$$
$ mathbb V_1= $ и $ mathbb V_1=mathbb V $ — тривиальные инвариантные подпространства произвольного оператора $ mathcal A $.
Нас будут интересовать нетривиальные инвариантные подпространства.
Пример. Оператор
$$left(beginx \ y \ z end right) longmapsto left(begin/ & —/ & 0 \ / & / & 0 \ 0 & 0 & 1 end right) left(beginx \ y \ z end right) $$ задает в пространстве поворот вокруг оси $ mathbb O z $ на угол $ +pi /4 $. Нетривиальными инвариантными подпространствами будут
а) ось вращения $ mathbb V_1=> mid z in mathbb R> $, $ dim mathbb V_1=1 $ и
б) плоскость, перпендикулярная оси вращения $ mathbb V_2=> mid subset mathbb R> $, $ dim mathbb V_2= 2 $. ♦
Пример. Оператор
$$left(beginx \ y end right) longmapsto left(beginlambda_1 x \ lambda_2 y end right) $$ задает на плоскости «растяжение»: $ x_ $-компонента увеличивается в $ lambda_ $ раз, а $ y_ $-компонента — в $ lambda_ $ раз. При любой комбинации коэффициентов растяжения координатные оси будут инвариантными подпространствами. Однако в частном случае $ lambda_1=lambda_2 $ инвариантной будет также любая прямая, проходящая через начало координат. ♦
Пример. Оператор в $ mathbb R^_ $ задан блочной матрицей
$$X longmapsto left( begin_1 & \ mathbb O & _2 end right) X $$ где $ _1 $ — $ n_1times n_1 $-матрица, $ _2 $ — $ (n-n_1)times (n-n_1) $-матрица. Множество столбцов $$mathbb V_1=left,0,dots,0]^> bigg| > subset mathbb R right>$$ образует инвариантное подпространство, $ dim mathbb V_1=n_1 $. Если же, вдобавок, матрица, обозначенная $ $ — нулевая, то вторым инвариантным подпространством будет $$ mathbb V_2=left,dots,x_n]^> bigg| ,dots, x_n > subset mathbb R right> .$$ ♦
Теорема. $ mathcaler (mathcal A) $ и $ mathcalm(mathcal A) $ — инвариантные подпространства оператора $ mathcal A $.
Доказать, что сумма двух инвариантных подпространств является инвариантным подпространством.
Теорема. Если пространство $ mathbb V_ $ раскладывается в прямую сумму подпространств, инвариантных относительно оператора $ mathcal A $, то существует базис пространства, в котором матрица оператора будет блочно-диагональной.
Теорема обобщается очевидным образом на произвольное число слагаемых подпространств: $ mathbb V=mathbb V_1oplus mathbb V_2 oplus dots oplus mathbb V_k $. Если при этом $ dim mathbb V_1= dots = dim mathbb V_k=1 $, то матрица оператора в базисе, полученном объединением базисных векторов слагаемых подпространств, становится диагональной — это и является решением задачи, поставленной в начале пункта.
Собственное число и собственный вектор
Задача. Найти одномерные инвариантные подпространства оператора.
Вектор $ X_in mathbb V $ называется собственным вектором оператора $ mathcal A_ $, если $$ X ne mathbb O, quad u quad exists lambda in mathbb C qquad mbox qquad mathcal A(X)=lambda X .$$ В этом случае число $ lambda_ $ называется собственным или характеристическим числом оператора, соответствующим (или принадлежащим) данному собственному вектору; обратно, говорят, что вектор $ X_ $ принадлежит собственному числу $ lambda_ $.
Пример. Оператор
$$left(beginx \ y end right) longmapsto left(begin1 & — 5/2 \ -1/2 & 2 end right) left(beginx \ y end right) $$ задает отображение плоскости $ mathbb R^2 $. На рисунке показан результат действия этого отображения на единичную окружность. Все точки плоскости, за исключением начала координат $ mathbb O_ $, изменят свое положение — ни одна не останется на месте.
Если рассмотреть эти точки как концы векторов, имеющих начало в $ mathbb O_ $, то смещения точек под действием оператора можно представить в виде двух составляющих: растяжения (т.е. увеличения расстояния до начала координат) и поворота вокруг начала координат на некоторый угол. И только по двум направлениям плоскости поворота не происходит. Точки окружности с координатами $$ pm left( 0.823, -0.568 right)^ quad u quad pm left( 0.960, 0.278 right)^ $$ будут смещаться без поворота. Эти точки и задают координаты конца собственного вектора. А соответствующие им собственные числа $ 2.725 $ и $ 0.275 $ определяют коэффициенты сдвига. Если вообразить оператор как деформацию физической среды, заполняющей плоскость, то можно сказать, что cобственный вектор задает направление, на котором действие оператора сводится к растяжению, при этом коэффициент растяжения и будет собственным числом.
Анимация процесса ☞ ЗДЕСЬ (1500 Kb, gif).
Пример другого оператора $$ left(beginx \ y end right) longmapsto left(begin1 & — 3 \ 1 & -1 end right) left(beginx \ y end right) $$ показывает, что существование вещественных собственных чисел вовсе не гарантировано даже в случае оператора в вещественном пространстве: в этом примере все точки плоскости повернутся вокруг начала координат. ♦
Доказать, что $ operatorname (mathcal A) ne 0 $ тогда и только тогда, когда оператор $ mathcal A_ $ имеет собственное число, равное нулю.
Теорема. Любой собственный вектор оператора порождает его одномерное инвариантное подпространство, и обратно: любой ненулевой вектор одномерного инвариантного подпространства оператора является собственным вектором.
Пример. В пространстве $ mathbb P_3 $ полиномов с вещественными коэффициентами степени $ le 3 $ оператор $ mathcal A_ $ действует по правилу
$$ mathcal A (f(x)) = f(x) (x^2-2) pmod , $$ т.е. полином $ f_(x) $ отображается в остаток от деления произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти собственные векторы этого оператора.
Решение. В пространстве $ mathbb P_3 $ векторами являются полиномы, а условие того, что полином $ f_(x) $ является собственным, принадлежащим числу $ lambda_ $, записывается в виде: $$ f(x)(x^2-2)equiv lambda f(x) pmod quad iff $$ $$ iff quad f(x)(x^2-2-lambda)equiv 0 pmod . $$ Поскольку $ deg f le 3 $, то последнее может выполняться тогда и только тогда, когда полином $ x^2-2-lambda $ имеет общие корни с $ x^4-x^3-x^2+x equiv x(x+1)(x-1)^2 $. Из этого условия вытекает, что число $ lambda_ $ может принимать только два значения: $ lambda_1=-2 $ и $ lambda_2=-1 $. Если $ lambda_1=-2 $ является собственным числом, то ему соответствующий собственный вектор — полином степени $ le 3 $ — должен определяться из условия делимости $ f(x)x^2 $ на $ x(x+1)(x-1)^2 $. Такой полином имеет вид $ t(x+1)(x-1)^2 $ при произвольной константе $ t_ $. Следовательно множество $$ $$ является множеством собственных векторов, принадлежащих $ lambda_1=-2 $.
С числом $ lambda_2=-1 $ поступаем аналогично. Условие делимости полинома $ f(x)(x^2-1) $ на $ x(x+1)(x-1)^2 $ дает также бесконечное множество: $$ subset mathbb R > . $$ Однако в этом случае бесконечность множества качественно иная, чем в предыдущем случае; она — «двумерная». ♦
Задача. Для произвольного оператора выяснить условия существования его собственного числа и разработать конструктивный метод его нахождения.
Теорема. В комплексном линейном пространстве любой оператор имеет по крайней мере один собственный вектор.
Доказательство. Пусть $ > $ — произвольный базис пространства $ mathbb V_ $ и $ mathbf A_ $ — матрица оператора $ mathcal A_ $ в этом базисе. Тогда для того чтобы вектор $ X=x_1X_1+cdots+x_nX_n ne mathbb O $ был собственным, принадлежащим собственному числу $ lambda_ $, необходимо и достаточно чтобы выполнялось равенство $$ left(beginx_1 \ x_2 \ vdots \ x_n end right) = lambda left(beginx_1 \ x_2 \ vdots \ x_n end right) quad Longleftrightarrow quad left(beginalpha_ — lambda & alpha_& dots & alpha_ \ alpha_ & alpha_— lambda& dots & alpha_ \ dots & & & dots \ alpha_ & alpha_& dots & alpha_— lambda end right) left(beginx_1 \ x_2 \ vdots \ x_n end right) = mathbb O_ $$ Покажем, что существуют комплексные числа $ lambda_ $ и не все нулевые $ x_1,dots,x_ $, удовлетворяющие этой системе. Необходимым и достаточным условием существования нетривиального решения у однородной системы линейных уравнений с квадратной матрицей является равенство нулю определителя этой матрицы: $$ det (-lambda E)=left|beginalpha_ — lambda & alpha_& dots & alpha_ \ alpha_ & alpha_— lambda& dots & alpha_ \ dots & & & dots \ alpha_ & alpha_& dots & alpha_— lambda end right|=0 . $$ Этот определитель является полиномом степени $ n_ $ по $ lambda_ $. По основной теореме высшей алгебры этот полином имеет по крайней мере один комплексный корень $ lambda=lambda_ $. Подставив его в систему, получаем однородную систему уравнений с нулевым определителем. Находим нетривиальное решение этой системы: $$ x_1=x_^,dots,x_n=x_^, quad exists x_^ ne 0 ; $$ но тогда вектор $ _= x_^X_1+cdots+x_^X_n $ будет собственным вектором оператора $ mathcal A_ $, принадлежащим $ lambda_^ $. ♦
Уравнение $ det (-lambda E)= 0 $ называется характеристическим или вековым уравнением, а полином в левой его части — характеристическим полиномом матрицы $ $. Любой корень характеристического полинома матрицы называется собственным числом этой матрицы. Набор всех собственных чисел матрицы (корней характеристического полинома с учетом кратностей) называется спектром матрицы. Ненулевой вектор $ X in mathbb C^n $, удовлетворяющий условию $ X= lambda X $, где $ lambda $ — собственное число матрицы, называется собственным вектором матрицы, соответствующим (или принадлежащим) данному собственному числу.
Пример. Применим полученный результат для получения альтернативного решения предыдущего примера.
Решение. Базисом в пространстве $ mathbb P_3 $ выберем $ $. Образы базисных векторов под действием оператора $ mathcal A (f(x)) = f(x) (x^2-2) pmod $: $$ left mathcal A (1) =&-2& &+x^2& ,\ mathcal A (x) =&&-2,x &&+x^3 ,\ mathcal A (x^2) =& &-x &-x^2 &+x^3, \ mathcal A (x^2) =& &-x & & , end right. qquad Rightarrow qquad = left(begin-2 & 0 & 0 & 0 \ 0 & -2 & -1 & -1 \ 1& 0 & -1 & 0 \ 0 & 1 & 1 & 0 end right) . $$ Характеристический полином матрицы $ $: $$ left|begin-2-lambda & 0 & 0 & 0 \ 0 & -2-lambda & -1 & -1 \ 1& 0 & -1-lambda & 0 \ 0 & 1 & 1 & -lambda end right|equiv (lambda+2)(lambda^3+3,lambda^2+3,lambda+1)equiv (lambda+2)(lambda+1)^3 . $$ Собственные числа $ lambda_1=-2 $ и $ lambda_2=-1 $, спектр матрицы $ $. Подставляем каждое из собственных чисел в матрицу $ -lambda E $ и решаем получившиеся системы однородных уравнений. Поскольку каждая из них должна иметь бесконечное множество решений, то мы строим фундаментальные системы решений (ФСР) $$ begin& (-lambda E)X=mathbb O & \ swarrow > & & searrow > \ lambda_1=-2 & & lambda_2=-1 \ Downarrow & & Downarrow \ left(begin0 & 0 & 0 & 0 \ 0 & 0 & -1 & -1 \ 1& 0 & 1 & 0 \ 0 & 1 & 1 & 2 end right) left(beginx_1 \ x_2 \ x_3 \ x_4 end right)= mathbb O & & left(begin-1 & 0 & 0 & 0 \ 0 & -1 & -1 & -1 \ 1& 0 & 0 & 0 \ 0 & 1 & 1 & 1 end right) left(beginx_1 \ x_2 \ x_3 \ x_4 end right)= mathbb O . \ Downarrow > & & Downarrow > \ x_1=1,x_2=-1,x_3=-1,x_4=1 & & left x_1=0,x_2=-1,x_3=1,x_4=0 \ x_1=0,x_2=-1,x_3=0,x_4=1 end right> end $$ Таким образом, собственному числу $ lambda_1=-2 $ соответствует собственнный вектор — полином $ 1-x-x^2+x^3 $, и он полностью совпадает с полученным при решении предыдущего примера. В то же время собственному числу $ lambda_2=-1 $ соответствует два линейно независимых собственнных вектора — полиномы $ -x+x^2 $ и $ -x+x^3 $. Любой (не тождественно нулевой) полином множества $$ subset mathbb R > $$ будет также являться собственным, принадлежащим $ lambda_2=-1 $. Это множество также совпадает с полученным при решении предыдущего примера. ♦
Итак, два формально различных подхода к решению одного и того же примера не привели к противоречию. Хотелось бы, однако, гарантировать глобальную непротиворечивость определения собственных чисел и векторов — т.е. независимость (инвариантность) этих объектов относительно способов их нахождения, и, в частности, от выбора базиса пространства $ mathbb V_ $.
Теорема. Характеристические полиномы подобных матриц одинаковы.
Доказательство. $ doteq iff exists $ неособенная матрица $ C_ $, такая что $ =C^ C $. Имеем: $$det (-lambda E)=det (C^ C-lambda E)=$$ $$= det (C^ C-lambda C^EC)=det left[ C^ ( -lambda E)C right] = det (-lambda E) .$$ ♦
Иначе говоря, для оператора $ mathcal A_ $ характеристический полином его матрицы не зависит от выбора базиса пространства. Поэтому можно говорить о характеристическом полиноме оператора $ mathcal A_ $.
Теорема [Гамильтон, Кэли]. Результатом подстановки оператора в собственный характеристический полином будет нулевой оператор.
Пример. Для рассмотренного в предыдущих примерах оператора
$$ mathcal A (f(x)) = f(x) (x^2-2) pmod , $$ действующего в $ mathbb P_3 $, характеристический полином равен
$$ lambda^4+5,lambda^3+9,lambda^2+7,lambda+2 , .$$ Проверим утверждение теоремы Гамильтона-Кэли — должно быть выполнено условие $$ mathcal A^4+5,mathcal A^3+9,mathcal A^2+7,mathcal A +2, mathcal E = mathcal O . $$ Степени данного оператора $ mathcal A_ $ обсуждались в примере ☞ ПУНКТА. Переписанное в терминах остатков, последнее условие превращается в $$ (x^2-2)^4f(x)+5,(x^2-2)^3f(x)+9,(x^2-2)^2f(x)+7,(x^2-2)f(x) + $$ $$+2,f(x) equiv 0 pmod , $$ т.е. полином, стоящий в левой части сравнения, должен делиться нацело на $ x^4-x^3-x^2+x $ при любом выборе полинома $ f_(x) $. Проверяем: $$ (x^2-2)^4+5,(x^2-2)^3+9,(x^2-2)^2+7,(x^2-2)+2 equiv $$ $$equiv x^8-3,x^6+3,x^4-x^2 equiv (x^4+x^3-x^2-x)(x^4-x^3-x^2+x) , $$ т.е. утверждение оказывается справедливым. ♦
Диагонализуемость матрицы оператора
Теорема 1. Собственные векторы оператора, принадлежащие различным собственным числам, линейно независимы.
Теорема 2. Если оператор имеет $ n=dim mathbb V $ линейно независимых собственных векторов, то в базисе ими образуемом матрица оператора диагональна. Обратно: если матрица оператора в некотором базисе диагональна, то каждый вектор этого базиса является собственным для оператора.
Базис линейного пространства, состоящий из собственных векторов оператора $ mathcal A_ $, называется каноническим.
[Матричная версия теоремы]. Пусть $ A_ $ — квадратная матрица. Неособенная матрица $ C_ $, удовлетворяющая равенству
$$C^ A C= A_ quad mbox A_ quad mbox $$ существует тогда и только тогда, когда существует базис пространства $ mathbb C^_ $, состоящий из собственных векторов матрицы $ A_ $. Тогда матрица $ C_ $ является матрицей перехода от стандартного базиса $$ bigg_j = big[underbrace_,0,dots,0big]^ bigg>_^n $$ к каноническому, а на диагонали $ A_ $ стоят собственные числа матрицы $ A_ $: $$ A_= left( beginlambda_1 & 0 & dots & 0 \ 0 & lambda_2 & dots & 0 \ & & ddots & \ 0 & 0 & dots & lambda_n end right) . $$
Доказательство. Проведем формальное доказательство данного конкретного частного случая. Рассмотрим матричное равенство $$ A C= CA_ $$ при некоторой диагональной матрице $ A_ $. Легко видеть, что оно эквивалентно системе равенств относительно столбцов матрицы $ C_ $: $$ AC_=d_1 C_,dots, AC_=d_n C_ , . $$ Если все столбцы $ >_^n $ ненулевые, то тогда они являются собственными векторами для матрицы $ A_ $, а числа $ >_^n $ — собственными числами, соответствующими этим собственным векторам. Если матрица $ C_ $ невырождена, то все ее столбцы линейно независимы. Но тогда они образуют базис пространства $ mathbb C^n $, состоящий из собственных векторов. Обратное тоже верно. ♦
При выполнении условия предыдущего следствия говорят, что матрица $ A_ $ диагонализуема или приводится к диагональной форме 7) .
Теорема позволяет сформулировать достаточное условие диагонализуемости.
Теорема 3. Если характеристический полином оператора не имеет кратных корней, то матрица оператора диагонализуема.
Это условие не является необходимым, как показывает пример тождественного оператора .
Случай существования кратного корня у характеристического полинома является «пограничным»: существуют примеры как диагонализуемых, так и недиагонализуемых матриц. Так, для матриц $$ A= left( begin0 &1 \ -1 &2 end right) quad mbox quad A= left( begin1 &0 \ 1&1 end right) $$ при попытке подобрать матрицу $ C_ $, удовлетворяющую равенству $$AC=C left( beginalpha_1 &0 \ 0 & alpha_2 end right) qquad npu forall subset mathbb C $$ получим: $ det C=0 $.
В случае наличия у характеристического полинома оператора кратного корня, анализ оператора на возможность диагонализуемости его матрицы усложняется.
Теорема 4. Множество собственных векторов оператора, принадлежащих его собственному числу $ lambda_^ $ , дополненное нулевым вектором, образует линейное подпространство пространства $ mathbb V_ $.
Это подпространство $$ mathbb V_ = mathcaler (mathcal A- lambda_ mathcal E) $$ пространства $ mathbb V_ $ называется собственным подпространством оператора, соответствующим $ lambda_^ $. Величина $$ dim (mathcaler (mathcal A- lambda_ mathcal E)) $$ называется геометрической кратностью собственного числа $ lambda_^ $. Можно доказать, что геометрическая кратность собственного числа не превосходит кратности собственного числа в характеристическом полиноме. Для акцентирования различий в определениях двух кратностей, кратность собственного числа в характеристическом полиноме называют еще алгебраической кратностью собственного числа.
Если оператор (в некотором базисе пространства) задан своей матрицей $ mathbf A^ $, то базисные векторы собственного подпространства $ mathbb V_ $ вычисляются посредством нахождения фундаментальной системы решений (ФСР) системы линейных уравнений $$ (mathbf A- lambda_ E) X=mathbb O . $$
Теорема 5. Матрица оператора диагонализуема тогда и только тогда, когда для каждого ее собственного числа алгебраическая кратность равна геометрической кратности:
Диагонализуема ли матрица оператора
$$ mathcal A (f(x)) = f(x) (x^2-2) pmod , $$ рассмотренного в примерах предыдущего пункта?
Пример. Найти все вещественные значения параметра $ > $, при которых матрица
Решение. Характеристический полином $ f(lambda)=-lambda^3+3, lambda-2,(3, > -1) $ имеет кратные корни только тогда когда его дискриминант $ mathcal D(f)=-324, > (3, > -2) $ обращается в нуль. При $ > =0 $ корень $ lambda=-1 $ имеет алгебраическую кратность $ 2_ $. Найдем дефект матрицы $ A+E $: $$left( begin2 &0 & -2 \ -1 &3 &1 \ 2 & 0 & -2 end right) longrightarrow left( begin1 &0 & -1 \ 0 &3 &0 \ 0 & 0 & 0 end right) Longrightarrow operatorname (A+E) =2 Longrightarrow operatorname (A+E)=1 . $$ Таким образом, геометрическая кратность собственного числа $ lambda=-1 $ равна $ 1_ $ и условие теоремы $ 5 $ не выполнено. Оно не будет выполнено и при $ > = 2/3 $ (здесь корень $ lambda=1 $ имеет кратность $ 2_ $).
Ответ. Матрица диагонализуема при всех значениях параметра, за исключением $ > = 0 $ и $ > = 2/3 $.
Диагонализуемость матрицы оператора над полем вещественных чисел
В предыдущем пункте мы рассматривали операторы, не всегда акцентируя внимания на поле, над которым они были определены — над $ mathbb R_ $ или над $ mathbb C_ $. Сама теорема существования собственного числа гарантирует нам только лишь наличие этих чисел в поле $ mathbb C_ $. Как следствие, даже если рассматриваются операторы над полем $ mathbb R_ $ (что чаще всего и случается на практике), то существование для них вещественного канонического базиса вовсе не гарантировано.
Задача. Найти условия диагонализуемости матрицы оператора $ mathcal A $ над полем вещественных чисел.
Необходимое условие следует из теоремы $ 2 $ предыдущего пункта: все собственные числа матрицы должны быть вещественными.
Теорема $ 3 $ позволяет сформулировать и достаточный критерий диагонализуемости матрицы оператора $ mathcal A $ над $ mathbb R_ $.
Теорема. Если характеристический полином оператора имеет только простые вещественные корни, то матрица оператора диагонализуема над $ mathbb R_ $.
Условие различности и вещественности корней произвольного полинома $ f(lambda)=lambda^n+a_1lambda^+dots+ a_n in mathbb R[x] $ можно проверить по коэффициентам этого полинома «чисто алгебраически», т.е. за конечное число элементарных алгебраических операций над этими коэффициентами. Воспользуемся, например, теоремой Якоби из раздела ☞ ЛОКАЛИЗАЦИЯ КОРНЕЙ ПОЛИНОМА. По коэффициентам $ a_1,dots,a_n $ можно определить сумму Ньютона полинома $ f(lambda) $, т.е. величину $$ s_k=sum_ lambda_j^k . $$ Далее, после нахождения всех этих сумм для значений $ k in $, из них составляется ганкелева матрица $$ S=left[ s_ right]_^ $$ и вычисляются ее главные миноры $ S_1,dots, S_ $. Для различности всех корней полинома необходимо и достаточно выполнение условия $ S_n ne 0 $ (этот минор совпадает с дискриминантом $ mathcal D(f) $ полинома $ f(lambda) $); для различности и вещественности всех корней необходимо и достаточно, чтобы были выполнены неравенства $$ S_1ge 0,dots,S_ ge 0,S_n > 0 . $$
Пример. Найти все вещественные значения параметра $ > $, при которых матрица
Решение. На основании теоремы нам нужно установить условия вещественности корней характеристического полинома $ f(lambda)=-lambda^3+3, lambda-2,(3, > -1) $. Вычисляем суммы Ньютона: $ s_0=3, s_1= 0, s_2=6, s_3=18, > -6, s_4=18 $, составляем матрицу: $$ S=left(begin3 & 0 & 6 \ 0 & 6 & 18, > -6 \ 6 & 18, > -6 & 18 end right) $$ и вычисляем ее главные миноры: $$S_1=3, S_2=18, S_3=-324, > , (3, > -2)=mathcal D(f) . $$ При $ > ne 0 $ и $ > ne 2/3 $ все собственные числа различны, условие теоремы выполняется при $ > in ]0,, 2/3[ $. Граничные точки последнего интервала следовало бы исследовать отдельно: хотя этим значениям параметра и соответствует случай кратных вещественных корней характеристического полинома, но матрица $ A_ $ может оказаться диагонализуемой на основании теоремы 5 предыдущего пункта. Но при решении примера в предыдущем пункте мы уже установили, что это условие не выполняется.
Ответ. Матрица диагонализуема над $ mathbb R_ $ при $ > in ]0,, 2/3[ $.
Жорданова нормальная форма
Если матрица оператора оказывается недиагонализуемой над $ mathbb C_ $, то к какому простейшему виду ее можно привести ? — Этим видом является, например, ☞ ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА.
Задачи
Источники
[1]. Гантмахер Ф.Р. Теория матриц. 4-е изд. М.Наука. 1988.
[2]. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.ГИФМЛ.1960
[3]. Хорн Р., Джонсон Ч. Матричный анализ. М.Мир.1989
[4]. Мишина А.П., Проскуряков И.В. Высшая алгебра. М.Наука. 1965