Как найти ядро линейного преобразования

Ядром линейного
преобразования

называется совокупность всех векторов

для которых

.
Ядро линейного преобразования

будем обозначать символом

.
Итак,


.

Теорема 3.5.
Ядро

линейного преобразования

совпадает с множеством решений однородной
системы уравнений


.

Доказательство
теоремы
вытекает из следующей цепочки равносильных
утверждений:

решение системы уравнений

.

Следствие.
Множество

является подпространством.

Так как множество
решений однородной системы линейных
уравнений является подпространством,
то из теоремы 3.5 следует, что множество

является подпространством.

Пример

Найти ядро линейного
преобразования

,
где

Решение. Так
как ядро

совпадает с множеством решений системы
уравнений

,
то базисом подпространства

является фундаментальный набор решений
этой системы уравнений. Найдем этот
базис





.

Векторы

образуют базис системы векторов

.
Вектор

разлагается по векторам

:

.
Отсюда следует, что фундаментальный
набор решений системы линейных уравнений
состоит из одного вектора

,
который является базисом

.
Итак, ядро

Так как

является подпространством пространства

,
то вектор

принадлежит

.
Линейное преобразование

называется невырожденным,
если

содержит только нулевой вектор, т. е.

.

Теорема 3.6.
Дано линейное преобразование

.
Тогда равносильны следующие утверждения:

1. Линейное
преобразование


является невырожденным
.

2. Линейное
преобразование
f
переводит базис пространства

в
базис этого пространства, т.е. если

базис

,
то и

базис пространства

.

3. Линейное
преобразование


обратимо
.

Доказательство

1)
2).
Дано, что ядро

.
Докажем, что если

базис

,
то

также базис пространства

.
Сначала докажем линейную независимость
системы векторов

.
Для этого рассмотрим произвольное
разложение вектора

по этой системе векторов

(1)

Равенство (1)
перепишем в виде

(2)

Теперь из равенства
(2) вытекает, что вектор

.
Отсюда, в виду

вытекает


=
.
(3)
Так как

линейно независимая система векторов,
то из соотношения (3) следуют равенства

.
Этим доказана линейная независимость
системы векторов

.
Она содержит n
векторов
и, значит, является базисом пространства

2)
3).
Диагональная система

является базисом пространства

Из условия 2) теоремы получаем, что

базис пространства

.
Так как

матрица
линейного преобразования

то

.
Следовательно,

− линейно независимая система векторов
и, значит, матрица

обратима, т. е.

− обратимое преобразование.

3)
1).
Дано, что линейное преобразование

обратимо. Докажем, что ядро

.
Пусть вектор

,
т. е.

Отсюда

.
Следовательно,

.

Множество всех
векторов

,
,
называется образом
линейного преобразования

и обозначается символом

.
Итак,



.

Теперь докажем
следующую теорему.

Теорема 3.7.
Множество

является подпространством пространства
.

Доказательство.
Пусть
,

произвольные векторы подпрост-ранства

.
Тогда найдутся такие векторы

,

в пространстве

что

.
Теперь имеем

Из этих равенств
вытекает, что векторы

+

и

принадлежат множеству

.
Следовательно,

является подпространством. ■

В следующей теореме
содержится задание подпространства

в виде линейной оболочки.

Теорема 3.8.
Если система
векторов

,
,…,

базис пространства

то

=

.

Доказательство
теоремы
вытекает из следующей цепочки равносильных
утверждений:

Пример

Найти образ
линейного преобразования

Решение.
Диагональная система

,
,

является базисом пространства

.
Так как

то из теоремы 3.8
следует, что

Задачи

1. Доказать, что
существует единственное линейное
преобразование

пространства

,
переводящее его базис

соответственно в векторы

.
Найти матрицу этого линейного
преобразования.

2. Найти ядро
линейного преобразования, которое
переводит базис пространства

соответственно в векторы


3. Доказать, что
линейное преобразование

обратимо тогда и только тогда, когда из
неравенства

следует, что

4. Доказать
равносильность следующих утверждений:

а)

;

б)

.

5. Доказать, что
для каждого линейного преобразования

справедливо равенство

6. Доказать, что
для каждого линейного преобразования

пространства

сумма размерностей ядра и образа равна
n,

т. е.

.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Макеты страниц

Среди всех линейных преобразований пространства особое место занимают взаимнооднозначные преобразования (при которых каждый вектор пространства является образом ровно одного вектора).

Теорема 14. Линейное преобразование пространства взаимно однозначно тогда и только тогда, когда его матрица в каком-нибудь базисе невырожденна.

Доказательство. Пусть в некотором базисе преобразование имеет матрицу

Тогда координаты вектора следующим образом выражаются через координаты вектора

Взаимная однозначность преобразования означает, что для любого набора чисел найдется ровно один набор чисел удовлетворяющих системе уравнений (1). Но система уравнений (1) имеет единственное решение относительно неизвестных и только тогда, когда ее определит ель отличен от нуля, т. е. матрица А невырожденна. Этим теорема доказана.

Определение 18. Линейное преобразованиеф пространства называется обратимым (или невырожденным), если существует такое линейное преобразование что

где — тождественное преобразование.

Очевидно, что если какое-либо преобразование удовлетворяет равенствам (2), то оно единственно, линейно и невырожденно. Это преобразование называется обратным для и обозначается через так что

Ясно также, что обратимо тогда и только тогда, когда оно взаимно однозначно. При этом, поскольку кольцо линейных

преобразований изоморфно кольцу матриц, то равенствам (3) будут соответствовать матричные равенства

где В — матрица линейного преобразования в том же базисе, что и А для Отсюда видно, что

Таким образом, доказана

Теорема 15. Линейное преобразование пространства обратимо тогда и только тогда, когда оно в каком-либо базисе задается невырожденной матрицей А. При этом обратное преобразование (когда оно существует) определяется матрицей

Обозначим буквой множество всех невырожденных линейных преобразований пространства над полем

Легко видеть, что:

1) если то (поскольку произведению преобразований отвечает произведение соответствующих матриц);

2) тождественное преобразование

Отсюда, учитывая ассоциативность умножения преобразований, получаем: множество всех невырожденных линейных преобразований пространства образует группу относительно операции умножения.

Определение 19. Пусть линейное преобразование пространства Совокупность векторов для всех называется областью значений преобразования и обозначается подпространство линейного пространства В самом деле, если то в силу линейности имеем: и для любого Теперь наше утверждение следует из теоремы 7.

Ранг матрицы линейного преобразования пространства не зависит от выбора базиса в нем, а зависит только от самого преобразования. Этот факт делает обоснованным следующее

Определение 20. Рангом линейного преобразования пространства называется ранг его матрицы.

Теорема 16. Размерность подпространства (области значений линейного преобразования равна рангу преобразования т. е.

Доказательство. Пусть базис пространства Для любого имеется представление где координаты вектора Тогда

— координатный столбец вектора х, то тогда и только тогда, когда

или

Следовательно, размерность ядра совпадает с размерностью пространства решений системы (4) и потому согласно § 10 равна Из теорем 15 и 17 получаем

Следствие. Для того чтобы линейное преобразование пространства было невырожденным, необходимо и достаточно, чтобы ядро этого преобразования было нулевым.

Пример. Найти ядро и область значений линейного преобразования заданного в некотором базисе пространства матрицей

Решение. Находим, что ранг Значит, размерность области значений равна 2, размерность ядра Кегф равна

Пространство натянуто на векторы координатные столбцы которых являются столбцами матрицы А. Базис пространства можно составить, например, из векторов среи Таким образом,

где произвольные вещественные числа.

Для отыскания ядра решаем однородную систему уравнений:

Общее решение этой системы: Базис ядра составляют, например, векторы .

Ядро и образ линейного отображения

Ядром линейного отображения mathcal{A}colon Vto W называется множество таких векторов mathbf{v}in V, что mathcal{A}(mathbf{v})= mathbf{o}_W, т.е. множество векторов из {V}, которые отображаются в нулевой вектор пространства {W}. Ядро отображения mathcal{A}colon Vto W обозначается:

ker mathcal{A}= Bigl{mathbf{v}colon, mathbf{v}in V,~ mathcal{A}(mathbf{v})=mathbf{o}_WBigr}.

Образом линейного отображения mathcal{A}colon Vto W называется множество образов mathcal{A}(mathbf{v}) всех векторов mathbf{v} из {V}. Образ отображения mathcal{A}colon Vto W обозначается operatorname{im}mathcal{A} или mathcal{A}(V)colon

operatorname{im}mathcal{A}= mathcal{A}(V)= Bigl{mathbf{w}colon, mathbf{w}=mathcal{A}(v),~ forall mathbf{v}in VBigr}.

Заметим, что символ operatorname{im}mathcal{A} следует отличать от operatorname{Im}z — мнимой части комплексного числа.


Примеры ядер и образов линейных отображений

1. Ядром нулевого отображения mathcal{O}colon Vto W является все пространство {V}, а образом служит один нулевой вектор, т.е. ker  mathcal{O}=V,~ operatorname{im}mathcal{O}={mathbf{o}_W}.

2. Рассмотрим отображение mathsf{a!e}colon Vto mathbb{R}^n, которое ставит в соответствие каждому вектору mathbf{v} n-мерного линейного пространства {V} его координатный столбец v=begin{pmatrix}v_1&cdots&v_n end{pmatrix}^T относительно заданного базиса mathbf{e}_1,ldots,mathbf{e}_n. Ядром этого отображения является нулевой вектор mathbf{o}_V пространства {V}, поскольку только этот вектор имеет нулевой координатный столбец mathsf{a!e}(mathbf{o}_V)=oin mathbb{R}^n. Образ преобразования mathsf{a!e} совпадает со всем пространством mathbb{R}^n, так как это преобразование сюръективно (любой столбец из mathbb{R}^n является координатным столбцом некоторого вектора пространства {V}).

3. Рассмотрим отображение operatorname{pr}_{mathbf{e}}colon mathbb{E}to mathbb{R}, которое каждому вектору mathbf{v} n-мерного евклидова пространства mathbb{E} ставит в соответствие алгебраическое значение operatorname{pr}_{mathbf{e}}(mathbf{v})= langle mathbf{e},mathbf{v}rangle его проекции на направление, задаваемое единичным вектором mathbf{e}. Ядром этого преобразования является ортогональное дополнение {mathbf{e}}^{perp} — множество векторов, ортогональных mathbf{e}. Образом является все множество действительных чисел mathbb{R}.

4. Рассмотрим отображение mathcal{D}colon P_n(mathbb{R})to P_{n-1}(mathbb{R}), которое каждому многочлену степени не выше {n} ставит в соответствие его производную. Ядром этого отображения является множество P_0(mathbb{R}) многочленов нулевой степени, а образом — все пространство P_{n-1}(mathbb{R}).


Свойства ядра и образа линейного отображения

1. Ядро любого линейного отображения mathcal{A}colon Vto W является подпространством: {mathbf{o}_V}triangleleft ker  mathcal{A} triangleleft V.

В соответствии с определением требуется доказать, что множество ker  mathcal{A} является непустым и замкнутым относительно операций сложения векторов и умножения вектора на число. В самом деле, из однородности отображения следует, что

mathcal{A}(mathbf{o}_V)= mathcal{A}(0cdotmathbf{v})= 0cdot mathcal{A}(mathbf{v})= mathbf{v}_W,

т.е. нулевой вектор mathbf{o}_V отображается в нулевой вектор mathbf{o}_W. Следовательно, ядро любого линейного отображения не является пустым и содержит, по крайней мере, нулевой элемент: mathbf{o}_Vin ker  mathcal{A}. Покажем, что множество ker mathcal{A} замкнуто по отношению к операциям сложения векторов и умножения вектора на число. Действительно:

begin{gathered} left.{begin{matrix} mathbf{v}_1in ker mathcal{A}~ Rightarrow~ mathcal{A} (mathbf{v}_1)= mathbf{o}_W\ mathbf{v}_2in ker  mathcal{A}Rightarrow mathcal{A} (mathbf{v}_2)= mathbf{o}_W end{matrix}}right} Rightarrow~ mathcal{A}(mathbf{v}_1+mathbf{v}_2)= mathcal{A} (mathbf{v}_1)+ mathcal{A}(mathbf{v}_2)= mathbf{o}_W~ Rightarrow~ mathbf{v}_1+ mathbf{v}_2in ker mathcal{A},;\[5pt] mathbf{v}in ker mathcal{A}~ Rightarrow~ mathcal{A}(mathbf{v})=mathbf{o}_W~ Rightarrow~ mathcal{A}(lambdacdot mathbf{v})= lambdacdotmathcal{A}(mathbf{v})= lambda cdot mathbf{o}_W= mathbf{o}_W~ Rightarrow~ lambdacdot mathbf{v}in ker  mathcal{A},. end{gathered}

Следовательно, множество ker mathcal{A} является линейным подпространством пространства {V}.

2. Образ любого линейного отображения mathcal{A}colon Vto W является подпространством: operatorname{im}mathcal{A}triangleleft W.

В самом деле, докажем, например, замкнутость множества operatorname{im} mathcal{A} по отношению к операции умножения вектора на число. Если mathbf{w}in operatorname{im}mathcal{A}, то существует вектор mathbf{v}in V такой, что mathbf{w}=mathcal{A} (mathbf{v}). Тогда mathcal{A}(lambdacdot mathbf{v})= lambdacdot mathcal{A}(mathbf{v})= lambdacdot mathbf{w}, то есть lambdacdot mathbf{w}in operatorname{im}mathcal{A}.

Поскольку ядро и образ линейного отображения являются линейными подпространствами (свойства 1 и 2), можно говорить об их размерностях.

Дефектом линейного отображения называется размерность его ядра: d=dim ker mathcal{A}, а рангом линейного отображения — размерность его образа: operatorname{rg}mathcal{A}=r=dim operatorname{im}mathcal{A}.

3. Ранг линейного отображения равен рангу его матрицы (определенной относительно любых базисов).

В самом деле, если mathbf{e}_1,ldots,mathbf{e}_n любой базис пространства {V}, то operatorname{im}mathcal{A}= operatorname{Lin}[ mathcal{A} (mathbf{e}_1),ldots,mathcal{A}(mathbf{e}_n)]. Поэтому максимальное число линейно независимых векторов системы mathcal{A} (mathbf{e}_1),ldots,mathcal{A} (mathbf{e}_n) (ранг системы векторов) равно максимальному числу линейно независимых столбцов матрицы {A} отображения, т.е. рангу матрицы: dim operatorname{im} mathcal{A}= operatorname{rg}A= operatorname{rg}mathcal{A}.

4. Линейное отображение mathcal{A}colon Vto W инъективно тогда и только тогда, когда ker mathcal{A}={mathbf{o}_V}, другими словами, когда дефект отображения равен нулю: d=dim ker mathcal{A}=0.

Действительно, образом нулевого вектора mathbf{o}_v служит нулевой вектор mathbf{o}_W. Поэтому, если отображение инъективно, то ядро содержит только нулевой вектор mathbf{o}_v, иначе два разных вектора имели бы один и тот же образ mathbf{o}_W. Обратно, при условии ker mathcal{A}= {mathbf{o}_V} разные векторы mathbf{v}_1ne mathbf{v}_2 не могут иметь одинаковые образы mathcal{A}(mathbf{v}_1)= mathcal{A}(mathbf{v}_2), так как в этом случае из равенств mathcal{A}(mathbf{v}_1)- mathcal{A}(mathbf{v}_2)= mathcal{A} (mathbf{v}_1-mathbf{v}_2)= mathbf{}_W, следует, что ненулевой вектор (mathbf{v}_1-mathbf{v}_2)in ker mathcal{A} (приходим к противоречию).

5. Линейное отображение mathcal{A}colon Vto W сюръективно тогда и только тогда, когда operatorname{im}mathcal{A}=W, другими словами, когда ранг отображения равен размерности пространства образов: r=dim operatorname{im}mathcal{A}= dim{W}.

6. Линейное отображение mathcal{A}colon Vto W биективно (значит, обратимо) тогда и только тогда, когда ker mathcal{A}={mathbf{o}_V} и operatorname{im}mathcal{A}=W одновременно.


Теорема (9.1) о размерностях ядра и образа. Сумма размерностей ядра и образа любого линейного отображения mathcal{A}colon Vto W равна размерности пространства прообразов:

dim ker mathcal{A}+ dim operatorname{im}mathcal{A}= dim{V},.

(9.3)

Действительно, пусть d=dim ker mathcal{A},~ dim{V}=n. Выберем в подпространстве kermathcal{A} triangleleft V базис mathbf{e}_1,ldots, mathbf{e}_d и дополним его векторами mathbf{e}_{d+1},ldots,mathbf{e}_n до базиса mathbf{e}_1,ldots,mathbf{e}_n всего пространства {V}. Покажем, что векторы mathcal{A}(mathbf{e}_{d+1}),ldots,mathcal{A}(mathbf{e}_n) образуют базис подпространства operatorname{im}mathcal{A}triangleleft W.

Во-первых, operatorname{im}mathcal{A}= operatorname{Lin}[mathcal{A} (mathbf{e}_{d+1}), ldots,mathcal{A}(mathbf{e}_n)], так как образ любого вектора mathbf{v}= v_1 mathbf{e}_1+ldots+v_d mathbf{e}_d+v_{d+1}mathbf{e}_{d+1}+ldots+ v_n mathbf{e}_n линейно выражается через векторы mathcal{A}(mathbf{e}_{d+1}),ldots, mathcal{A}(mathbf{e}_n):

mathcal{A}(mathbf{v})= mathcal{A} Biggl( sum_{i=1}^{n} v_i mathbf{e}_iBiggr)= sum_{i=1}^{n}v_imathcal{A}(mathbf{e}_i)= sum_{i=1}^{d}v_i underbrace{mathcal{A} (mathbf{e}_i)}_{mathbf{o}_W}+ sum_{i=d+1}^{n} v_imathcal{A} (mathbf{e}_i)= sum_{i=d+1}^{n} v_imathcal{A}(mathbf{e}_i).

Во-вторых, образующие mathcal{A}(mathbf{e}_{d+1}), ldots, mathcal{A} (mathbf{e}_n) линейно независимы. Если их линейная комбинация равна нулевому вектору:

mathbf{o}_W= sumlimits_{i=d+1}^{n} lambda_i mathcal{A} (mathbf{e}_i)= mathcal{A}!left(sum_{i=d+1}^{n}lambda_i mathbf{e}_iright)!,

то вектор textstyle{sumlimits_{i=d+1}^{n}lambda_i mathbf{e}_i} принадлежит ядру (его образ — нулевой вектор). Однако, по построению этот вектор принадлежит алгебраическому дополнению (ker mathcal{A})^{+}. Учитывая, что ker  mathcal{A}cap (ker mathcal{A})^{+}={mathbf{o}_V}, заключаем: textstyle{sumlimits_{i=d+1}^{n}lambda_i mathbf{e}_i}=mathbf{o}_V. Получили разложение нулевого вектора по линейно независимой системе mathbf{e}_{d+1},ldots, mathbf{e}_n векторов, значит, все коэффициенты lambda_i=0. Поэтому равенство textstyle{sumlimits_{i=d+1}^{n}lambda_i mathcal{A}(mathbf{e}_i)= mathbf{o}_W} справедливо только для тривиальной линейной комбинации, т.е. система векторов mathcal{A}(mathbf{e}_{d+1}),ldots, mathcal{A} (mathbf{e}_n) линейно независимая.

Таким образом, векторы mathcal{A}(mathbf{e}_{d+1}),ldots, mathcal{A} (mathbf{e}_n) образуют базис подпространства operatorname{im}mathcal{A}= operatorname{Lin} mathcal{A}(mathbf{e}_{d+1}),ldots, mathcal{A} (mathbf{e}_n), а его размерность определяется количеством базисных векторов, т.е. dimoperatorname{im} mathcal{A}=n-d, что равносильно (9.3).

Следствие. Линейное отображение mathcal{A}colon Vto W биективно (значит, обратимо) тогда и только тогда, когда обратима его матрица (определенная относительно любых базисов).

Действительно, для обратимости преобразования mathcal{A}colon Vto W (см. свойство 6) его матрица A (размеров mtimes n) должна удовлетворять условиям (см. свойства 3,4,5):

operatorname{rg}A= operatorname{rg}mathcal{A}= dim operatorname{im}mathcal{A}= dim{W}=m,quad d=dim ker mathcal{A}=0.

Тогда по теореме 9.1 заключаем, что m=n-d=n, т.е. матрица A — квадратная n-го порядка и невырожденная (operatorname{rg}A=n), что и требовалось доказать.

Обратимые линейные отображения называются также невырожденными (имея в виду невырожденность их матрицы).

Математический форум (помощь с решением задач, обсуждение вопросов по математике).

Кнопка "Поделиться"

Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.

Ядро линейного отображения — это такое линейное подпространство области определения отображения, каждый элемент которого отображается в нулевой вектор [1][2]. А именно: если задано линейное отображение {displaystyle Lcolon Vto W} между двумя векторными пространствами V и W, то ядро отображения L — это векторное пространство всех элементов mathbf{v} пространства V, таких что {displaystyle L(mathbf {v} )=mathbf {0} }, где mathbf {0} обозначает нулевой вектор из W[3], или более формально:

{displaystyle ker(L)=left{mathbf {v} in Vmid L(mathbf {v} )=mathbf {0} right}.}

Свойства[править | править код]

Ядро и образ отображения

L.

Ядро отображения L — это линейное подпространство области определения V[4].
В линейном отображении {displaystyle Lcolon Vto W} два элемента V имеют один и тот же образ в W тогда и только тогда, когда их разность лежит в ядре отображения L:

{displaystyle L(mathbf {v} _{1})=L(mathbf {v} _{2})iff L(mathbf {v} _{1}-mathbf {v} _{2})=mathbf {0} .}

Из этого следует, что образ L изоморфен факторпространству пространства V по ядру:

{displaystyle operatorname {im} (L)cong V/ker(L).}

В случае, когда V конечномерно, из этого следует теорема о ранге и дефекте[en]:

{displaystyle dim(ker L)+dim(operatorname {im} L)=dim(V),}

где под рангом мы понимаем размерность образа отображения L, а под дефектом — размерность ядра отображения L[5].

Если V является предгильбертовым пространством, факторпространство {displaystyle V/ker(L)} можно отождествить с ортогональным дополнением к V пространства {displaystyle ker(L)}. Это является обобщением линейных операторов пространства строк или кообраза матрицы.

Приложение к модулям[править | править код]

Понятие ядра также имеет смысл для гомоморфизмов модулей, которые являются обобщениями векторных пространств, где скаляры — элементы кольца, а не поля. Область определения отображения — это модуль с ядром, образующий подмодуль. Здесь концепции ранга и размерности ядра не обязательны.

В функциональном анализе[править | править код]

Если V и W являются топологическими векторными пространствами, а W конечномерно, то линейный оператор {displaystyle Lcolon Vto W} непрерывен тогда и только тогда, когда ядро отображения L является замкнутым подпространством пространства V.

Представление в виде матричного умножения[править | править код]

Рассмотрим линейное отображение, представленное матрицей A размера mtimes n с коэффициентами из поля K (обычно из mathbb {R} или mathbb {C} ), то есть оперирующие с вектор-столбцами mathbf {x} с n элементами из поля K.
Ядро этого линейного отображения — это множество решений уравнения {displaystyle Amathbf {x} =mathbf {0} }, где mathbf {0} понимается как нулевой вектор. Размерность ядра матрицы A называется дефектом матрицы A. В виде операций на множествах,

{displaystyle operatorname {N} (A)=operatorname {Null} (A)=operatorname {ker} (A)=left{mathbf {x} in K^{n}|Amathbf {x} =mathbf {0} right}.}

Матричное уравнение эквивалентно однородной системе линейных уравнений:

{displaystyle Amathbf {x} =mathbf {0} ;;Leftrightarrow ;;left{{begin{alignedat}{7}a_{11}x_{1}&&;+;&&a_{12}x_{2}&&;+;cdots ;+;&&a_{1n}x_{n}&&;=;&&&0\a_{21}x_{1}&&;+;&&a_{22}x_{2}&&;+;cdots ;+;&&a_{2n}x_{n}&&;=;&&&0\vdots ;;;&&&&vdots ;;;&&&&vdots ;;;&&&&&;vdots \a_{m1}x_{1}&&;+;&&a_{m2}x_{2}&&;+;cdots ;+;&&a_{mn}x_{n}&&;=;&&&0{text{.}}\end{alignedat}}right.}

Тогда ядро матрицы A — это то же самое, что и решение набора приведённых выше однородных уравнений.

Свойства подпространства[править | править код]

Ядро mtimes n матрицы A над полем K является линейным подпространством K^n. То есть ядро матрицы A, множество {displaystyle operatorname {Null} (A)}, имеет следующие три свойства:

  1. {displaystyle operatorname {Null} (A)} всегда содержит нулевой вектор, поскольку {displaystyle Amathbf {0} =mathbf {0} }.
  2. Если {displaystyle mathbf {x} in operatorname {Null} (A)} и {displaystyle mathbf {y} in operatorname {Null} (A)}, то {displaystyle mathbf {x} +mathbf {y} in operatorname {Null} (A)}. Это следует из свойства дистрибутивности матричного умножения.
  3. Если {displaystyle mathbf {x} in operatorname {Null} (A)}, а c является скаляром cin K, то {displaystyle cmathbf {x} in operatorname {Null} (A)}, поскольку {displaystyle A(cmathbf {x} )=c(Amathbf {x} )=cmathbf {0} =mathbf {0} }.

Пространство строк матрицы[править | править код]

Произведение {displaystyle Amathbf {x} } может быть записано в терминах скалярного произведения векторов следующим образом:

{displaystyle Amathbf {x} ={begin{bmatrix}mathbf {a} _{1}cdot mathbf {x} \mathbf {a} _{2}cdot mathbf {x} \vdots \mathbf {a} _{m}cdot mathbf {x} end{bmatrix}}.}

Здесь {displaystyle mathbf {a} _{1},dots ,mathbf {a} _{m}} означают строки матрицы A. Отсюда следует, что mathbf {x} принадлежит ядру матрицы A тогда и только тогда, когда вектор mathbf {x} ортогонален (перпендикулярен) каждой из вектор-строк матрицы A (поскольку ортогональность определяется как равенство нулю скалярного произведения).

Пространство строк, или кообраз матрицы A, — это линейная оболочка вектор-строк матрицы A. По указанным выше причинам ядро матрицы A является ортогональным дополнением пространству строк. То есть вектор mathbf {x} лежит в ядре матрицы A тогда и только тогда, когда он перпендикулярен любому вектору из пространства строк матрицы A.

Размерность пространства строк матрицы A называется рангом матрицы A, а размерность ядра матрицы A называется дефектом матрицы A. Эти величины связаны теоремой о ранге и дефекте[en]

{displaystyle operatorname {rank} (A)+operatorname {nullity} (A)=n.}[5]

Левое нуль-пространство (коядро)[править | править код]

Левое нуль-пространство или коядро матрицы A состоит из всех векторов mathbf {x} , таких что {displaystyle mathbf {x} ^{T}A=mathbf {0} ^{T}}, где T обозначает транспонирование матрицы. Левое нуль-пространство матрицы A — это то же самое, что и ядро матрицы A^{T}. Левое нуль-пространство матрицы A является ортогональным дополнением пространству столбцов матрицы A и двойственно коядру связанного линейного преобразования. Ядро, пространство строк, пространство столбцов
и левое нуль-пространство матрицы A являются четырьмя фундаментальными подпространствами, ассоциированными с матрицей A.

Неоднородные системы линейных уравнений[править | править код]

Ядро играет также большую роль при решении неоднородных систем линейных уравнений:

{displaystyle Amathbf {x} =mathbf {b} ;;Leftrightarrow ;;left{{begin{alignedat}{7}a_{11}x_{1}&&;+;&&a_{12}x_{2}&&;+;cdots ;+;&&a_{1n}x_{n}&&;=;&&&b_{1}\a_{21}x_{1}&&;+;&&a_{22}x_{2}&&;+;cdots ;+;&&a_{2n}x_{n}&&;=;&&&b_{2}\vdots ;;;&&&&vdots ;;;&&&&vdots ;;;&&&&&;vdots \a_{m1}x_{1}&&;+;&&a_{m2}x_{2}&&;+;cdots ;+;&&a_{mn}x_{n}&&;=;&&&b_{m}.\end{alignedat}}right.}

Пусть векторы mathbf {u} и mathbf{v} являются решениями уравнения выше, тогда

{displaystyle A(mathbf {u} -mathbf {v} )=Amathbf {u} -Amathbf {v} =mathbf {b} -mathbf {b} =mathbf {0} .}

Таким образом, разность любых двух решений системы {displaystyle Amathbb {x} =mathbb {b} } лежит в ядре матрицы A.

Отсюда следует, что любое решение уравнения {displaystyle Amathbf {x} =mathbf {b} } может быть выражено как сумма фиксированного решения mathbf{v} и какого-либо элемента ядра. То есть множеством решений уравнения {displaystyle Amathbf {x} =mathbf {b} } является

{displaystyle left{mathbf {v} +mathbf {x} mid Amathbf {v} =mathbf {b} land mathbf {x} in operatorname {Null} (A)right}.}

Геометрически это означает, что множество решений уравнения {displaystyle Amathbf {x} =mathbf {b} } образовано параллельным переносом ядра матрицы A на вектор mathbf{v}. См. также Альтернатива Фредгольма.

Иллюстрация[править | править код]

Ниже приведена простая иллюстрация вычисления ядра матрицы (см. Вычисление методом Гаусса ниже для метода, более подходящего для более сложных вычислений). Иллюстрация затрагивает также пространства строк и их связь с ядром.

Рассмотрим матрицу

{displaystyle A={begin{bmatrix}2&3&5\-4&2&3end{bmatrix}}.}

Ядро этой матрицы состоит из всех векторов {displaystyle (x,y,z)in mathbb {R} ^{3}}, для которых

{displaystyle {begin{bmatrix}2&3&5\-4&2&3end{bmatrix}}{begin{bmatrix}x\y\zend{bmatrix}}={begin{bmatrix}0\0end{bmatrix}},}

что можно выразить в виде однородной системы линейных уравнений относительно x, y и z:

{displaystyle {begin{aligned}2x+3y+5z&=0,\-4x+2y+3z&=0.end{aligned}}}

Те же самые равенства можно выписать в матричном виде:

{displaystyle left[{begin{array}{ccc|c}2&3&5&0\-4&2&3&0end{array}}right].}

С помощью метода Гаусса матрица может быть сведена к:

{displaystyle left[{begin{array}{ccc|c}1&0&1/16&0\0&1&13/8&0end{array}}right].}

Преобразование матрицы в уравнения даёт:

{displaystyle {begin{aligned}x&=-{frac {1}{16}}z\y&=-{frac {13}{8}}z.end{aligned}}}

Элементы ядра можно выразить в параметрическом виде следующим образом:

{displaystyle {begin{bmatrix}x\y\zend{bmatrix}}=c{begin{bmatrix}-1/16\-13/8\1end{bmatrix}}quad ({text{где}}quad cin mathbb {R} )}

Поскольку c является свободной переменной[en], пробегающей по всем вещественным числам, это выражение можно эквивалентно переписать в виде:

{displaystyle {begin{bmatrix}x\y\zend{bmatrix}}=c{begin{bmatrix}-1\-26\16end{bmatrix}}.}

Ядро матрицы A — это в точности множество решений этих уравнений (в этом случае прямая через начало координат в mathbb {R} ^{3}). Здесь вектор (−1,−26,16)T образует базис ядра матрицы A. Дефект матрицы A равен 1.

Следующие скалярные произведения равны нулю:

{displaystyle {begin{bmatrix}2&3&5end{bmatrix}}{begin{bmatrix}-1\-26\16end{bmatrix}}=0quad {text{ и }}quad {begin{bmatrix}-4&2&3end{bmatrix}}{begin{bmatrix}-1\-26\16end{bmatrix}}=0mathrm {,} }

что показывает, что вектора ядра матрицы A ортогональны каждой вектор-строке матрицы A.

Линейная оболочка этих двух (линейно независимых) вектор-строк — это плоскость, ортогональная вектору {displaystyle (-1,-26,16)^{T}}.

Поскольку ранг матрицы A равен 2, размерность ядра матрицы A равна 1, а размерность матрицы A равна 3, мы имеем иллюстрацию теоремы о ранге и дефекте.

Примеры[править | править код]

{displaystyle L(x_{1},x_{2},x_{3})=(2x_{1}+3x_{2}+5x_{3},;-4x_{1}+2x_{2}+3x_{3})},
то ядром оператора L является множество решений системы

{displaystyle {begin{alignedat}{7}2x_{1}&;+;&3x_{2}&;+;&5x_{3}&;=;&0\-4x_{1}&;+;&2x_{2}&;+;&3x_{3}&;=;&0end{alignedat}}}
{displaystyle L(f)=f(0,3){text{.}},}
Тогда ядро of L состоит из всех функций {displaystyle fin C[0,1]}, для которых{displaystyle f(0,3)=0}.
{displaystyle D(f)={frac {df}{dx}}{text{.}}}
Тогда ядро of D состоит из всех функций в {displaystyle C^{infty }(mathbb {R} )}, производная которых равна нулю, то есть из всех постоянных функций.
{displaystyle s(x_{1},x_{2},x_{3},x_{4},ldots )=(x_{2},x_{3},x_{4},ldots ){text{.}}}
Тогда ядром оператора s будет одномерное подпространство, состоящее из всех векторов {displaystyle (x_{1},0,0,dots )}.

Вычисления по методу Гаусса[править | править код]

Базис ядра матрицы можно вычислить с помощью метода Гаусса.

Для этой цели, если дана mtimes n матрица A, мы строим сначала расширенную[en] по строкам матрицу {displaystyle left[{begin{array}{c}A\hline Eend{array}}right],}, где E — это ntimes n единичная матрица.

Если вычислим ступенчатый по столбцам вид матрицы методом Гаусса (или любым другим подходящим методом), мы получим матрицу {displaystyle left[{begin{array}{c}B\hline Cend{array}}right].} Базис ядра матрицы A состоит из ненулевых столбцов матрицы C, таких что соответствующие столбцы матрицы B a нулевые.

Фактически вычисление может быть остановлено, как только матрица принимает ступенчатый по столбцам вид — остальное вычисление состоит из изменения базиса векторного пространства, образованного столбцами, верхняя часть которых равна нулю.

Например, представим, что

{displaystyle A=left[{begin{array}{cccccc}1&0&-3&0&2&-8\0&1&5&0&-1&4\0&0&0&1&7&-9\0&0&0&0&0&0end{array}},right].}

Тогда

{displaystyle left[{begin{array}{c}A\hline Eend{array}}right]=left[{begin{array}{cccccc}1&0&-3&0&2&-8\0&1&5&0&-1&4\0&0&0&1&7&-9\0&0&0&0&0&0\hline 1&0&0&0&0&0\0&1&0&0&0&0\0&0&1&0&0&0\0&0&0&1&0&0\0&0&0&0&1&0\0&0&0&0&0&1end{array}}right].}

Если привести верхнюю часть с помощью операций над столбцами к ступенчатому виду, получим

{displaystyle left[{begin{array}{c}B\hline Cend{array}}right]=left[{begin{array}{cccccc}1&0&0&0&0&0\0&1&0&0&0&0\0&0&1&0&0&0\0&0&0&0&0&0\hline 1&0&0&3&-2&8\0&1&0&-5&1&-4\0&0&0&1&0&0\0&0&1&0&-7&9\0&0&0&0&1&0\0&0&0&0&0&1end{array}}right].}

Последние три столбца матрицы B нулевые. Поэтому три последних вектора матрицы C,

{displaystyle left[!!{begin{array}{r}3\-5\1\0\0\0end{array}}right],;left[!!{begin{array}{r}-2\1\0\-7\1\0end{array}}right],;left[!!{begin{array}{r}8\-4\0\9\0\1end{array}}right]}

являются базисом ядра матрицы A.

Доказательство, что метод вычисляет ядро: поскольку операции над столбцами соответствуют умножению справа на обратимую матрицу, из факта, что {displaystyle left[{begin{array}{c}A\hline Eend{array}}right]} сводится к {displaystyle left[{begin{array}{c}B\hline Cend{array}}right]} вытекает, что существует обратимая матрица P, такая что {displaystyle left[{begin{array}{c}A\hline Eend{array}}right]P=left[{begin{array}{c}B\hline Cend{array}}right],} где B имеет ступенчатый вид. Тогда {displaystyle AP=B,} {displaystyle EP=C,} и {displaystyle AC=B.} Вектор-столбец v принадлежит ядру матрицы A (то есть {displaystyle Av=0}) тогда и только тогда, когда {displaystyle Bw=0,} где {displaystyle w=P^{-1}v=C^{-1}v.} Так как B имеет ступенчатый вид, {displaystyle Bw=0} тогда и только тогда, когда ненулевые элементы w соответствуют нулевым столбцам матрицы B. После умножения на C можно сделать вывод, что это случается тогда и только тогда, когда {displaystyle v=Cw} является линейной комбинацией соответствующих столбцов матрицы C.

Численные вычисления[править | править код]

Задача вычисления ядра на компьютере зависит от природы коэффициентов.

Точные коэффициенты[править | править код]

Если коэффициенты матрицы заданы как точные числа, ступенчатый вид матрицы может быть вычислен алгоритмом Барейса, который более эффективен, чем метод Гаусса. Ещё более эффективно использование сравнения по модулю и китайской теоремы об остатках, которые сводят задачу к нескольким аналогичным задачам над конечными полями (что сокращает издержки, порождённые нелинейной вычислительной сложностью целочисленного умножения).

Для коэффициентов из конечного поля метод Гаусса работает хорошо, но для больших матриц, которые случаются в криптографии и при вычислении базиса Грёбнера, известны более эффективные алгоритмы, которые имеют почти ту же вычислительную сложность, но работают быстрее и более подходят для современных компьютерных устройств.

Вычисления с плавающей точкой[править | править код]

Для матриц, элементами которых служат числа с плавающей запятой, задача вычисления ядра имеет смысл только для матриц, число строк которых равно её рангу — ввиду ошибок округления[en] матрицы с плавающими значениями почти всегда имеют полный ранг, даже когда они являются аппроксимацией матрицы много меньшего ранга. Даже для матрицы полного ранга можно вычислить её ядро только тогда, когда она хорошо обусловлена, то есть имеет низкое число обусловленности[6].

И для хорошо обусловленной матрицы полного ранга метод Гаусса не ведёт себя корректно: ошибки округления слишком велики для получения значимого результата. Так как вычисление ядра матрицы является специальным случаем решения однородной системы линейных уравнений, ядро может быть вычислено любым алгоритмом, предназначенным для решения однородных систем. Передовым программным обеспечением для этих целей является библиотека Lapack.

См. также[править | править код]

  • Ядро (алгебра)
  • Нуль функции
  • Пространство столбцов
  • Пространство функций[en]
  • Альтернатива Фредгольма

Примечания[править | править код]

  1. The Definitive Glossary of Higher Mathematical Jargon — Null. Math Vault (1 августа 2019). Дата обращения: 9 декабря 2019.
  2. Weisstein, Eric W. Kernel. mathworld.wolfram.com. Дата обращения: 9 декабря 2019.
  3. Kernel (Nullspace) | Brilliant Math & Science Wiki. brilliant.org. Дата обращения: 9 декабря 2019.
  4. Линейная алгебра в том виде, как обсуждается в этой статье, является хорошо проработанной математической дисциплиной, для которой можно найти много книг. Почти весь материал статьи можно найти в лекциях Лея (Lay, 2005), Мейера (Meyer, 2001) и Стренга.
  5. 1 2 Weisstein, Eric W. Rank-Nullity Theorem. mathworld.wolfram.com. Дата обращения: 9 декабря 2019.
  6. Archived copy. Дата обращения: 14 апреля 2015. Архивировано 29 августа 2017 года.

Литература[править | править код]

  • Sheldon Jay Axler. Linear Algebra Done Right. — 2nd. — Springer-Verlag, 1997. — ISBN 0-387-98259-0.
  • Гилберт Стренг. Линейная алгебра и её применение. — Москва: «Мир», 1980.
  • David C. Lay. Linear Algebra and Its Applications. — 3rd. — Addison Wesley, 2005. — ISBN 978-0-321-28713-7.
  • Carl D. Meyer. Matrix Analysis and Applied Linear Algebra. — Society for Industrial and Applied Mathematics (SIAM), 2001. — ISBN 978-0-89871-454-8.
  • David Poole. Linear Algebra: A Modern Introduction. — 2nd. — Brooks/Cole, 2006. — ISBN 0-534-99845-3.
  • Howard Anton. Elementary Linear Algebra (Applications Version). — 9th. — Wiley International, 2005.
  • Steven J. Leon. Linear Algebra With Applications. — 7th. — Pearson Prentice Hall, 2006.
  • Serge Lang. Linear Algebra. — Springer, 1987. — ISBN 9780387964126.
  • Lloyd N. Trefethen, David III Bau. Numerical Linear Algebra. — SIAM, 1997. — ISBN 978-0-89871-361-9.

Ссылки[править | править код]

  • Hazewinkel, Michiel, ed. (2001), Kernel of a matrix, Encyclopedia of Mathematics, Springer, ISBN 978-1-55608-010-4
  • Khan Academy, Introduction to the Null Space of a Matrix

Добавить комментарий