Как найти границы уравнения

Макеты страниц

Для алгебраического уравнения

задача отделения корней решается более просто и точно. Прежде чем отделять корни уравнения, естественно найти границы области, в которой расположены все корни уравнения, поэтому мы сначала приведем ряд способов отыскания этих границ. Пусть

Теорема 1. Все корни уравнения (1) расположены в кольце

Доказательство. Действительно, но при имеем:

Следовательно, как только

т. е. при Таким образом, все корни уравнения находятся внутри круга радиуса

Далее, уравнение

имеет корнями величины, обратные корням исходного уравнения. По доказанному все корни этого уравнения находятся внутри круга

радиуса для любого корня исходного уравнения имеет место неравенство

Объединяя результаты, получим неравенство (2).

Предположим, что все коэффициенты уравнений действительные числа и Найдем границы действительных корней уравнения. Очевидно, достаточно иметь способы определения границ положительных корней, так как, заменяя х на мы получим уравнение, корни которого отличаются от корней исходного уравнения знаком.

Теорема 2. Обозначим через а максимум абсолютных вели отрицательных коэффициентов уравнения, и пусть первый отрицательный коэффициент в ряду есть Тогда все положительные корни уравнения меньше (Если отрицательных коэффициентов нет, то нет и положительных корней.)

Доказательство. Заменим положительные коэффициенты нулями, а все остальные коэффициенты на .

Тогда при будем иметь:

Отсюда при имеем неравенство так как

а это и означает, что все положительные корни меньше С помощью теоремы 2 можно найти границы действительных корней очень грубо. Иногда эти границы можно сузить, применив следующий простой прием.

Пусть в уравнении коэффициенты неотрицательны, а неположительны и Введем обозначения:

Тогда

Первое слагаемое в скобках содержит только положительные степени х, а второе только отрицательные. Следовательно, при первое слагаемое возрастает, а второе убывает с возрастанием х, т. е. при х > 0 функция возрастает вместе с х. Найдя какое-либо для которого , мы можем гарантировать, что все корни уравнения меньше а.

В общем случае представим в виде

где есть многочлен, содержащий все первые старшие по степени члены многочлена имеющие положительные коэффициенты и все члены с отрицательными коэффициентами, а многочлен, образованный всеми остальными членами исходного многочлена Тогда, если мы найдем для которого то при всех так как при и все корни уравнения будут меньше а.

Хороший способ отыскания верхней границы положительных корней указал Ньютон. Этот способ основан на утверждении: если при имеют место неравенства

то уравнение не имеет корней, больших а. Действительно,

при всех

Таким образом, способ Ньютона заключается в отыскании значения при котором многочлен и все его производные имеют положительное значение. Тогда это значение будет верхней границей положительных корней.

Замечание. Нижняя граница положительных корней может быть найдена из уравнения такими же приемами, так как если (3 есть верхняя граница положительных корней этого уравнения, то будет нижней границей положительных корней исходного уравнения.

Пример. Найти границы действительных корней уравнения

1-й способ (использование теоремы 2). В данном случае

Следовательно, все положительные корни уравнения меньше

Для отыскания нижней границы положительных корней уравнения рассмотрим уравнение

Так как то верхняя граница положительных корней этого уравнения будет:

а следовательно, нижняя граница корней исходного уравнения

Итак, все положительные корни уравнения находятся на отрезке [0,57; 1351].

Для отыскания границ отрицательных корней рассмотрим уравнение

получающееся заменой х на — z. Это уравнение, очевидно, не имеет положительных корней, а следовательно, исходное уравнение не имеет отрицательных корней. 2-й способ. Представим

в виде

где

При Поэтому все корни уравнения меньше 40.

Для отыскания нижней границы снова заменим х на у. Получим:

где

Таким образом, положительные корни уравнения меньше 1,5, а положительные корни исходного

уравнения больше Следовательно, корни уравнения расположены на отрезке [0,66; 40]. Мы получили значительно лучший результат, чем в первом способе.

Способом Ньютона можно показать, что корни уравнения расположены на отрезке [0,74; 22], т. е. удается еще улучшить результат.

Рассмотрим еще одну задачу связаннуюс полиномами. Когда мы пытаемся решить такое уравнение численно, то нам необходимо знать, в каких пределах могут находится действительные корни этого полинома.

Эти знания позволят нам быстрее обеспечить сходимость при компьютерных вычислениях. Это позволит при прорисовке полинома в виде графика, выбрать такой масштаб, что бы мы увидели все пересечения функции с осью абсцисс.

Итак, как же формулы мы будем использовать для решения задачи?

Если нам известен полином вида

То разделив его на a0 мы получаем

Правило утверждает, что если среди коэффицентов есть отрицательные числа и -первое из них, и также есть отрицательный коэффицент A который является самым большим (в абсолютном значении), то действительные корни этого полинома не превышают число

Нижнюю границу можно определить по аналогичной формуле, вычислив значения функции коэффицентов при -x

Давайте рассмотрим пример

Разделим на 3 , что бы первый член полинома был равен единице.

Первый отрицательный коэффициент который мы встречаем это он стоит на второй позиции ( )

Значение А=9, так как 9 явлется максимальном в абсолютном выражении числом из всех отрицательных коэффициентов полинома.

Таким образом верхняя граница действительных корней

Теперь определяем нижнюю границу

Разделим полином на -3, что бы первый член полинома был равен единице.

Первый отрицательный коэффициент который мы встречаем это он стоит на первой позиции ( )

Таким образом нижняя граница действительных корней

Следовательно, все действительные корни заданного многочлена находятся в пределах

Бот позволяет выполнять эти вычисления автоматически и при заданных действительных коэффициентах давать правильные результаты.

Единственное замечание, не стоит вводить в качестве коэффициентов комплексные числа. Результат будет непредсказуем.

Алгебраические уравнения в математике с примерами решения и образцами выполнения

Алгебраическое уравнение — это уравнение вида. где. — многочлен от переменных. , которые называются неизвестными.

Делимость многочлена

Делимость многочлена, целого относительно х, на разность xа.

Теорема Безу:

Многочлен, целый относительно х:
,
при делении на разность х — а (где а есть произвольное число, положительное или отрицательное) даёт остаток

равный тому значению делимого, которое оно получает при х=а.

Доказательство:

Из процесса деления многочлена, расположенного по убывающим степеням буквы х, видно, что деление такого многочлена на х — а можно продолжать до тех пор, пока высший член остатка R не будет содержать в себе буквы х. Пусть при этом частное будет некоторый многочлен Q. Тогда мы можем написать равенство:
M=(x- a)Q+R.

Равенство это есть тождество, т. е. оно верно при всевозможных значениях буквы х, а потому оно должно быть верно и при х-а. Но при x=а оно даёт
M’ = (α — α) Q’ + R
если буквами М‘ и Q‘ обозначим те значения M и Q, которые эти многочлены принимают при х=а (остаток R, как не содержащий вовсе x, не изменится от подстановки а на место х). Так как a — α=0, то и произведение (а — a) Q‘ равно 0; значит, последнее равенство даёт M‘= R, т. е.

что и требовалось доказать.

Следствие:

Так как x+α=x— (—а), то, применяя доказанную теорему к сумме х+а, найдём:
многочлен

при делении на сумму x+α даёт в остатке число, равное

т. е. число, равное тому значению делимого, которое оно получает при x= —а.

Примеры:
1) Многочлен x⁵—3x²+5x—1 при делении на х—2 даёт остаток, равный
2⁵-3 ∙ 2²+5 ∙ 2—1=29.

2) Многочлен x⁵—3x²+5x—1 при делении на x+2 даёт остаток
(-2)⁵-3 (- 2)²+5 (-2)—1=-55.

Следствие:

Для того чтобы многочлен

делился на разность х—а, необходимо и достаточно, чтобы при х=а он обращался в нуль.

Это необходимо, так как если указанный многочлен делится на x—а, то остаток от деления должен быть нуль, а этот остаток, по доказанному выше, есть то значение делимого, которое оно принимает при x=а. Это и достаточно, так как если многочлен обращается в нуль при x=a, то это значит, что остаток от деления этого многочлена на х—а равен нулю.

Следствие:

Для того чтобы многочлен

делился на сумму х+а, необходимо и достаточно, чтобы при х = —а он обращался в нуль, так как сумма х+а есть разность x—(— а).

Примеры:
1) Многочлен x³-4x²+9 делится на х—3, потому что
З³ — 4∙3²+9=0.
2) Многочлен 2x²+x-45 делится на x+5, так как
2 (-5)²+(-5)—45=0.

Делимость двучлена на . 1) Разность одинаковых степеней двух чисел делится на разность тех же чисел, так как при делении на х—а даёт остаток , т. е. 0.

2) Сумма одинаковых степеней двух чисел не делится на разность этих чисел, так как при делении на х—а даёт остаток , а не 0.

3) Разность одинаковых чётных степеней двух чисел делится, а нечётных не делится на сумму этих чисел, так как при делении разности , на х+а остаток равен , что при m чётном равно нулю, а при tn нечётном составляет — .

4) Сумма одинаковых нечётных степеней двух чисел делится, а чётных не делится на сумму этих чисел, так как. при делении суммы на x+α остаток равен что при m нечётном равно 0, а при m чётном составляет .

Примеры:
1) x¹+α¹ делится на x+α, но не делится на х—а.
2) x²- α² делится и на х—а, и на x+a.
3) x²+α² не делится ни на х—а, ни на x+a.
4) x³- α³ делится на х—а, но не делится на x+α.
5) x³+α³ делится на x+a, но не делится на х—а.

Частные, получаемые при делении на . Если произведём деление двучлена на двучлен х—а, то в частном получим многочлен:

(остатки при этом делении идут в такой последовательности: 1-й остаток , 2-й остаток , 3-й остаток ,…, m-й остаток ).

Очевидно, что многочлен, получившийся в частном, содержит m членов; сумма показателей в каждом члене при а и х одна и та же, именно: m—1; показатели х идут, уменьшаясь на 1,от m—1 до 0, показатели же а идут, увеличиваясь на 1, от 0 до m—1; коэффициенты у всех членов равны 1; знаки все +; число членов в частном m.

Заметив это, можем прямо писать:
x³- α³=(x-a) (x²+αx+α²);
x⁴- α⁴=(x-α) (x³+αx²+α²x+ α³);
x⁵ — α⁵=(x-a) (x⁴+αx3+α²x²+α³x+α⁴) и т. п.

Чтобы получить частное от деления на x + a при m чётном или при делении на x+a при m нечётном, достаточно в полученном выше частном заменить а на —а. Таким образом:
x³+α³=(x+α) (x²-αx+α²);
x⁴—α⁴=(x+α) (х³-αx²+α²x-α³);
x⁵+a⁵=(x+α) (х⁴ — αx³+α²x² — a³x+a⁴) и т.п.

Общий вид алгебраического уравнения

Мы ранее видели, что уравнение, содержащее неизвестное в знаменателях, может быть приведено к целому виду. Далее мы знаем, что уравнение, содержащее неизвестное под знаком радикала, может быть приведено к рациональному виду. Вследствие этого можем сказать, что всякое уравнение, в котором неизвестное связано с данными числами посредством конечного числа шести алгебраических действий (сложения, вычитания, умножения, деления, возвышения в степень и извлечения корня), может быть приведено к такому целому и рациональному виду:

где коэффициенты А, В, С, … , K и L суть постоянные вещественные или комплексные числа, а m есть показатель степени уравнения. Некоторые коэффициенты, кроме первого, в частных случаях могут равняться нулю.

Уравнение такого вида называется алгебраическим. Алгебраические уравнения степени выше второй называются уравнениями высших степеней.

Некоторые свойства алгебраического уравнения

Уравнения высших степеней составляют предмет высшей алгебры. Элементарная же рассматривает только некоторые частные виды этих уравнений.

Высшая алгебра устанавливает следующую важную теорему:
Всякое алгебраическое уравнение имеет вещественный или комплексный корень (теорема Гаусса 2), 1799 г.).

Допустив эту истину (доказательство которой в элементарной алгебре было бы затруднительно), нетрудно показать, что:
Алгебраическое уравнение имеет столько корней, вещественных или комплексных, сколько единиц в показателе его степени.

Действительно, согласно теореме Гаусса, уравнение
(1)
имеет вещественный или комплексный корень; пусть этот корень будет а. Тогда многочлен, стоящий в левой части уравнения (1), должен делиться на х—а. Если произвести это деление, то в частном получим многочлен степени m—1, у которого первый коэффициент будет А. Обозначив другие его коэффициенты соответственно буквами B₁, C₁ ,…, K₁ и приняв во внимание, что делимое равно делителю, умноженному на частное, можем представить уравнение (1) так:
(2)
Приравняв нулю многочлен, стоящий во вторых скобках, получим новое уравнение, которое по той же теореме должно иметь некоторый корень β; вследствие этого левая его часть может быть разложена на два множителя: х—β и многочлен степени m—2, у которого первый коэффициент по-прежнему будет А. Поэтому уравнение (1) можно переписать так:
(3)

Продолжая эти рассуждения далее, дойдём, наконец, до того, что многочлен, заключённый в последних скобках, будет второй степени, причём первый его коэффициент останется А. Разложив этот трёхчлен на множители, приведём уравнение (1) к виду:
A(x- а) (х—β) (х— γ) . .. (х—λ)=0, (4)
где всех разностей: x-a, х- β,…, будет m. Очевидно, что уравнение (4) обращается в тождество при каждом из значений: x=α, x=β, x=γ, . x=λ и не удовлетворяется никакими иными значениями x (если A≠0); значит, уравнение (1) имеет m корней: a, β, γ ,…, λ. В частных случаях некоторые корни могут оказаться одинаковыми.

Полезно заметить ещё следующие истины, доказываемые в высшей алгебре.

Сумма корней всякого алгебраического уравнения
равна , а произведение корней равно (примером может служить квадратное уравнение).

Если алгебраическое уравнение с вещественными коэффициентами имеет комплексные корни, то число этих корней — чётное (примером может служить биквадратное уравнение).

Если алгебраическое уравнение с вещественными коэффициентами имеет n корней вида p+qi, оно имеет ещё n корней вида p—qi (примером может служить биквадратное уравнение, комплексные корни которого всегда сопряжённые), и так как
[х—(p+qi)][x-(р— qi)]=[(x-p)- qi] (x-p)+qi] =
=(х—р)²—q²i²=(x-p)²+q²=x²-2 +(p²+q²),
то левая часть уравнения содержит в этом случае n вещественных множителей вида ax²+bx+c.

Алгебраическое уравнение нечётной степени с вещественными коэффициентами имеет, по крайней мере, один вещественный корень.

Уравнения с произвольными буквенными коэффициентами степени не выше четвёртой разрешены алгебраически, т. е. для корней этих уравнений найдены общие формулы, составленные из коэффициентов уравнения посредством алгебраических действий.

В этом смысле уравнения с произвольными коэффициентами степени выше четвёртой не могут быть разрешены алгебраически (теорема Абеля); однако, если коэффициенты уравнения какой угодно степени выражены числами, всегда есть возможность вычислить с желаемой степенью приближения все его корни как вещественные, так и мнимые. Способы такого вычисления излагаются в высшей алгебре.

Методы решения целых алгебраических уравнений

Разложение на множители

Часть целых алгебраических уравнений (или аналогичных неравенств) степени n выше 2-й могут быть решены путём разложения многочлена в левой части уравнения (неравенства) на множители с помощью таких известных приёмов, как группировка и вынесение общего множителя за скобки. Иногда для достижения цели приходится прибавлять и одновременно вычитать одно и то же выражение. Отметим, что порой разложение на множители этим способом требует определённого искусства.

Если разложение на множители удалось выполнить, то решение алгебраического уравнения сводится к решению совокупности нескольких уравнений, но более низкой степени. Неравенство после разложения на множители можно решать методом интервалов.

Пример:

Решить уравнение

Решение:

Из 1-го уравнения находим корни , а второе не имеет решений.

Пример:

Найти все положительные корни уравнения

Решение:

Покажем, что второе уравнение в совокупности не имеет положительных решений. Действительно, рассмотрим функцию Её производная при всех действительных x, так как Следовательно, функция всюду монотонно возрастает, при этом y(0) = 5 . Отсюда следует, что при x > 0 её график не пересекает оси абсцисс.

Ответ:

Подбор корня с последующим понижением степени уравнения

При решении алгебраических уравнений и неравенств степени выше второй можно использовать общий принцип последовательного понижения степени уравнения (неравенства).

Пусть требуется решить уравнение n -й степени

где целый рациональный алгебраический многочлен n -й степени. Если удалось подобрать (любым способом) какой-либо корень данного уравнения, то для нахождения остальных корней уравнения следует поделить многочлен на разность X — Х0 (или целенаправленной группировкой слагаемых, выделяя разность , разложить этот многочлен на множители). В результате деления образуется некоторый многочлен , степень которого на единицу меньше первоначальной. Таким образом, задача свелась к решению алгебраического уравнения степени n — 1 :

Пример:

Решить уравнение

Решение:

Заметим, что x = 2 является корнем данного уравнения. Найдём другие корни этого уравнения:

Решая уравнение , находим ещё два корня

Эта ссылка возможно вам будет полезна:

Пример:

Решить уравнение

Решение:

Легко заметить, проанализировав структуру уравнения, что числа x = 0 и x = -10 являются решениями данного уравнения. С другой стороны, ясно, что это квадратное уравнение, а поэтому может иметь не более двух корней. Так как два корня уравнения уже подобраны, то других корней нет.

В некоторых случаях, для того чтобы не подбирать корень «вслепую», можно воспользоваться следующим методом.

Метод поиска рациональных корней у многочленов с целыми коэффициентами

Для решения такого рода уравнений и неравенств используется метод, в основе которого лежит Теорема 9 из предыдущего пункта. Рассмотрим подробнее суть этого метода. Пусть требуется найти рациональные корни уравнения n -й степени

причём все коэффициенты алгебраического многочлена являются целыми числами. Поиск рациона-льных корней можно свести к перебору ограниченного количества вариантов. Для этого необходимо, во-первых, найти все целочислен-ные делители свободного члена (их конечное число, однако если этот коэффициент содержит слишком много делителей, то это затрудняет поиск корней в уравнении). Обозначим, например, эти делители через . Во-вторых, следует найти все натуральные делители старшего коэффициента уравнения . Обозначим эти делители через . В-третьих, надо составить всевозможные дроби вида . Наконец, перебирая по очереди все такие дроби, проверить, является ли в действительности каждая из них корнем данного уравнения. Найдя таким образом первый корень , вы или сразу понижаете степень уравнения делением многочлена на разность , (причём в силу следствия из теоремы Безу обязательно разделится нацело на этот линейный двучлен) и получаете некоторый многочлен степени на единицу меньшей, чем первоначальная. Или, перебирая все дроби, находите все рациональные корни и уже затем понижаете степень уравнения сразу на столько порядков, сколько рациональных корней удалось найти, и ищете оставшиеся иррациональные корни. В любом случае задача сводится к решению уравнения более низкой степени.

Пример:

При каких натуральных n уравнение имеет рациональные корни?

Решение:

Воспользуемся приведённым выше методом. Свободный член имеет два целочисленных делителя: ± 1, а старший коэффициент — два натуральных делителя: 1,2. Поэтому рациональные корни следует искать среди чисел Подставим их поочерёдно в уравнение.

Ответ:

Метод неопределённых коэффициентов

Иногда для решения целых алгебраических уравнений (неравенств) с одной или несколькими неизвестными используют метод неопределённых коэффициентов. Пусть, например, решается уравнение

Суть метода состоит в том, что многочлен в левой части уравнения представляется в виде произведения линейных и(или) квадратичных сомножителей с неизвестными (неопределёнными) коэффициентами Чтобы найти эти коэффициенты, раскрывают скобки в указанном произведении и приводят образовавшийся при этом многочлен к стандарт-ному виду. Так как два многочлена и одной степени тождественно равны тогда и только тогда,

когда равны коэффициенты при одинаковых степенях переменной x, то, приравнивая эти коэффициенты, получают систему уравнений относительно неизвестных коэффициентов. Эту систему решают (или подбирают любое решение). Найденные таким способом коэффи-циенты становятся определёнными и их значения подставляются в исходное разложение. К недостаткам метода можно отнести то, что получаемая система уравнений для нахождения коэффициентов может оказаться громоздкой и трудной даже в подборе решения.

Рассмотрим применение этого метода на примере решения кубического уравнения. Допустим, требуется решить уравнение

Известно, что многочлен третьей степени всегда можно представить в виде произведения многочленов первой и второй степеней. Таким образом, сразу для всех действительных значений переменной x должно выполняться равенство

где числа а,b,c являются в данном случае искомыми неопределён-ными коэффициентами. Найдём их значения. После этого останется подставить их в правую часть (1) и, приравняв её к нулю, решить уравнение для нахождения всех корней уравнения.

Чтобы найти коэффициенты а,b,c, раскроем скобки в правой части тождества (1) и приведём образовавшийся при этом многочлен к стандартному виду

Многочлены третьей степени тождественно равны тогда и только тогда, когда равны коэффициенты при одинаковых степенях x . Приравнивая коэффициенты при , и свободные члены, получаем систему трёх алгебраических уравнений относительно трёх неизвестных а,b,c :

решая которую (можно даже просто подобрать любое решение этой системы) находим коэффициенты.

Пример:

Решить уравнение

Решение:

Воспользуемся для решения методом неопределённых коэффициентов. Будем искать разложение многочлена, стоящего в левой части уравнения, в виде

Раскрыв скобки, приведём многочлен в правой части к стандартному виду

Приравнивая коэффициенты слева и справа при ,и свободные члены, получаем в итоге систему трёх уравнений с тремя неизвестными коэффициентами а,b,c:

Найдя подбором решение подставим найденные коэффициенты в разложение (2). Таким образом, исходное уравнение приобретает вид Оно имеет три корня

Пример:

При каких значениях а все корни уравнения являются корнями уравнения

Решение:

Чтобы первое из уравнений имело корни, необходимо, чтобы его дискриминант был неотрицателен, т.е.

Далее, второй многочлен в силу теоремы Безу должен делиться нацело на первый многочлен. Иными словами, должно найтись такое b , что при всех действительных x справедливо тождество

Для нахождения неопределённых коэффициентов (в данном случае в их роли выступают а и b ) воспользуемся известным фактом, что два кубических многочлена, стоящие по разные стороны от знака равенства, тождественно равны тогда и только тогда, когда равны коэффициенты при одинаковых степенях переменной x . Приравнивая эти коэффициенты, получаем систему уравнений

Метод умножения на функцию

Иногда, применяя приём умножения обеих частей уравнения (неравенства) на некоторую функцию, удаётся упростить уравнение (неравенство).

Пример:

Решить уравнение

Решение:

Заметим, что x = — 1 (и вообще никакое отрицательное число) не является корнем данного уравнения. Домножим обе части данного уравнения на выражение (х +1). Получаем уравнение-следствие

множество решений которого состоит из всех решений исходного уравнения и числа x = -1. Это число является посторонним корнем, возникшем как раз в результате умножения уравнения на функцию, имеющую действительный нуль. Применяя известную формулу сокращенного умножения, получаем существенно более простое уравнение Поскольку уравнение не имеет других решений, кроме x = -1, то приходим к ответу.

Ответ: уравнение не имеет решений.

Рассмотрим некоторые виды целых алгебраических уравнений, решаемые в основном при помощи специально подобранных подстановок.

Понятие алгебраического и трансцендентного уравнения и методов их приближенного решения

Введем понятия алгебраического и трансцендентного уравнения.

Алгебраическое уравнение — уравнение, в котором переменная находится в основании степени с рациональным показателем.

Примерами алгебраических уравнений могут служить уравнения вида: , .

Уравнение, содержащее неизвестную переменную под знаком логарифма, тригонометрических функций, обратных тригонометрических функций или в показателе степени некоторого числа, называется трансцендентным.

Примерами трансцендентных уравнений могут служить уравнения вида:

Решить предложенное уравнение — значит найти все значения переменной , обращающие его в верное тождество (корни уравнения), или доказать, что корней нет.

Из курса алгебры нам известны методы и приемы решения некоторых видов алгебраических и трансцендентных уравнений: например, квадратных уравнений; уравнений, решаемых методом группировки и вынесения за скобки общего множителя. Но даже решение несложного кубического уравнения вызовет у нас определенные сложности. Если нс удастся решить заданное уравнение привычными способами, существуют методы приближенного решения уравнений, состоящие из двух этапов:

1. отделение корней;

2. уточнение корней до заданной степени точности с помощью одного из следующих методов:

Этап отделения корней необходим для того, чтобы определить, какому промежутку принадлежат корни уравнения. На этом этапе обычно используется графический способ.

Пример:

Определить промежуток, которому принадлежат корни уравнения .

Решение:

Преобразуем данное уравнение к виду: .

Построим графики функций и (рис. 46.1).

— кубическая парабола, строится по таблице значений:

— прямая, строится по двум точкам:

По рисунку видим, что графики функций и пересекаются в единственной точке , координата которой принадлежит отрезку . Следовательно, уравнение имеет ровно один корень на промежутке .

Ответ: .

Эта лекция взята с главной страницы на которой находится курс лекций с теорией и примерами решения по всем разделам высшей математики:

Другие лекции по высшей математике, возможно вам пригодятся:

Алгебраические уравнения и их геометрическое истолкование

Уравнение с одной буквой (неизвестным)

Один из основных вопросов, которыми занимается алгебра, заключается в решении уравнений нормального вида. Так называются уравнения, у которых в левой части стоит многочлен, расположенный по степеням неизвестной буквы, а в правой части — нуль.

Степень многочлена в левой части носит название степени уравнения.

Мы встречались не раз с уравнениями, которые не имели нормального вида: таковы, например, уравнения , , .

Подобного рода уравнения могут быть приведены к уравнениям нормального вида. Для этого до­ статочно освободиться от дробей, затем перенести на­ лево члены, стоящие в правой части, сделать приведение подобных членов и, наконец, правильно располо­жить члены.

Таким образом, привести заданное уравнение к уравнению нормального вида удается по большей части несложными приемами.

Напротив, нахождение всех корней уравнения представляет собою более трудную задачу, в особенности в том случае, если уравнение высокой степени.

Уравнение первой степени (линейное) имеет вид .

Уравнение второй степени (иначе квадратное) имеет вид .

Уравнение третьей степени (иначе кубическое) имеет вид .

Так можно продолжать и дальше. Ради единообразия неизвестное здесь обозначено буквой ; коэффициенты же , и т. д. — известные числа. В уравнении нормального вида старший коэффициент, конечно, следует считать отличным от нуля.

Уравнение первой степени мы решаем (см. гл. 6) следующим образом: свободный член переносим направо , затем делим уравнение на коэффициент при : .

В случае уравнений второй степени или высших степеней решение уравнения тесно связано с разложением левой части на линейные множители. Так, напри­мер, уравнение можно переписать в виде ; далее сошлемся на теорему: если про­изведение двух множителей равно нулю, то непременно один из множителей равен нулю. Поэтому или или ; значит, или или . Обратно, если или , то или первый множитель равен нулю или второй; но в обоих случаях произведение равно нулю, т. е. уравнение удовлетворяется. Итак, уравнение имеет два корня: и .

В отдельных примерах нам удавалось разлагать трехчлен второй степени на линейные множители; более полно общий прием разложения (по ­средствам «выделения квадрата») будет рассмотрен в главе 12.

Что касается уравнений третьей, четвертой и высших степеней, то, не говоря об отдельных частных случаях, разложить их левую часть на множители весь­ма трудно. С другой стороны, очень просто можно составить уравнение, имеющее наперед заданные корни; при этом степень уравнения в точности будет равняться числу корней.

Например, пусть заданы три числа: , и ; тогда уравнение, имеющее эти числа (и только их) своими корнями, таково: , или .

Производя умножение, получаем окончательно: .

Можно доказать, что число корней уравнения никогда не превышает его степени. Но иногда оно бывает меньше степени уравнения.

Например, уравнение — третьей степени, но имеет только один корень . Это сразу видно, если в левой части вынести за скобку (здесь второй множитель ни при каком значении не обращается в нуль).

Совокупность точек на числовой оси, являющихся корнями уравнения (иначе, удовлетворяющих этому уравнению), дает нам геометрическое представление этого уравнения.

Уравнение с двумя буквами (переменными)

Нам хорошо известно, что решением (корнем) уравнения с одной неизвестной буквой называется вся­кое значение входящей буквы, удовлетворяющее уравнению.

Если уравнение содержит две неизвестные буквы, понятие решения должно быть обобщено и именно следующим образом: решением уравнения с двумя неизвестными буквами называется пара значений двух неизвестных, удовлетворяющая уравнению.

Так, пара чисел есть решение уравнения ; то же можно сказать о паре чисел ; но, например, пара не есть решение.

В случае уравнения с двумя неизвестными найти и перечислить все решения, как правило, невозможно. Уже простейшие примеры, вроде или , показывают, что такое уравнение может иметь бесконечное множество решений.

Поэтому, если в уравнение входят две (или более) неизвестных буквы, их называют обыкновенно не неизвестными, а переменными (переменными величинами).

Алгебраическое уравнение с двумя буквами считается нормальным, если в правой части стоит нуль, а в левой — многочлен, расположенный по обеим бук­вам.

Уравнения с двумя буквами (как и уравнения с од­ной буквой) классифицируются по степеням: степенью уравнения называется степень многочлена, стоящего в его левой части, причем обе буквы считаются главными.

Уравнения первой степени (линейные) имеют вид .

Уравнения второй степени (квадратные) имеют вид .

Отдать себе отчет в том, какова совокупность решений данного уравнения, нам помогает геометрическое представление уравнения: оно делает наглядной ту зависимость, которая существует между значениями букв, удовлетворяющими уравнению. Познакомимся ближе с этим геометрическим представлением.

Так как у нас имеется не одна, а две буквы, до­пустим, и из которых каждая может принимать различные значения, то уже нельзя обойтись числовой прямой, а необходимо прибегнуть к числовой (координатной) плоскости. Проведем на листе клетчатой бумаги горизонтальную ось и вертикальную ось масштабы на осях будем брать одинаковые. Каждая пара значений букв изображается, как нам известно, некоторой определенной точкой плоскости , именно — точкой с абсциссой и ординатой . Поэтому совокупность всех пар значений , удовлетворяющих уравнению, изображается также не­ которой совокупностью (геометрическим местом) точек на плоскости . Эта совокупность и дает геометрическое представление решений нашего уравнения; она называется графиком уравнения. Итак, график урав­нения есть совокупность всех тех точек координатной плоскости, координаты которых удовлетворяют уравнению.

Пример:

Рассмотрим уравнение .
Его графиком является совокупность точек , у ко­торых абсцисса равна ординате легко понять, что все такие точки лежат на биссектрисе первого и треть­ его координатных углов: эта биссектриса и представляет собой график нашего уравнения.

Пример:

Второй пример возьмем более сложный. Пусть нам дано уравнение второй степени: .

Посмотрим, как можно наметить его график.

Ничего не стоит решить уравнение относительно буквы :

Дальше можно составить табличку числовых значений переменной , соответствующих заранее назначенным значениям переменной :

Черт. 39

Каждую полученную точку сейчас же отмечают на черте­ же. Точки располагаются с известной правильностью.

Чертеж 39 показывает, что при возрастании значений от до значения также возрастают от до ; затем при дальнейшем возрастании от до значения убывают от до . При получаем уже отрицательное значение: , придется поставить точку ниже оси .

При получаем ; и еще дальше значения быстро убывают (в алгебраическом смысле).

Можно букве давать и отрицательные значения; например, при будем иметь и т. д.

Полезло убедиться, что точки, получающиеся при подстановке дробных значений , не нарушают общей правильности в расположении точек графика (напри­мер, при получаем ).

Поставим себе еще и такой вопрос: имеет ли наш график какие-нибудь точки на оси , кроме двух, уже найденных? Чтобы получить ответ, достаточно в уравнении положить и решить полученное уравнение относительно . Мы получаем два корня: и . Иных корней нет. Значит, график пересекается с осью только в двух, уже ранее найденных точках.

Хотя мы отметили на чертеже не свыше десятка точек, положение которых нам известно вполне точно, тем не менее правильность их расположения не оставляет сомнений в том, что все остальные, не отмеченные нами, точки графика лежат на некоторой плавной кривой, проходящей через отмеченные точки.

Эта кривая и есть график нашего уравнения. Провести ее от руки не представит труда.

Правда, полученная таким образом кривая даст возможность лишь приближенно судить о положении тех точек графика, координаты которых не были вычислены.

Использованный нами прием получения графика но­сит название построения графика по точкам.

Постараемся дать описание этого приема, не связывая его с каким-либо определенным примером. Пусть дано некоторое уравнение, содержащее буквы и , мы хотим знать, каков его график.

Посмотрим, существуют ли такие точки графика, ко­торые имеют заранее назначенную абсциссу, скажем, . Чтобы ответить на этот вопрос, достаточно под­ставить в уравнение вместо буквы число и решить полученное уравнение (содержащее теперь уже только одну букву) относительно буквы . Корни этого уравнения дают нам ординаты всех точек графика, имеющих абсциссу , т. е. лежащих на одной и той же вертикальной прямой, отстоящей вправо от оси на расстоянии . Продолжая поступать таким же образом, т. е. давая абсциссе другие, заранее назначенные, значения, например, можно найти все точки графика, расположенные на других вертикальных пря­мых. Обыкновенно поступают именно таким образом; при этом стараются облегчить себе работу тем, что предварительно решают данное уравнение относительно буквы , т. е. приводят его к такому виду, чтобы в левой части была одна буква , а правая за­висела только от , но не от , Тогда нахождение то­чек графика сводится к выполнению числовых подста­новок в правой части уравнения.

Разумеется, можно было бы также решить данное уравнение относительно буквы и затем придавать ряд значений букве .

Примечание:

Иные уравнения — таковы, что не существует ни одной точки, координаты которой удовлетворяли бы уравнению.
Тогда график отсутствует или представляет собою «пустое место».
Этим свойством обладает, например, уравнение которого левая часть всегда положительна.

В редких случаях график может оказаться состоящим из одной точки или нескольких точек (в конечном числе). Так, уравнение удовлетворяется только одной парой значений , .

Действительно, каждый из квадратов и может быть или положительным числом, или нулем, но никак не отрицательным числом, сумма же равна нулю только в том случае, если и одновременно равны нулю. Следовательно, весь график сводится к одной точке — началу .

Линейное уравнение с двумя переменными

На чертеже 40 изображен график уравнения (1)

Это — прямая линия, проходящая через начало координат и расположенная в первой и третьей четвертях.

Уравнение показывает, что величина у прямо пропорциональна величине . Желая найти все точки графика с целыми координатами, мы даем букве значения, кратные , и получаем точки: , , и т. д.

Черт. 40

Эти точки отмечены на чертеже. Чтобы перейти от од­ной такой точки к следующей (считая вправо), достаточно отсчитать « клеточек вправо и — вверх».

Коэффициент пропорциональности позволяет
таким образом, определить направление нашей прямой.

Если бы вместо уравнения (I) было задано, напри­мер, уравнение
, (2) то мы получили бы точки графика (с целыми координатами): , , и т. д.; отмечая их одну за другой, мы отсчитывали бы « клетки вправо, — вверх», Рассмотрим еще уравнение (3).

При значениях , кратных , получаем точки: , , и т. д.

Отсчитывать нужно « клеток вправо и — вниз». Прямая, являющаяся графиком этого уравнения, расположена во второй и в четвертой четвертях. Из наших примеров можно сделать следующие об­щие заключения. Графиком уравнения вида (4) является прямая линия, проходящая через начало . Придавая уравнению вид , мы убеждаемся, что коэффициент пропорциональности представляет собою отношение ординаты любой точки графика к ее абсциссе. Если , то прямая проходит в первой и третьей четвертях; если , то во второй и четвертой. При уравнение принимает вид , и графиком тогда является ось .

Чем меньше по абсолютному значению, тем более полого расположена прямая (т. е. тем меньше острый угол, образованный ею с горизонтальной осью); напротив, чем больше по абсолютному значению, тем более круто расположена прямая (тем упомянутый острый угол ближе к прямому).

Коэффициент в уравнении (4) называется наклоном прямой, являющейся графиком этого уравнения.

Обратим внимание на то, чем график уравнения отличается от графика уравнения . При каждом данном значении абсциссы соответствующая ордината увеличена на единиц (, или ); значит, получается снова прямая линия, но «сдвинутая» на единиц в направлении оси : она уже не проходит через начало , а пересекает ось в точке .

Таким образом, направление прямой то же, что и направление прямой : оно зависит от коэффициента при в уравнении прямой, решенном относительно (называемого и в этом случае наклоном прямой).

Другими словами, прямые и параллельны.

На черт. 41 изображен график уравнения . Это — прямая, параллельная прямой , но образующая на оси отрезок, равный .

Черт. 41

Пусть буква обозначает какое угодно число. Постараемся уяснить себе, каков график уравнения .

Нам нужно установить, какова совокупность точек на плоскости , координаты которых удовлетворяют уравнению. Уравнение не удовлетворяется, если значение абсциссы не равно ; если же оно равно , то, како­ во бы ни было значение ординаты , уравнение удовлетворяется. Это значит, что уравнению удовлетворяют координаты любой точки на прямой, параллельной оси и отстоящей от этой оси вправо на расстоя­нии .

Итак, уравнение вида имеет графиком прямую, параллельную оси . Точно так же уравнение вида имеет графиком прямую, параллельную оси .

Из предыдущего следует весьма важное заключение: всякое уравнение, линейное относительно буквы и именно, уравнение вида (где , и — постоянные числа, причем и не равны нулю одновременно), имеет своим графиком прямую линию .

Действительно, если буква на самом деле входит в уравнение (это значит, что не равно нулю), то не представляет труда решить уравнение относительно . Мы получим: и далее, деля все уравнение на , полагая затем
приходим к уравнению вида
, которое, как нам уже известно, изображается прямой линией.

Если же буква отсутствует в уравнении (т. е., если ), то тогда уравнение можно решить относительно буквы (раз , то, по предположе­нию, ), и мы получим: или (где для краткости положено ). Графиком такого уравнения является совокупность точек, имеющих абсциссу ; это также прямая, но уже параллельная оси .

Рассматривать случай, когда не представляет интереса. В этом случае, если , заданное уравнение не удовлетворяется ни при каких значениях и и, значит, гра­фик этого уравнения представляет собою «пустое место»; если же , то напротив, уравнение удовлетворяется при всех значениях и тогда его «график» — вся плоскость.

Раз известно, что линейное уравнение изображается прямой линией, то для того, чтобы начертить эту линию на координатной плоскости (на листе клетчатой бумаги), нет необходимости в боль­ших вычислениях.

В самом деле, прямая определяется двумя точками: значит, достаточно сделать две числовые подстановки.

Проще всего установить точки пересечения прямой с осями и . Пусть, например, дано уравнение . Полагая , получим уравнение от­носительно : , из которого следует, что . Таким образом, найде­на точка графика , лежащая на оси . Пола­гая , получим таким же образом: , откуда следует, что . Итак, найдена точка графика , лежащая на оси . Затем остается провести прямую через точки и .

Указанный прием неудобен только в том случае, если точки и находятся очень близко одна от другой, т. е. близки к началу ; он непригоден вовсе, если график проходит через начала . В этих случаях следует делать какие-нибудь другие под­становки.

Например, чтобы построить график прямой , заметим прежде всего, что она проходит через начало ; чтобы получить еще одну точку, положим и получим ; итак, прямая проходит через точку .

Нелинейные уравнения с двумя переменными

Мы видели, что если заданное уравнение — линейное (т. е. первой степени) относительно букв и , то его график — прямая линия.

Дальнейшие примеры покажут, что если заданное уравнение — не линейное (т. е. степени второй или выше) относительно букв и , то его графиком являются кривые линии.

Степень уравнения относительно букв и назы­вается порядком соответствующей кривой.

Мы рассмотрим здесь только несколько наиболее простых и важных примеров кривых, преимущественно второго порядка.

Пример:

С этим уравнением мы уже встречались. Оно говорит о том, что пе­ременные величины и обратно пропорциональны.

Можно ли решить уравнение относительно ? От­вет — утвердительный, если только имеет значение, не равное нулю. Но легко понять, что при ника­кое значение не может удовлетворить уравнению: это значит геометрически, что на оси нет ни одной точки графика.

Итак, пусть теперь . Решим уравнение отно­сительно у: .

Это равенство свидетельствует, что есть «величи­на, обратная величине ». Посмотрим, как изменится величина, обратная , при изменении самого .

Ограничиваясь пока положительными значениями величины , станем составлять табличку и одновременно отмечать точки на чертеже. Ясно, что с увеличением величина убывает, приближаясь к нулю. Но значения она не принимает.

Попробуем взять и дробные значения :

Получающиеся на чертеже точки имеют правильное расположение: через них можно с уверенностью про­ вести плавную кривую. Менее ясно пока, как вести кривую влево, в промежутке от до . Продолжим табличку:

и станем отмечать новые точки. Теперь становится яс­но, что с убыванием положительных значений вели­чина возрастает и притом не ограничено. Имен­но, примет какое угодно большое значение, если только значение будет достаточно малым. Кривая (при движении справа налево) поднимается вверх, примыкая к оси , хотя, как мы видели, с этой осью общих точек не имеет (см. черт. 42).

Черт. 42

Вся полученная кривая расположена в первой четверти. Если бы мы пожелали давать букве отрица­тельные значения, то, составляя соответствующую таблицу и при этом производя деление по известным правилам, получили бы в третьей чет­верти другую «ветвь» кривой.

Обе «ветви». рассматриваемые совместно, обра­зуют кривую, называемую «гиперболой».

Гипербола — кривая второго порядка.

Пример:

Подставляя положительные значения , получаем таблицу:

Отметив соответствующие точки на чертеже, мы видим, что при увеличении абсциссы ордината очень быстро возрастает, причем сам график (если попробо­вать его провести) все больше выпрямляется. Напротив, ближе к началу он довольно сильно искривлен. Под­ставляя еще значения , , , мы получим:

В первой клеточке сделаем подстановки даже через одну десятую:

Последняя табличка позволяет заключить, что. под­ ходя к началу . график тесно примыкает к оси , касается ее.

Обращаясь к отрицательным значениям , мы видим, что при возведении в квадрат отрицательного числа знак минус будет уничтожаться. Отсюда ясно, что кри­вая продолжается из первой четверти во вторую симметрично относительно вертикальной оси.

Черт. 43

Полученная кривая носит название параболы(см. черт. 43).

Парабола — кривая также второго порядка.

Пример:

При подстановке больших значений , как показы­вает следующая таблица, кубы возрастают гораздо быстрее, чем квадраты:

Напротив, при подстановке значений, близких к нулю, кубы убывают быстрее, чем квадраты:

Поэтому кривая с возрастанием подни­мается вверх гораздо круче, чем парабола ; и при убывании до нуля гораздо теснее примыкает к оси .

На параболу эта кривая не похожа еще и в том отношении, что у нее отсутствует вертикальная ось симметрии; но имеется центр симметрии в начале . Это зависит от того, что при возведении в куб отрицательного числа его абсолютное значение возво­дится в куб, но знак остается отрицательный.

Общий вид кривой (кубической параболы) показан на черт. 44.

Черт. 44

Это — кривая третьего порядка.

Алгебраические уравнения и алгоритм их решения

Общая теория уравнений

Тождества:

Введем понятие тождественного равенства функ­ций на числовом множестве X.

Пусть функции у = f(х) и у = F(х) имеют области определения А и В соответственно, и X является подмножеством как A, так и В (но не обязательно совпадает с пересечением А и В). Тогда функции у = f(х) и у = F(х) определены на X.

Функции у=f(х) и у=F(х) называются тождественно равны­ми на числовом множестве X, если для любого числа х из X выпол­няется равенство f(х)=F(х). В этом случае говорят, что равенст­во f(х)=F(х) является тождеством на множестве X.

Разумеется, равенство f(х)=F(х) может быть тождеством на некотором множестве X, но не быть тождеством на каком-нибудь другом множестве Y . Рассмотрим, например, функции у=х и у =|x|. На множестве X положительных чисел эти функции тождественно равны: если х — положительное число, то |х|=х. На множестве же Y всех действительных чисел эти функции не явля­ются тождественно равными: при отрицательных значениях х ра­венство

не имеет места, так как при этих значениях |x|= — х.

Совершенно так же определяется понятие тождественного равенства для функций нескольких переменных. Например, функции переменных х и у тождественно рав­ны на множестве всех значений этих переменных: для любых значе­ний х и у выполняется равенство

Функции же z=х+у и z =|х+у | тождественно равны лишь на множестве пар чисел х, у , для которых или, что то же самое,

Область допустимых значений

Тождественные преобразова­ния многочленов и алгебраических дробей изучались в начальной алгебре, и мы не будем подробно останавливаться на этом вопросе. Разберем лишь вопрос об области допустимых значений функцио­нального равенства. Пусть дано равенство вида

Может случиться, что функции у=f(x) и у=F(x) определены не для всех значений х . Областью допустимых значений аргумента х для равенства (1) мы будем называть множество всех значений х, при которых определены и левая и правая части этого равенства.

Например, для тождества

областью допустимых значений является совокупность всех действительных чисел, из которой исключены числа 2 и 4 (при х=2 не определена функция , а при х=4 — функция ).

Следует иметь в виду, что такие преобразования, как приведение подобных членов, могут привести к изменению области допус­тимых значений. Например, тождество (2) справедливо для всех значений х , кроме х=2 и х=4. Если же мы приведем подобные члены, то получим тождество

справедливое для всех без исключения значений х.

Уравнения

Обычно когда даны две функции у=f(х) и у=F(х), то неизвестно, каково множество, на котором эти функ­ции тождественно равны. Поэтому возникает следующая задача: найти все значения х, для которых выпол­няется равенство

При такой постановке задачи (*) называют уравнением с неизвестным х , а все х , при которых функции у=f(х) и у=F(х) принимают одинаковые значения, — корнями или решениями этого уравнения.

Итак, уравнение f(x) =F(х) выражает задачу об отыскании таких значений переменного х, при которых функции f(x) и F(x) имеют оди­наковые значения. Решить уравнение — это значит найти все такие значения х, т. е. все корни (решения) уравнения.

Областью допустимых значений для уравнения (1) называют множество всех х у при которых определены обе функции у=f(х) и у=F(х). Например, для уравнения

область допустимых значений определяется условиями:

Область допустимых значений может заранее ограничиваться некоторыми условиями. Например, могут иметь смысл лишь поло­жительные или лишь целые корни. В этом случае надо рассмат­ривать уравнение лишь для положительных (или целых) значе­ний х.

Тогда мы считаем, что функции f(x) и F(х) заданы на некотором множестве X, и рассматриваем уравнение лишь на этом множестве.

Пусть даны два уравнения

Обозначим множество корней уравнения (1) через M, а множество корней уравнения (2) через N. Если (то есть, если всякий ко­рень уравнения (1) является корнем уравнения (2)), то уравнение (2) называют следствием уравнения (1). Например, уравнение является следствием уравнения 2х—6= 0. В самом деле, корнем уравнения 2х — 6=0 является х=3, а при этом значении многочлен обращается в нуль.

Если множества М и N корней уравнений (1) и (2) совпадают, то эти уравнения называются равносильными. Иными словами, уравнения

равносильны, если всякий корень уравнения (2) является корнем уравнения (3) и, обратно, всякий корень уравнения (3) является корнем уравнения (2).

В частности, уравнения равносильны, если множества М и N — пусты, то есть если каждое из уравнений не имеет решений.

Если уравнения (2) и (3) равносильны, то каждое из них явля­ется следствием другого.

Следует отметить, что понятие равносильности уравнений существенно зависит от того, какие значения корней считаются до­пустимыми. Рассмотрим, например, уравнения:

Корнями первого уравнения является число х=3, а второго — числа Так как эти множества различны, то уравнения (4) и (5) не являются равносильными. Но если рассматривать лишь рациональные значения корней уравнения, то уравнения (4) и (5) оказываются равносильными — ибо они имеют по единственному рациональному корню х = 3. Как правило, мы будем в дальнейшем рассматривать равносильность относительно множества всех действительных чисел. Иными словами, уравнения будут считаться равносильными, если они имеют одни и те же действительные корни.

Совокупности уравнений

Пусть задано несколько уравнений

и требуется найти все значения х, которые удовлетворяют хотя бы одному из этих уравнений. Тогда говорят, что задана совокупность уравнений, а такие значения х называют решениями или корнями этой совокупности. Следует различать совокупность уравнений и систему уравнений — для системы уравнений требуется искать значения неизвестных, которые удовлетворяют всем урав­нениям, а для совокупности — хотя бы одному из уравнений.

Чтобы отличать совокупность уравнений от системы уравнений, мы будем обозначать совокупность квадратными скобками, а систему — фигурными скобками.

имеет одно решение , а совокупность тех же уравнений

имеет три решения

Обозначим множество решений уравнения через а мно­жество решений совокупности уравнений (1) через N. Тогда Например, множество решений совокупности

состоит из чисел 2, 3 (решений уравнения 1, —1 (решений уравнения ) и —7 (решения уравнения Число х=3 является решением, хотя при этом значении не определена функция

Две совокупности уравнений

называются равносильными, если они имеют одно и то же множество корней.

Например, совокупности уравнений

равносильны — их корнями являются числа 2, —2 и —3.

Преобразования уравнений

При решении уравнений мы переходим от одного уравнения к другому, пока не придем к уравне­нию вида х = а или совокупности уравнений такого вида. Возьмем, например, уравнение

Прибавляя к обеим частям этого уравнения (—Зх+3) и приводя подобные члены, получаем уравнение

А теперь умножим обе части уравнения (2) на и получим, что

В процессе решения этого уравнения мы прибавляли к обеим частям уравнения некоторое алгебраическое выражение (а именно, —Зх+3), умножали обе части уравнения на одно и то же число (а именно, на). Кроме того, мы выполняли тождественные преоб­разования. Заметим, что уравнения (1), (2) и (3) имели одно и толь­ко одно решение х = 2. Таким образом, все проведенные преобра­зования приводили к уравнениям, равносильным первоначальному уравнению (1), имевшим с ним одно и то же решение.

Однако не всегда одинаковые преобразования обеих частей уравнения приводят к уравнению, равносильному первоначальному. Рассмотрим уравнение:

Его решением является х = 3. Если же мы умножим обе части уравнения на х — 2, то получим уравнение:

Это уравнение, кроме решения х=3, имеет еще решение х= 2— оно имеет лишний корень по сравнению с (4).

С другой стороны, если мы возьмем уравнение (5), имеющее решения х=2, х=3, и «сократим» его на х — 2 (то есть разделим обе части уравнения на х — 2), то получим уравнение 2х+1= =х+4 с единственным решением х=3. Значит, здесь мы в про­цессе решения потеряли корень х=2.

Не является «безобидным» и прибавление к обеим частям уравнения одного и того же алгебраического выражения. Например, уравнение

имеет решение х =2. Но если прибавить к обеим частям этого уравнения выражение , то получим уравнение

для которого х =2 не является решением — обе части этого уравнения не имеют смысла при х=2. Таким образом, произошла по­теря решения.

Эти примеры наглядно показывают, что при преобразовании уравнений необходима осторожносгь — неправильно преобразуя уравнение, мы можем как приобрести лишние решения, так и поте­рять решения данного уравнения. При этом надо иметь в виду, что приобретение лишних решений не столь опасно, как потеря сущест­вующих. Ведь после того, как уравнение решено, можно подставить все найденные решения в заданное уравнение и отобрать те из реше­ний, которые ему удовлетворяют. А потерянные решения восстано­вить уже нельзя.

Из изложенного видно, что, прежде чем решать конкретные ви­ды уравнений, надо познакомиться с общей теорией уравнений, выяснить, какие преобразования приводят к равносильным уравне­ниям, какие дают посторонние решения, а при каких решения мо­гут быть потеряны. Только после этого мы сможем решать урав­нения «с открытыми глазами».

Теоремы о равносильности уравнений

Сформулируем сна­чала условия, при которых одно уравнение является следствием другого уравнения. Потом из этих условий будут получены условия равносильности уравнений.

Теорема:

Если к обеим частям уравнения

прибавить функцию имеющую смысл при всех допустимых значениях неизвестного х, то получится новое уравнение

являющееся следствием данного.

Доказательство:

В самом деле, пусть а—корень уравнения (1). Тогда f(а)=F(а). Но является некоторым числом, так как по условию функция определена для всех допустимых значений х и, в частности, при х=а. Прибавим к обеим частям числового равенства f(a)=F(а) число . Получим равенство

которое показывает, что число а является корнем уравнения (2). Таким обра­зом, всякий корень уравнения (1) является корнем уравнения (2), то есть уравнение (2) является следствием уравнения (1).

Условие, что функция определена при всех допустимых значениях х, существенно. Если не определено при х=а, где а — решение уравния (1), то уравнение (2) не является следствием уравнения (1) и уравнения (1) и (2) неравносильны: х = а является решением для (1), но не является ре­шением для уравнения (2). Примером могут служить уравнения (6) и (7) из п. 5.

Прибавление к обеим частям уравнения одного и того же выражения не может привести к приобретению посторонних корней, если это прибавление не сопровождается приведением подобных членов или иными преобразованиями, меняющими область определения уравнения (например, сокращением дробей). Рассмотрим, например, уравнение

Если прибавить к обеим частям — и привести подобные члены, то получим уравнение Зх +1= 9 — х, имеющее решение х = 2. Это решение не принадлежит области определения исходного уравнения и потому не удовлетворяет ему.

Перейдем к вопросу об умножении обеих частей уравнения на одно и то же выражение.

Теорема:

Если обе части уравнения

умножить на функцию , имеющую смысл при всех допустимых значениях х, то получится новое уравнение

являющееся следствием уравнения (3).

Доказательство.

Пусть а — корень уравнения (3). Тогда справедливо равенство f(а)=F(а). Умножим обе части этого равенства на число . Мы получим числовое равенство Оно показывает, что а является корнем и уравнения (4). Таким образом, всякий корень уравнения (3) является корнем уравнения (4), то есть (4) — следст­вие (3).

Из доказанных теорем следует, например, что уравнение

является следствием уравнения

Действительно, уравнение (5) получается из уравнения (6) прибавлением к обеим частям функции Зх+2 и умножением полученного уравнения на х + 2.

Многочлены определены при всех значениях х. Поэтому прибавление к обеим частям уравнения многочлена, равно как и умножение обеих частей

уравнения на многочлен, приводит к уравнению, являющемуся следствием исходного.

Оговорка о том, что должно иметь смысл при всех допустимых зна­чениях х, существенна для справедливости теоремы 2. Рассмотрим, напри­мер, уравнение

и умножим обе части этого уравнения на Мы получим уравнение Оно уже не является следствием исходного: уравнение (7) имеет корни 2 и 3, а уравнение — лишь корень 3. При­чиной потери корня явилось то, что функция не определена при х = 2, а это значение как раз является корнем заданного уравнения.

Докажем теперь теоремы о равносильности уравнений. Чтобы доказать равносильность двух уравнений, надо показать, что пер­ вое из них является следствием второго, а второе — следствием первого.

Теорема:

Если функция определена при всех допустимых значениях неизвестного х, то уравнения

Доказательство:

Мы уже видели, что при условии теоремы уравнение (9) является следствием уравнения (8). Но уравнение (8) в свою очередь получается из уравнения (9) прибавлением к обеим частям функции — и приведением подобных членов.

Так как функция определена при всех допустимых значениях х, то уравнение (8) является следствием уравнения (9). Тем самым доказано, что уравнения (8) и (9) равносильны.

Из доказанной теоремы вытекает правило перенесения слагае­мых из одной части уравнения в другую: если некоторое слагаемое данного уравнения перенести из одной части в другую, изменив знак этого слагаемого на противоположный, то получится уравнение, равносильное данному.

В самом деле, в силу теоремы 3 уравнения

равносильны: уравнение (11) получается путем прибавления функции — к обеим частям уравнения (10) и приведения подобных членов.

Кратко правило перенесения слагаемых формулируют так: всякое слагаемое можно перенести из одной части уравнения в другую, изменив при этом его знак на противоположный.

Из доказанной теоремы вытекает, что всякое уравнение f(х) =F(х) можно заменить равносильным ему уравнением вида Ф(х) = 0. Для этого достаточно перенести F(х) в левую часть уравнения, заменив знак на противоположный, и положить f(х)— F(х) =Ф (х).

Теорема:

Если функция определена для всех допустимых значений х и ни при одном допустимом значении х не обращается в нуль, то уравнения

Доказательство:

Мы уже видели (теорема 2), что уравнение (13) является следствием уравнения (12). Докажем, что уравнение (12) в свою очередь является следствием уравнения (13). Уравнение (12) получается из уравнения (13) умножением обеих частей на функцию Так как по условию функция определена для всех допустимых значений х и не обращается при этих значениях в нуль, то функция также опре­делена при всех допустимых значениях х. Поэтому уравнение (12) является следствием уравнения (13), а значит, эти уравнения равносильны.

Из доказанной теоремы вытекает, например, что уравнения

равносильны в области действительных чисел. В самом деле, урав­нение (15) получается из уравнения (14) умножением на функцию , а эта функция всюду определена и не обращается в нуль при действительных значениях х.

не являются равносильными — второе получается из первого умножением на функцию , а эта функция обращается в нуль при х = ± 1. Поэтому второе уравнение, кроме корня удовлетворяющего и первому уравнению, имеет еще и корни

Уравнения (12) и (13) могут быть неравносильными и в том случае, когда множитель теряет смысл при некоторых допустимых значениях неизвестного. Например, уравнения

неравносильны: множитель теряет смысл при х = 2, а x = 2 как раз является корнем уравнения

Если в ходе решения уравнения приходилось умножать обе части этого уравнения на выражение , содержащее неизвестное, то надо проверить две вещи: а) Не обращается ли в нуль при допустимых значениях не­ известного? б) Не теряет ли смысл при некоторых допустимых значениях неизвестного?

В первом случае среди найденных корней могут оказаться посторонние корни, и надо проверить все найденные корни, удов­летворяют ли они первоначально заданному уравнению. Во вто­ром же случае возможна потеря корней, и мы должны подставить в заданное уравнение значения неизвестного, при которых теряет смысл — среди этих значений могут оказаться потерянные в ходе решения корни уравнения.

Из теоремы 4 непосредственно вытекает справедливость утверждения: если обе части уравнения умножить на произвольное отлич­ное от нуля число, то получим уравнение, равносильное данному.

Это утверждение кратко формулируют так: обе части уравнения можно умножать на произвольное отличное от нуля число.

Уравнения с одним неизвестным

Алгебраические уравнения с одним неизвестным:

Рациональным алгебраическим уравнением с одним неизвестным называют уравнение вида

где R(х) — алгебраическая дробь относительно х. К такому виду можно в силу теорем 3 и 5, привести любое уравнение — алгебраические дроби. Например, уравнение

является рациональным алгебраическим. В дальнейшем мы будем называть такие уравнения просто алгебраическими.

Применяя теоремы о равносильности уравнений, можно заменить каждое уравнение вида (1) равносильным ему уравнением вида:

где f(x)— многочлен от х. Для этого надо записать дробь R(x) в ви­де отношения двух многочленов. Мы получим уравнение:

где f(х) и — многочлены от х. Но дробь может равняться нулю лишь в случае, когда равен нулю ее числитель. Поэтому решение уравнения (1) сводится к решению уравнения f(x)=0, где f(х) — многочлен от х. При этом нужно иметь в виду, что решениями уравнения (1) являются лишь те корни уравнения (2), при которых дробь R(x) имеет смысл (то есть отлично от нуля).

Пример:

Перенесем в левую часть уравнения и приведем получившуюся сумму к общему знаменателю. Получим уравнение:

Приравнивая нулю числитель этой дроби, получаем уравнение х—2=0, корнем которого является число х=2. Однако при x=2 дробь не определена. Поэтому заданное уравне­ние корней не имеет.

Метод разложения на множители

Рассмотрим некоторые методы решения алгебраических уравнений, а также отдельные виды таких уравнений.

Выше было сказано, что при решении уравнения его заменяют другими уравнениями или совокупностями уравнений, равносильными заданному, но более простыми

Рассмотрим следующий пример. Пусть надо решить уравнение:

Мы знаем, что произведение может равняться нулю тогда и только тогда, когда хоть один из его сомножителей равен нулю. Поэтому, чтобы решить уравнение (1), надо найти все значения, при кототых хоть один из сомножителей равен нулю. А это все равно, что решить совокупность уравнений

Решая ее, находим для х значения и 6. Они и дают корни уравнения (1).

Метод, примененный для решения уравнения (1), в общем виде формулируется так.

Теорема:

Если функции определены на некотором множестве М, то на этом множестве уравнение

равносильно совокупности уравнений

Доказательство:

Пусть а — одно из решений совокупности (3). Это означает, что а является корнем одного из уравнений этой совокуп­ности, например, уравнения а все остальные функции опреде­лены при х = а. Но тогда

так как один из сомножителей равен нулю. Следовательно, любое решение совокупности (3) является корнем уравнения (2).

Наоборот, пусть а — корень уравнения (2). Тогда f (а)=0, то есть Но произведение равно нулю лишь в случае, когда хоть один из сомножителей равен нулю. Поэтому хотя бы одно из чисел равно нулю. Это означает, что а является корнем хотя бы одного из уравнений то есть одним из решений совокупно­сти уравнений (3).

Пример:

Левая часть этого уравнения разлагается на множители следующим образом:

Отсюда следует, что уравнение (4) равносильно совокупности уравнений:

Решая уравнения этой совокупности, получаем корни урав­нения (4):

не равносильны, так как при х = 0 функция не определена. На множестве же они равносильны.

В некоторых случаях разложение на множители связано с искусственными преобразованиями. Рассмотрим, например, уравне­ние:

Нетрудно заметить, что

Поэтому уравнение (б) можно записать в виде:

Таким образом, все свелось к решению совокупности двух квадратных уравнений:

Решая их, находим корни уравнения (6):

Метод введения нового неизвестного

Наряду с методом разложения на множители часто применяется другой метод — введе­ние нового неизвестного.

Рассмотрим следующий пример:

Если раскрыть скобки, то получится уравнение четвертой степени, решить которое довольно сложно. Мы поступим иначе. Обозначим через r. Тогда

Поэтому уравнение (1) после введения нового неизвестного z принимает вид

Решая это квадратное уравнение, получаем, что его корни равны:

Но Поэтому х удовлетворяет или уравнению или уравнению то есть совокупности уравнений:

Решая ее, получаем:

Метод, примененный для решения уравнения (1), в общем виде заключается в следующем.

Пусть дано уравнение F(х)=0 и пусть функцию F(х) можно представить в виде так что уравнение F (х)=0 записывается в виде

Введем новое неизвестное z, положив Тогда вместо уравнения (1) получаем уравнение относительно Дока­жем следующую теорему.

Теорема:

Если а — один из корней уравнения f(z) = 0, а b — один из корней уравнения то b является одним из корней уравнения F(х)=0, где . Обратно, если b — корень уравнения F(х)=0, то — один из корней уравнения f(z)= 0 .

Доказательство. Пусть b — корень уравнения где а — корень уравнения f (z)=0; f(а) =0. Тогда и потому

Таким образом, b удовлетворяет уравнению F (х) = 0.

Обратно, пусть b — корень уравнения F(х)=0 и Тогда

Следовательно, а — корень уравнения f(z)=0. Теорема доказана.

Из доказанной теоремы следует, что решение уравнения вида сводится к следующему: сначала находят корни уравнения f(z) =0; после этого надо решить все уравнения Совокупность корней этих уравнений и дает решение уравнения (2).

Биквадратные уравнения

Метод замены неизвестного при­ меняется для решения уравнений вида

Такие уравнения называют биквадратными. Чтобы решить уравнение (1), положим Тогда получим квадратное уравнение:

Его корнями являются числа:

Поэтому корни уравнения (1) получаются путем решения уравнений Значит, мы получаем четыре корня для уравнения (1)

Четыре корня возникают при различных комбинациях знаков:

При решении биквадратных уравнений (как и при решении квадратных уравнений) иногда приходится извлекать квадратные корни из отрицательных чисел. Это приводит к так называемым комплексным числам, которые будут изучены в главе V.

Пример. Решить уравнение

Полагая получаем квадратное уравнение:

Его корнями являются числа Значит, корни урав­нения (8) имеют вид:

Возвратные уравнения 3-й и 4-й степеней

Многочлен n-й степени

называется возвратным, если его коэффициенты, одинаково уда­ ленные от начала и от конца, равны между собой. Иными словами, коэффициенты возвратного многочлена n-й степени удовлетворяют условию

Алгебраическое уравнение вида f(х)=0, где f(х) — возврат­ный многочлен, называют возвратным уравнением. Примерами та­ких уравнений являются:

Рассмотрим решение возвратных уравнений третьей и четвер­той степеней. Возвратное уравнение третьей степени имеет вид:

Группируя члены, разложим выражение в левой части уравнения на множители:

Отсюда видно, что одним из корней уравнения (1) является х=—1 . Два других корня получаются путем решения квадратного уравнения

Пример:

Разлагая левую часть уравнения на множители, получаем:

Корни квадратного уравнения равны Поэтому корнями заданного уравнения являются числа

Приведем пример задачи, сводящейся к разобранному типу уравнений.

Задача:

Из квадратного листа жести со стороной а см вы­резают по углам четыре квадратика со стороной х см и делают из получившейся фигуры коробку. При каком значении х объем коробки равен ?

Решение:

Основанием коробки является квадрат со сторо­ной а-2x, а ее высота равна х. Значит, объем коробки равен По условию имеем уравнение:

Положим . Мы получим для z уравнение

Разлагая на множители, получаем

Поэтому корни нашего уравнения равны

Из условия задачи следует, что Поэтому не удовлетворяет условию. Итак, либо , либо

Теперь рассмотрим возвратное уравнение 4-й степени:

Так как то х=0 не является корнем этого уравнения. Поэтому если разделить обе части уравнения (2) на то получим равносильное уравнение:

Введем новое неизвестное z, положив . Так как

Следовательно, уравнение (3) превращается в квадратное уравнение отно­сительно z

Решив это уравнение, найдем его корни Чтобы найти х, остается решить совокупность уравнений:

Она сводится к совокупности квадратных уравнений:

Пример. Решить уравнение

Перепишем это уравнение в виде

и введем новое неизвестное . Получим уравнение:

Решая его, находим: . Чтобы найти корни уравнения (4), надо решить уравнения:

Из них получаем:

Наряду с уравнениями вида (1) и (2) рассматривают так называемые кососимметричные уравнения, или, иначе, возвратные уравнения второго рода. При n=4 они имеют вид:

Это уравнение сводится к

После этого вводят новое неизвестное по формуле . Так как то уравнение (6) сводится к квадратному уравнению Дальнейшее решение ведется так же, как и для обычных возвратных уравнений.

Решение заданий и задач по предметам:

Дополнительные лекции по высшей математике:

Образовательный сайт для студентов и школьников

Копирование материалов сайта возможно только с указанием активной ссылки «www.lfirmal.com» в качестве источника.

© Фирмаль Людмила Анатольевна — официальный сайт преподавателя математического факультета Дальневосточного государственного физико-технического института

[spoiler title=”источники:”]

http://abakbot.ru/online-16/274-limit-root-polynom

http://lfirmal.com/ponyatie-algebraicheskogo-i-transtsendentnogo-uravneniya-i-metodov-ih-priblizhennogo-resheniya/

[/spoiler]

Если

верхняя граница положительных корней
функции,
верхняя граница положительных коней,-верхняя
граница положительных корней,-верхняя
граница положительных корней,
то все отличные от нуля действительные
корни уравнения(если они существуют) лежат внутри
интервалов.

При
этом: если коэффициенты полинома
удовлетворяют условию,
то верхняя граница положительных корней
уравнениянаходится по формуле:,
гдеm-
номер первого отрицательного коэффициента
;B-
наибольший по модулю отрицательный
коэффициент уравнения
.

Пример:
Методом Лагранжа определить границы
корней уравнения:

Решение:
Здесь

Следовательно,

Для
полинома:

и
поэтому:

Для
многочлена:
имеем

и
значит

Наконец,
для полинома

Имеем:

Поэтому,

Итак, корни исходного
уравнения лежат в интервалах (-2;-1/3.828) и
(1/33;3)

3.Метод Ньютона.

Если
при х = с полином
и все его производные принимают
положительные значения, то «с» является
верхней границей положительных корней
уравнения=0.

Пример:
Определить
верхнюю границу положительных корней
уравнения
методом Ньютона.

Решение:
Проверке подлежат только c=x>0.

Пусть
с=1, тогда

Дальнейшая проверка
для с=1 не нужна.

Пусть
с=2, тогда
.
Таким образом верхней границей
положительных корней является число
2, то естьR=2.

Пример:
Определить
верхнюю границу положительных корней
уравнения
методом Ньютона.

Решение:
Проверке
подлежат только с=х>0.
Пусть с=1,
тогда

Дальнейшая
проверка для с=1 не нужна.

Пусть
с=2, тогда
,
.

Таким
образом, верхней границей положительных
корней является число 2, то есть R=2.

Графические
методы решения уравнений и систем

Графический
метод решения конечных уравнений с
одной переменной – один из приближенных
методов, позволяющий выбрать первое
приближение, с которого начинается
уточнение решения уравнения.

Выделяют
два способа графического решения
уравнения:

В
первом способе все члены уравнения
переносят в левую часть, то есть
представляют его в виде.
После этого строят график функции,
где
левая часть уравнения. Абсциссы точек
пересечения графика функциис
осью Ох и являются корнями уравнения,
так как в этих точках у=0:

y

x

Во
втором способе все члены уравнения
разбивают на две группы: одну из них
записывают в левой части уравнения, а
другую – в правой, то есть представляют
его в виде
.
После этого строят графики двух функцийи.
Абсциссы точек пересечения графиков
этих двух функций и служат корнями
данного уравнения.

Так

y

x

Из
равенства
следует, что
корень уравнения.

Пример:
Решить графически уравнение:

Решение:
Согласно первому способу решения
уравнения строим график функции

y

1
x

-1

Абсцисса
точек пересечения этого графика с осью
Ох равна 1. Это означает, что заданное
алгебраическое уравнение имеет один
действительный корень х=1 (два других
корня – комплексные)

Согласно
второму способу заданное уравнение
можно переписать в виде:
и построить графики функцийи.
Абсцисса точек пересечения этих графиков
х=1

y

1
x

Пример:
Найти графическим способом корни
трансцендентного уравнения:

Решение:
Перепишем это уравнение в виде
.
Так как функция левой и правой частей
уравнения имеют общую область определения
(интервал 0<x<+∞),
то будем искать корни в интервале ]0,+
∞[.

Построив
графики функций
и

y

1

x

Находим
корни уравнения: прямая пересекает в
двух точках с абсциссами
0,00001
и1,75.

Пример:
Найти графически корни трансцендентного
уравнения

Решение:
Строим
функции
и

y

1
2

Корнями
уравнения являются абсциссы точек
пересечения графиков, то есть
=1,=2

Графические
методы решения систем уравнений

Рассмотрим
на примере системы двух нелинейных
уравнений с двумя переменными. При этом
если в заданной системе:

Оба
уравнения можно разрешить относительно
одной из двух переменных, то система
может принять вид:

то
есть получаем уравнение:
.

В
общем же случае строят кривые
и,
и находят их точки пересечения.

Пример:
Считая x>0
, найти графически решения системы
уравнений:

Решение:
Разрешив
заданные уравнения относительно y,
то есть

,
,

получим
уравнение
.

Строим
графикии:

Y

-0.28
1 x

Абсцисса
и ордината точек пересечения графиков
этих функций есть решение заданной
системы, то есть х=1,22; у=-0,28

Пример:Найти
графически решения системы уравнений:

Решение:
Перепишем заданную систему в виде:

Здесь
первое уравнение задает эллипс, а
второе-гиперболу:

y

x

Эти
кривые второго порядка пересекаются в
двух точках
=0,55
;=-0,46;=1,7;=1,6.

Отделение
корней конечных уравнений.

Отделить
корни уравнения – это значит разбить
всю его область допустимых значений на
отрезки, в каждом из которых содержится
один корень. Итак, корень
уравненияне имеет других корней.

Отделение
корней является первым шагом в нахождении
приближенных значений корней уравнения
с заданной степенью точности. Этот шаг
может проводиться как графически, так
и аналитически.

Аналитические
методы отделения корней уравнения
строятся на базе математического анализа
функций.

Примечание:

1.
Если кривая к-раз
пересекает ось абсцисс, то функция
имеетк
простых корня. Так если график функции
имеет вид

y

Соседние файлы в папке Лекции Маркина

  • #
  • #
  • #
  • #
  • #
  • #
  • #

Верхняя и нижняя граница корней полинома

Коэффициенты многочлена разделенные пробелами
Заданный многочлен имеет вид
Нижняя граница действительных корней многочлена
Верхняя граница действительных корней многочлена

Рассмотрим еще одну задачу связаннуюс  полиномами. Когда мы пытаемся решить такое уравнение численно, то нам необходимо знать, в каких пределах могут находится действительные корни этого полинома.

Эти знания позволят нам быстрее  обеспечить сходимость при компьютерных вычислениях. Это позволит при прорисовке полинома в виде графика, выбрать такой масштаб, что бы мы увидели все пересечения функции с осью абсцисс. 

Итак, как же формулы мы будем использовать для решения задачи?

Если нам известен полином вида

(x)=a_0x^{n}+a_1x^{n-1}+a_2x^{n-2}+.....+a_{n-1}x+a_n

То разделив его на a0   мы получаем 

f(x)=x^{n}+b_1x^{n-1}+b_2x^{n-2}+.....+b_{n-1}x+b_n

Правило утверждает, что если среди  коэффицентов b_1 b_2.....b_{n-1} b_n есть  отрицательные числа и b_k -первое  из них, и также есть отрицательный коэффицент A который является самым большим (в абсолютном значении), то  действительные корни этого полинома не превышают число

max=1+sqrt[k]{A}

Нижнюю границу можно определить  по аналогичной формуле, вычислив значения функции коэффицентов при -x

Давайте рассмотрим пример

f(x)=3x^{5}+7x^{4}-3x^{3}+x^{2}+5x-27

Разделим  на 3 , что бы первый член полинома был равен единице.

f(x)=x^{5}+frac{7}{3}x^{4}-x^{3}+frac{1}{3}x^{2}+frac{5}{3}x-9

Первый отрицательный коэффициент который мы встречаем это -x^3    он стоит на второй позиции (b_2=-1)

Значение А=9, так как 9 явлется максимальном в абсолютном выражении числом из всех отрицательных  коэффициентов полинома.

Таким образом  верхняя граница действительных корней  max=1+sqrt[2]{9}=4

Теперь определяем нижнюю границу

f(-x)=-3x^{5}+7x^{4}+3x^{3}+x^{2}-5x-27

Разделим полином на -3, что бы первый член полинома был равен единице.

f(x)=x^{5}-frac{7}{3}x^{4}-x^{3}-frac{1}{3}x^{2}+frac{5}{3}x+9

Первый отрицательный коэффициент который мы встречаем это -frac{7}{3}    он стоит на первой позиции (b_1=-frac{7}{3})

Значение A=-frac{7}{3}

Таким образом  нижняя граница действительных корней  -min=1+sqrt{frac{7}{3}}

 min=-frac{10}{3}

Следовательно, все действительные корни заданного  многочлена находятся  в пределах [-frac{10}{3};4]

Бот позволяет выполнять эти вычисления автоматически и при заданных действительных коэффициентах давать правильные результаты.

Единственное замечание, не стоит вводить в качестве коэффициентов комплексные числа. Результат будет непредсказуем.

Удачных расчетов!

Численные методы решения нелинейных уравнений

Корни нелинейных уравнений

Пусть дано нелинейное уравнение

f(x)=0,qquad mathsf{(3.1)}

где f(x) — функция, определенная и непрерывная на некотором промежутке. В некоторых случаях на функцию f(x) могут быть наложены дополнительные ограничения, например, непрерывность первой и второй производных, что специально оговаривается. Функция f(x) может быть задана в виде алгебраического многочлена или трансцендентной функции (тогда ей соответствует алгебраическое или трансцендентное уравнение).

Требуется найти корни нелинейного уравнения (3.1), т.е. числа x_{ast1},x_{ast2},ldots которые путем подстановки их в (3.1) превращают уравнение в верное числовое равенство. Числа x_{ast1},x_{ast2},ldots называются также нулями функции f(x).

На практике часто бывает выгодно уравнение (3.1) заменить равносильным ему уравнением (уравнения равносильны, если имеют одинаковые корни):

f_1(x)-f_2(x)=0,

(3.2)

где функции f_1(x),,f_2(x) — более простые, чем функция f(x). Тогда при задании уравнения в виде (3.1) нулями функции f(x) являются точки пересечения f(x) с осью Ox (рис. 3.1,д), а при задании в виде (3.2) — абсциссы точек пересечения функций f_1(x) и f_2(x) (рис. 3.1,б).

Точки пересечения функции с осью абсцисс

Замечания

1. Если f(x)=a_nx^n+a_{n-1}x^{n-1}+ldots+a_0=P_n(x) — алгебраический многочлен, то уравнение (3.1) называется также алгебраическим n-й степени:

P_n(x)equiv a_nx^n+a_{n-1}x^{n-1}+ldots+a_0=0,

(3.3)

где a_n,ldots,a_0 — действительные числа, коэффициенты уравнения.

График сеточной функции

2. На практике встречаются задачи нахождения корней уравнения f(x_i)=0, левая часть которого задана сеточной функцией y_i=f(x_i),~i=1,2,ldots,N (рис. 3.2).

Число x_{ast} есть корень уравнения (3.1) кратности k, если при x=x_{ast} вместе с функцией f(x) обращаются в нуль ее производные до (k-1)-го порядка включительно, т.е. f(x_{ast})= f'(x_{ast})= ldots= f^{(k-1)}(x_{ast})=0, а f^{(k)}(x_{ast})ne0. Корень кратности к = 1 называется простым. На рис 3.1,с простыми корнями являются x_{ast1},x_{ast2},x_{ast3}, a корни x_{ast4},x_{ast5} — кратные.

В соответствии с классическим результатом Галуа алгебраическое уравнение (3.1) при ngeqslant5 не имеет решения в замкнутом (формульном) виде. Сеточные уравнения вообще не имеют формульных решений. Поэтому корни алгебраических (n&gt;2), трансцендентных и сеточных уравнений, как правило, определяются приближенно с заданной точностью.

Решение осуществляется в два этапа:

Первый этап. Находятся отрезки [a_i,b_i], внутри каждого из которых содержится один простой или кратный корень (x_{ast i}in[a_i,b_i]) (см. рис. 3.1). Этот этап называется процедурой отделения корней. По сути на нем осуществляется грубое нахождение корней x_{ast i}.

Второй этап. Грубое значение каждого корня x_{ast i} уточняется до заданной точности одним из численных методов, в которых реализуются последовательные приближения. Порядок (скорость) сходимости метода определяется так же, как в методе простых итераций.


Отделение корней уравнения

Для отделения действительных корней полезно определять заранее число корней, а также верхнюю и нижнюю границы их расположения. Для этого используется ряд теорем.

Теорема 3.1 (о числе корней алгебраического уравнения (3.3)). Алгебраическое уравнение (3.3) n-й степени имеет ровно n корней, действительных или комплексных, при условии, что каждый корень считается столько раз, какова его кратность.

Теорема 3.2 (о свойстве парной сопряженности комплексных корней уравнения (3.3)). Если x_{ast i}=alpha+beta i — корень алгебраического уравнения (3.3) кратности k, то число overline{x_{ast i}}=alpha-beta i также является корнем той же кратности.

Следствие. Алгебраическое уравнение нечетной степени имеет по крайней мере один действительный корень.

Теорема 3.3 (об оценке модулей корней уравнения (3.3)). Пусть

A=max bigl{|a_{n-1}|,ldots,|a_0|bigr},qquad B=max bigl{|a_n|,|a_{n-1}|,ldots, |a_1|bigr},

где a_k,~k=overline{0,n} — коэффициенты уравнения a_nx^n+a_{n-1}x^{n-1}+ ldots+ a_{1}x+a_0=0. Тогда модули всех корней x_{ast i}~(i=1,2,ldots,n) уравнения удовлетворяют неравенству

frac{1}{1+dfrac{B}{|a_0|}}&lt;|x_{ast i}| leqslant 1+frac{A}{|a_n|},quad i=1,2,ldots,n,

(3.4)

т.е. корни уравнения расположены в кольце.

Следствие. Числа r=frac{1}{1+dfrac{B}{|a_0|}} и R=1+ frac{A}{|a_n|} являются соответственно нижней и верхней границами положительных корней алгебраического уравнения: r&lt;x_{ast i}^{+}&lt;R. Аналогично числа -R и -r служат нижней и верхней границами отрицательных корней уравнения: -R&lt;x_{ast i}^{-}&lt;-r.

Приведем полезные теоремы, используемые для более точного установления границ действительных корней алгебраических уравнений.

Теорема 3.4 (теорема Лагранжа о верхней границе положительных корней уравнения (3.3)). Пусть a_n&gt;0 и a_i — первый отрицательный коэффициент в последовательности a_n,a_{n-1},a_{n-2},ldots,a_1,a_0;~C — наибольшая из абсолютных величин отрицательных коэффициентов. Тогда за верхнюю границу положительных корней уравнения (3.3) может быть принято число

R=1+sqrt[LARGE{n-i}]{frac{C}{a_n}},.

(3.5)

Теорема 3.5 (о нижних и верхних границах положительных и отрицательных корней алгебраического уравнения). Пусть R — верхняя граница положительных корней уравнения P_n(x)=0,

R_1 — верхняя граница положительных корней уравнения P^1(x)= x^nP_n! left(frac{1}{x}right)=0,
R_2 — верхняя граница положительных корней уравнения P^2(x)= P_n(-x)=0,
R_3 — верхняя граница положительных корней уравнения P^3(x)= x^nP_n! left(-frac{1}{x}right)=0.

Тогда положительные корни x_{ast i}^{+} и отрицательные корни x_{ast i}^{-} уравнения (3.3) удовлетворяют неравенствам

frac{1}{R_1}leqslant x_{ast i}^{+}leqslant R,qquad-R_2 leqslant x_{ast i}^{-}leqslant-frac{1}{R_3},.

(3.6)

Теорема 3.6 (теорема Декарта о количестве действительных корней алгебраических уравнений). Число S_1 положительных корней (с учетом их кратностей) алгебраического уравнения P_n(x)=0 равно числу перемен знаков в последовательности коэффициентов a_n,a_{n-1},ldots,a_0 (коэффициенты, равные нулю, не учитываются) многочлена P_n(x) или меньше этого числа на четное число. Число S_2 отрицательных корней (с учетом их кратностей) алгебраического уравнения P_n(x)=0 равно числу перемен знаков в последовательности a_n,a_{n-1},ldots,a_0 многочлена P_n(-x) или меньше этого числа на четное число.

Теорема 3.7 (теорема Гюа о необходимом условии действительности всех корней алгебраического уравнения). Если алгебраическое уравнение (3.3) имеет все действительные корни, то квадрат каждого некрайнего коэффициента больше произведения двух его соседних коэффициентов.

Следствие. Если при каком-нибудь k выполнено неравенство a_k^2 leqslant a_{k-1}a_{k+1}, то уравнение (3.3) имеет по крайней мере одну пару комплексных корней.

Для отделения корней применяется следующая теорема.

Теорема 3.8. Если функция f(x), определяющая уравнение f(x)=0, на концах отрезка [a_i,b_i] принимает значения разных знаков, т.е. f(a_i)cdot f(b_i)&lt;0, то на этом отрезке содержится по крайней мере один корень уравнения. Если же f(x) непрерывна и дифференцируема и ее первая производная сохраняет знак внутри отрезка [a_i,b_i] Bigl(mathop{operatorname{sign}}limits_{xin[a_i,b_i]} f'(x)=text{const}Bigr), то на [a_i,b_i] находится только один корень уравнения.


Способы отделения корней

В вычислительной практике обычно используются следующие способы отделения корней:

1) средствами машинной графики: функция f(x) представляется на дисплее и приближенно определяются отрезки, которым принадлежат точки x_{ast i};

2) средствами математического анализа с помощью исследования функций и построения графиков (см. рис. 3.1,д);

3) формированием простых функций f_1(x) и f_2(x) таких, что получается равносильное уравнение в виде (3.2), и дальнейшим построением графиков этих функций (см. рис. 3.1,б).

▼ Примеры 3.1-3.3

Пример 3.1. Определить число положительных и отрицательных корней, а также их границы для уравнения

P_5(x)= x^5+2x^4-5x^3+8x^2-7x-3=0.

Решение

В данной задаче n=5,~ a_5=1,~ a_4=2,~ a_3=-5,~ a_2=8,~ a_1=-7,~ a_0=-3. Согласно теореме 3.1 уравнение имеет пять корней. Поскольку n=5, то по следствию из теоремы 3.2 уравнение имеет по крайней мере один действительный корень.

Оценим модули корней по теореме 3.3. Так как

A=max bigl{|2|,|-5|,|8|,|-7|,|-3|bigr}=8,qquad B=max bigl{|1|,|2|,|-5|, |8|,|-7|bigr}=8,

то frac{1}{1+frac{8}{|-3|}}&lt;|x_{ast i}|&lt;1+frac{8}{|1|} или frac{3}{11}&lt;|x_{ast i}|&lt;9, т.е. все корни лежат внутри данного кольца. По следствию из теоремы 3.3 это означает, что положительные корни удовлетворяют неравенству frac{3}{11}&lt;x_{ast i}^{+}&lt;9, а отрицательные — неравенству -9&lt;x_{ast i}^{-}&lt;-frac{3}{11}.

Применим теоремы 3.4 и 3.5 для уточнения приведенных результатов. Найдем верхнюю границу положительных корней. Так как a_3=-5 — первый отрицательный коэффициент в последовательности 1,2,-5,8,-7,-3, то i=3, а C=max bigl{|-5|,|-7|,|-3|bigr}=7 — наибольшая из абсолютных величин отрицательных коэффициентов. Следовательно, R=1+sqrt[LARGE{(5-3)}]{frac{7}{1}}= 1+sqrt{7}cong3,!646.

Найдем нижнюю границу положительных корней. Составим уравнение:

begin{aligned}P^{1}(x)&= x^nP_n! left(frac{1}{x}right)= x^5P_5!left(frac{1}{x} right)= x^5! left(frac{1}{x^5}+ frac{2}{x^4}-frac{5}{x^3}+frac{8}{x^2}-frac{7}{x}-3right)=\ &=-3x^5-7x^4+8x^3-5x^2+2x+1=0.end{aligned}

или 3x^5+7x^4-8x^3+5x^2-2x-1=0 (старший коэффициент должен быть положительным). Для этого уравнения i=3,~ C=max bigl{|-8|,|-2|,|-1|bigr}=8, поэтому R_1=1+sqrt[LARGE{(5-3)}]{frac{8}{3}}=1+sqrt{frac{8}{3}}cong2,!632. Отсюда frac{1}{R_1}=0,!38 leqslant x_{ast i}^{+}leqslant R=3,!646.

Уточним границы отрицательных корней. Составим уравнение:

P^2(x)=P_5(-x)= или x^5-2x^4-5x^3-8x^2-7x+3=0.

Для этого уравнения i=4,~ C=maxbigl{|-2|,|-5|,|-8|,|-7|bigr}=8, поэтому R_2=1+ sqrt[LARGE{5-4}]{frac{8}{1}}=9. Составим уравнение

begin{aligned}P^3(x)&= x^nP_n! left(-frac{1}{x}right)= x^5P_5! left(-frac{1}{x}right)= x^5! left(-frac{1}{x^5}+frac{2}{x^4}+frac{5}{x^3}+frac{8}{x^2}+frac{7}{x}-3right)=\ &=-3x^5+7x^4+8x^3+2x-1=0.end{aligned}

или 3x^5-7x^4-8x^3-5x^2-2x+1=0. Для этого уравнения i=4,~ C=max bigl{|-7|,|-8|,|-5|,|-2|bigr}=8, поэтому R_3=1+sqrt[LARGE{5-4}]{frac{8}{3}}=1+ frac{8}{3}cong3,!666. Отсюда находим: -R_2=-9 leqslant x_{ast i}^{-}leqslant-frac{1}{R_3}=-0,!272. Заметим, что данный результат совпадает с полученным ранее.

Исследуем структуру корней уравнения. Так как квадрат каждого некрайнего коэффициента больше произведения двух его соседних коэффициентов, то по теореме 3.7 необходимое условие действительности всех корней уравнения выполняется.

На основе теоремы 3.6 определим число положительных и отрицательных корней. Выписываем коэффициенты многочлена P_n(x)=P_5(x)colon, 1,,2,-5,,8,-7,-3. Так как число перемен знака S_1=3, то число положительных корней равно трем или меньше на четное число, т.е. равно 1. Далее выписываем коэффициенты многочлена P_5(-x)colon, -1,,2,,5,,8,,7,-3. Так как число перемен знаков S_2=2, то число отрицательных корней равно двум или меньше на четное число, т.е. их вообще нет.

Пример 3.2. Отделить корни кубического уравнения x^3-x+1=0.

Решение

Точка пересечения кубической параболы и прямой

Согласно теореме 3.1 уравнение имеет три корня, среди которых по крайней мере один действительный (следствие из теоремы 3.2, поскольку это уравнение нечетной степени).

Оценим модули корней уравнения по теореме 3.3. Так как

A=max bigl{|0|,|-1|,|1|bigr}=1,quad B=max bigl{|1|,|0|,|-1|bigr}=1, то frac{1}{1+dfrac{1}{|1|}}&lt;|x_{ast i}|&lt;1+frac{1}{|1|} или frac{1}{2}&lt;|x_{ast i}|&lt;2.

Отсюда frac{1}{2}&lt;x_{ast i}^{+}&lt;2 и -2&lt;x_{ast i}^{+}&lt;-frac{1}{2}.

Определим число положительных и отрицательных корней. Выписываем коэффициенты многочлена P_3(x)colon, 1,,0,-1,,1. Так как число перемен знака S_1=2 (нулевой коэффициент не учитывается), то число положительных корней равно двум или меньше на четное число, т.е. они отсутствуют. Далее выписываем коэффициенты многочлена P_3(-x)=-x^3+x+1colon, -1,,0,,1,,1. Так как число перемен знака S_2=1 (нулевой коэффициент не учитывается), то число отрицательных корней равно единице.

Отделим корни третьим способом. Для этого преобразуем уравнение к равносильному виду (3.2): x^3=x-1 и найдем точки пересечения фафиков y=x^3 и y=x-1 (рис. 3.3).

Очевидно, корень уравнения x_{ast}in[-2;-1].

Пример 3.3. Отделить корни уравнения третьего порядка x^3-x^2-9x+9=0.

Решение


Процедура уточнения положения корня функции

Метод половинного деления

Пусть дано уравнение f(x)=0 и отделен простой корень x_{ast}, т.е. найден такой отрезок [a_0,b_0], что x_{ast}in[a_0,b_0] и на концах отрезка функция имеет значения, противоположные по знаку (f(a_0)cdot f(b_0)&lt;0). Отрезок [a_0,b_0] называется начальным интервалом неопределенности, потому что известно, что корень ему принадлежит, но его местоположение с требуемой точностью не определено.

Процедура уточнения положения корня заключается в построении последовательности вложенных друг в друга отрезков, каждый из которых содержит корень уравнения. Для этого находится середина текущего интервала неопределенности c_k=frac{a_k+b_k}{2},~ k=0,1,2,ldots, и в качестве следующего интервала неопределенности из двух возможных выбирается тот, на концах которого функция f(x) имеет разные знаки (рис. 3.5).

Процесс завершается, когда длина текущего интервала неопределенности становится меньше заданной величины varepsilon, задающей точность нахождения корня. В качестве приближенного значения корня берется середина последнего интервала неопределенности.


Алгоритм метода половинного деления

1. Найти начальный интервал неопределенности L_0=[a_0,b_0] одним из методов отделения корней, задать малое положительное число varepsilon. Положить k=0.

2. Найти середину текущего интервала неопределенности: c_k=frac{a_k+b_k}{2}.

3. Если f(a_k)cdot f(c_k)&lt;0, то положить a_{k+1}=a_k,~ b_{k+1}= c_k, а если f(c_k)cdot f(b_k)&lt;0, то принять a_{k+1}=c_k,~ b_{k+1}= b_k. В результате находится текущий интервал неопределенности L_{k+1}= [a_{k+1},b_{k+1}].

4. Если b_{k+1}-a_{k+1}leqslant varepsilon, то процесс завершить: x_{ast}in L_{k+1}= [a_{k+1},b_{k+1}]. Приближенное значение корня можно найти по формуле x_{ast}cong frac{a_{k+1}+b_{k+1}}{2}.

Если b_{k+1}-a_{k+1}&gt;varepsilon, положить k=k+1 и перейти к п.2.

Замечания

1. Метод имеет линейную, но безусловную сходимость, и его погрешность за каждую итерацию уменьшается в два раза:

|b_1-a_1|=frac{|b_0-a_0|}{2};quad |b_2-a_2|= frac{|b_1-a_1|}{2}= frac{|b_0-a_0|}{2^2},quad ldots,quad |b_k-a_k|= |b_0-a_0|cdot2^{-k}.

Из последнего соотношения можно оценить число итераций k для достижения заданной точности varepsiloncolon

|b_0-a_0|cdot2^{-k} leqslant varepsilon;qquad k geqslant log_{2}frac{|b_0-a_0|}{varepsilon},.

Отсюда видно, что, например, для достижения точности varepsilonapprox10^{-3} при (b_0-a_0)cong1 необходимо выполнить примерно десять итераций.

2. К достоинствам метода следует отнести то, что он позволяет найти простой корень уравнения x_{ast}in[a_0,b_0] любых непрерывных функций f(x) при любых значениях a_0,,b_0 таких, что f(a_0)cdot f(b_0)&lt;0. Недостатки метода — он не обобщается на системы нелинейных уравнений и не может использоваться для нахождения корней четной кратности.

▼ Примеры 3.4-3.6

Пример 3.4. Найти корень уравнения x^3-x+1=0 методом половинного деления с точностью varepsilon_1=0,!01 и varepsilon_2=0,!0005.

Решение

Пример 3.5. Найти корень уравнения x^3-x^2-9x+9=0 методом половинного деления с точностью varepsilon=0,!001.

Решение

В примере 3.3 были отделены корни уравнения. Уточним корень, лежащий на отрезке [2,!5;4]. Результаты расчетов поместим в табл. 3.2.

begin{aligned} mathit{Table~3.2}~&\ begin{array}{|c|c|c|c|c|c|c|c|} hline begin{matrix}{}\[-2pt]{}end{matrix} k& f(a_k)& a_k& b_k& f(b_k)& c_k=dfrac{a_k+b_k}{2}& f(c_k)& b_k-a_k\hline 0& -4,!125& 2,!5& 4& 21& 3,!25& 3,!5156& 1,!5\hline 1& -4,!125& 2,!5& 3,!25& 3,!5156& 2,!875& -1,!3769& 0,!75\hline 2& -1,!3769& 2,!875& 3,!25& 3,!5156& 3,!0625& 0,!78149& 0,!375\hline 3& -1,!3769& 2,!875& 3,!0625& 0,!7815& 2,!96875& -0,!3672& 0,!1875\hline 4& -0,!3672& 2,!9687& 3,!0625& 0,!7815& 3,!01562& 0,!18945& 0,!09375\hline 5& -0,!3672& 2,!9687& 3,!0156& 0,!1894& 2,!99218& -0,!0933& 0,!04687\hline 6& -0,!0933& 2,!9921& 3,!0156& 0,!1894& 3,!0039& 0,!0469& 0,!02344\hline 7& -0,!0933& 2,!9921& 3,!0039& 0,!0469& 2,!99804& -0,!02349& 0,!01172\hline 8& -0,!02349& 2,!99804& 3,!0039& 0,!0469& 3,!00097& 0,!011647& 0,!00586\hline end{array}& end{aligned}

В результате найден интервал [2,!99804;3,!0039] и приближенное значение корня x_{ast}cong3,!00097.

Пример 3.6. Отделить корни трансцендентного уравнения x^2-e^{-x}=0 и найти один из корней с точностью varepsilon=0,!01.

Решение

1. Можно отделить корни уравнения, преобразовав его к равносильному виду x^2=e^{-x} и определив абсциссу точек пересечения графиков функций y=f_1(x)=x^2 и y=f_2(x)=e^{-x}colon, x_{ast}in[0,!5;1]. При этом f(0,!5)cdot f(1)&lt;0.

2. Уточним корень. Результаты расчетов приведем в табл. 3.3.

begin{aligned} mathit{Table~3.3}~&\ begin{array}{|c|c|c|c|c|c|c|c|} hline begin{matrix}{}\[-2pt]{}end{matrix} k& f(a_k)& a_k& b_k& f(b_k)& c_k=dfrac{a_k+b_k}{2}& f(c_k)& b_k-a_k\hline 0& -0,!3565& 0,!5& 1& 0,!6321& 0,!75& 0,!09013& 0,!5\hline 1& -0,!3565& 0,!5& 0,!75& 0,!09013& 0,!625& -0,!1446& 0,!251\hline 2& -0,!1446& 0,!625& 0,!75& 0,!09013& 0,!6875& -0,!0301& 0,!125\hline 3& -0,!0301& 0,!6875& 0,!75& 0,!09013& 0,!7187& 0,!0292& 0,!0625\hline 4& -0,!0301& 0,!6875& 0,!7187& 0,!0292& 0,!7031& -0,!00069& 0,!0312\hline 5& -0,!00069& 0,!7031& 0,!7187& 0,!0292& 0,!7109& 0,!0142& 0,!0156\hline 6& -0,!00069& 0,!7031& 0,!7109& 0,!0142& 0,!707& 0,!0067& 0,!0078\hline end{array}& end{aligned}

Вычисления показывают, что b_6-a_6=0,!7109-0,!7031=0,!0078&lt; varepsilon= 0,!01.

Поэтому x_{ast}cong frac{0,!7109+0,!7031}{2}= c_6=0,!707.


Геометрическая интерпретация метода хорд

Метод хорд

Этот метод при тех же предположениях обеспечивает более быстрое нахождение корня, чем метод половинного деления. Для этого отрезок [a,b] делится не пополам, а в отношении |f(a)|,colon|f(b)|.

Геометрически метод хорд эквивалентен замене кривой y=f(x) хордой, проходящей через точки (a,f(a)) и (b,f(b)) (рис. 3.6).

Уравнение хорды AB имеет вид frac{x-a}{b-a}= frac{y-f(a)}{f(b)-f(a)}. Полагая x=x^{(1)} и y=0, получаем

x^{(1)}= a-frac{f(a)}{f(b)-f(a)}cdot(b-a).

Предположим, что вторая производная f''(x) сохраняет постоянный знак, и рассмотрим два случая: f(a)&gt;0,~ f''(a)&gt;0 (рис. 3.7,д) и f(a)&lt;0,~ f''(x)&gt;0 (рис. 3.7,б). Случай f''(x)&lt;0 сводится к рассматриваемому, если уравнение записать в форме: -f(x)=0. Первому случаю (см. рис. 3.7,д) соответствует формула (3.7), а второму случаю (3.8) (см. рис. 3.7,б):

begin{aligned}&x^{(0)}=b,\ &x^{(k+1)}=x^{(k)}-frac{f(x^{(k)})}{f(x^{(k)})-f(a)} bigl(x^{(k)}-abigr),quad k=0,1,2,ldotsend{aligned}

(3.7)

begin{aligned}&x^{(0)}=a,\ &x^{(k+1)}=x^{(k)}-frac{f(x^{(k)})}{f(b)-f(x^{(k)})}bigl(b-x^{(k)}bigr),quad k=0,1,2,ldots end{aligned}

(3.8)

В первом случае остается неподвижным конец a, а во втором случае конец b.

Метод хорд

Замечание. Для выявления неподвижного конца используется условие f''(x)cdot f(t)&gt;0, где t=a или t=b. Если неподвижен конец a, применяется формула (3.7), а если конец b, — формула (3.8).

Пример 3.7. Найти корень уравнения x^3-x+1=0 методом хорд с точностью varepsilon=0,!001.

Решение

Рассмотрим задачу нахождения корня на отрезке [-2;-1] (см. пример 3.2). Так как f(a)=f(-2)=-5, f(b)=f(-1)=-1, a f''(x)=3x^2-1&gt;0 на отрезке [-2;-1], то f''(x)cdot f(b)&gt;0 и, следовательно, имеем второй случай (см. рис. 3.7,б).

Положим x^{(0)}=a=-2,~k=0. Тогда по формуле (3.8) получаем

x^{(1)}= x^{(0)}-frac{f(x^{(0)})}{f(b)-f(x^{(0)})}bigl(b-x^{(0)}bigr)=-2-frac{-5}{1-(-5)}cdot(-1-(-2))=-1,!1666.

Так как Delta_1=|x^{(1)}-x^{(0)}|=0,!8334&gt;varepsilon, то положим k=1 и продолжим процесс:

x^{(2)}= x^{(1)}-frac{f(x^{(1)})}{f(b)-f(x^{(1)})}bigl(b-x^{(1)}bigr)=-1,!1666-frac{-0,!5786}{1-0,!5786}cdot bigl(-1-(-1,!1666)bigr)=-1,!3953.

Так как Delta_2=|x^{(2)}-x^{(1)}|=0,!2287&gt;varepsilon, то положим k=2 и продолжим процесс:

x^{(3)}= x^{(2)}-frac{f(x^{(2)})}{f(b)-f(x^{(2)})}bigl(b-x^{(2)}bigr)=-1,!3953-frac{-0,!3214}{1+0,!3214}cdot bigl(-1-(-1,!3953)bigr)=-1,!2991.

Поскольку Delta_3=|x^{(3)}-x^{(2)}|=0,!0962&gt;varepsilon, положим k=3colon

x^{(4)}= x^{(3)}-frac{f(x^{(3)})}{f(b)-f(x^{(3)})}bigl(b-x^{(3)}bigr)=-1,!2991-frac{-0,!1064}{1+0,!1064}cdot bigl(-1-(-1,!2991)bigr)=-1,!3347.

Так как Delta_4=|x^{(4)}-x^{(3)}|=0,!0356&gt;varepsilon, положим k=4colon

x^{(5)}= x^{(4)}-frac{f(x^{(4)})}{f(b)-f(x^{(4)})}bigl(b-x^{(4)}bigr)=-1,!3347-frac{-0,!043}{1+0,!043}cdot bigl(-1-(-1,!3347)bigr)=-1,!3209.

Поскольку Delta_5=|x^{(5)}-x^{(4)}|=0,!0138&gt;varepsilon, положим k=5colon

x^{(6)}= x^{(5)}-frac{f(x^{(5)})}{f(b)-f(x^{(5)})}bigl(b-x^{(5)}bigr)=-1,!3209-frac{-0,!0162}{1+0,!0162}cdot bigl(-1-(-1,!3209)bigr)=-1,!3261.

Так как Delta_6=|x^{(6)}-x^{(5)}|=0,!0052&gt;varepsilon, положим k=6colon

x^{(7)}= x^{(6)}-frac{f(x^{(6)})}{f(b)-f(x^{(6)})}bigl(b-x^{(6)}bigr)=-1,!3261-frac{-0,!0059}{1+0,!0059}cdot bigl(-1-(-1,!3261)bigr)=-1,!3241.

Поскольку Delta_7=|x^{(7)}-x^{(6)}|=0,!0020&gt;varepsilon, положим k=7colon

x^{(8)}= x^{(7)}-frac{f(x^{(7)})}{f(b)-f(x^{(7)})}bigl(b-x^{(7)}bigr)=-1,!3241-frac{-0,!00217}{1+0,!00217}cdot bigl(-1-(-1,!3241)bigr)=-1,!3248.

Так как Delta_8=|x^{(8)}-x^{(7)}|=0,!0007&lt;varepsilon=0,!001, то корень уравнения x_{ast}cong-1,!3248. Из анализа поведения Delta_k следует, что сходимость метода хорд линейная, однако более быстрая, чем сходимость метода половинного деления.


Абсцисса точки пересечения прямой и кривой

Метод простых итераций

Пусть известно, что корень x_{ast} уравнения f(x)=0 лежит на отрезке G={aleqslant xleqslant b}.

Методика решения задачи

1. Уравнение f(x)=0 равносильным преобразованием привести к виду x=varphi(x). Это преобразование может быть осуществлено различными путями, но для сходимости нужно обеспечить выполнение условия |varphi'(x)|leqslantchi&lt;1 (chi — некоторая константа). При этом задача сводится к нахождению абсциссы точки пересечения прямой y=x и кривой y=varphi(x) (рис. 3.8).

2. Задать начальное приближение x^{(0)}in[a,b] и малое положительное число varepsilon. Положить k=0.

3. Вычислить следующее приближение:

x^{(k+1)}= varphi(x^{(k)}).

(3.9)

4. Если |x^{(k+1)}-x^{(k)}|leqslantvarepsilon, итерации завершаются и x_{ast}cong x^{(k+1)}. Если |x^{(k+1)}-x^{(k)}|&gt;varepsilon, положить k=k+1 и перейти к п.3.

Замечание. В качестве условия завершения итераций при известном значении chi может быть использовано неравенство

bigl|x^{(k+1)}-x^{(k)}bigr|leqslant frac{1-chi}{chi}cdot varepsilon.

Проблемы сходимости и единственности численного решения, являющиеся главными при использовании этого метода, решаются и исследуются с помощью понятия о сжимающем отображении и теоремы о достаточном условии сходимости метода.

Отображение (функция) varphi(x) называется сжимающим в области G с коэффициентом chi~(0leqslantchi&lt;1), если для любых двух x',,x'' из G выполнено неравенство

bigl|varphi(x'')-varphi(x')bigr|leqslantchicdotbigl|x''-x'bigr|.

(3.10)

Теорема 3.9 (о сходимости метода простых итераций и единственности получаемого численного решения)

Пусть выполнены условия:

1. Нелинейное уравнение x=varphi(x) имеет решение x_{ast}in G.

2. Отображение varphi(x) является сжимающим в области G с некоторым коэффициентом chi~(0leqslantchi&lt;1).

Тогда:

а) решение x_{ast} является единственным решением в области G;

б) последовательность x^{(0)},x^{(1)},ldots,x^{(k+1)},ldots, определяемая по отображению на основе итерационного процесса, сходится к решению x_{ast} со скоростью геометрической прогрессии, т.е. при выборе x^{(0)} из условия |x_{ast}-x^{(0)}|&lt;R, где R&gt;0 — некоторое малое число, справедливо неравенство

bigl|x_{ast}-x^{(k)}bigr| leqslant chi^kcdot bigl|x_{ast}-x^{(0)}bigr|,quad k=0,1,2,ldots

Теорема 3.9 утверждает, что при выполнении условий 1,2 существует окрестность G(x_{ast},R) такая, что если взять x^{(0)} в этой окрестности и вычислять x^{(1)},x^{(2)},ldots по формуле (3.9), то в результате с любой наперед заданной точностью можно вычислить x^{(k+1)}approx x_{ast}, соответствующее искомому (единственному) корню. Но так как эта окрестность неизвестна, то можно взять произвольное x^{(0)}in G. Если при этом вычисляется последовательность x^{(0)},x^{(1)},x^{(2)},ldots,x{(k)},ldots, сходящаяся к некоторому значению widehat{x}, то в силу теоремы widehat{x}=x_{ast}. Если сходимость отсутствует, то надо взять другое x^{(0)}in G и повторить расчет.

Теорема 3.10 (о достаточном условии сходимости метода простых итераций). Пусть выполнены условия:

1. Функция varphi(x) имеет производные для всех xin G.

2. Существует число chi,(0 leqslantchi&lt;1,~chi=text{const}), такое, что |varphi'(x)|leqslantchi для всех xin G.

Тогда отображение varphi(x) является сжимающим в G с коэффициентом сжатия х и последовательность x^{(0)},x^{(1)},ldots,x^{(k+1)},ldots, определяемая на основе итерационного процесса, сходится к решению x_{ast}, то есть x^{(k)}to x_{ast} при ktoinfty.

▼ Доказательство

В силу условия 1 справедлива теорема Лагранжа о конечных приращениях:

varphi(x'')-varphi(x')leqslant (x''-x')varphi'(delta) для forall x',x''in G,

где delta — точка, лежащая между x' и x''. Но тогда с учетом условия 2 и замены varphi'(delta) ее мажорантой chi получим

bigl|varphi(x'')-varphi(x')bigr|leqslant chicdot bigl|x''-x'bigr|,

т.е. отображение varphi(x) — сжимающее, и, таким образом, последовательность x^{(0)},x^{(1)},ldots,x^{(k+1)},ldots сходится к некоторому widehat{x}. Но тогда в силу непрерывности varphi(x) в G имеет место равенство widehat{x}=x_{ast}.

Геометрическая интерпретация процесса сходимости и расходимости в зависимости от выполнения или невыполнения достаточного условия сходимости представлена на рис. 3.9.

Сходимость итерационных последовательностей

Из рис. 3.9 видно, что при 0&lt;varphi'(x)&lt;1 и при -1&lt;varphi'(x)&lt;0 (см.рис. 3.9,д,б) итерационные последовательности x^{(0)},x^{(1)},x^{(2)},ldots сходятся к x_{ast}. Причем в первом случае реализуется односторонняя (монотонная) сходимость, а во втором — двусторонняя (немонотонная). При |varphi'(x)|&gt;1 (см.рис. 3.9,в,г) процесс расходится несмотря на то, что точка x^{(0)} очень близка к x_{ast}. Процессы на рис. 3.9,а,б соответствуют сжимающему отображению.

Преобразование уравнения f(x)=0 к равносильному виду x=varphi(x) может быть выполнено неоднозначно. Рассмотрим универсальные практические приемы равносильного преобразования f(x)=0, дающие сжимающие отображения.

1. Можно заменить уравнение f(x)=0 на равносильное x=x+cf(x), где c=text{const}ne0. Тогда, принимая правую часть этого уравнения за varphi(x) и раскрывая |varphi'(x)|= |1+cf'(x)|&lt;1, получаем условие

-2&lt;ccdot f'(x)&lt;0.

(3.11)

Таким образом, можно найти константу c на отрезке G=[a,b] так, чтобы удовлетворялись неравенства (3.11). При этом надо стремиться получить такую постоянную c, которая бы больше отличалась от нуля, и тогда будет реализовы-ваться более быстрая сходимость.

Можно показать, что абсолютная погрешность метода оценивается по формуле (эта оценка выражается через два последовательных приближения)

bigl|x^{(k+1)}-x_{ast}bigr|leqslant frac{chi}{1-chi}cdot bigl|x^{(k+1)}-x^{(k)}bigr|

(3.12)

или по формуле (эта оценка выражается через два приближения x^{(0)} и x^{(1)})

bigl|x^{(k+1)}-x_{ast}bigr|leqslant frac{chi^{k+1}}{1-chi}cdot bigl|x^{(1)}-x^{(0)}bigr|.

(3.13)

Из оценки следует условие выхода из итерационного процесса. Если значение chi неизвестно, то выход осуществляется по условию

bigl|x^{(k+1)}-x^{(k)}bigr|leqslant varepsilon.

2. Уравнение f(x)=0 заменяется равносильным (где знак в правой части выбирается из условия |varphi'(x)|&lt;1):

x=xmp frac{f(x)}{max|f'(x)|}equiv varphi(x) при xin G,

3. Можно выразить x из уравнения f(x)=0 так, чтобы для полученного уравнения x=varphi(x) выполнялось условие сходимости |varphi'(x)|&lt;1 в окрестности искомого корня.

Замечание к доказательству. Выполнение условия Delta_{k+1}= bigl|x^{(k+1)}-x^{(k)}bigr|leqslant varepsilon не гарантирует близости к точному решению (на рис. 3.10 достигается область, где условие окончания выполняется, но корень x_{ast} расположен достаточно далеко от этой области).

Итерационный процесс и корень

▼ Примеры 3.8-3.10

Пример 3.8. Методом простых итераций с точностью varepsilon=0,!001 уточнить корень трансцендентного уравнения x^2-e^{-x}=0, причем искомый корень x_{ast}in[0,!5;1,!0]equiv G.

Решение

Пример 3.9. Найти решение уравнения x^3-x+1=0 методом простых итераций с точностью varepsilon_1=0,!01 и varepsilon_2=0,!001.

Решение

Пример 3.10. Найти корни уравнения x^3-x^2-9x+9=0 методом простых итераций с точностью varepsilon=0,!001.

Решение

1. Преобразуем уравнение к виду x=varphi(x)colon, x=sqrt[LARGE{3}]{x^2+9x-9}.

В примере 3.3 была выполнена операция отделения корней и получены отрезки [-4;-2],,[0,5;2],,[2;4].

Можно показать, что на отрезках [2;4],,[-4;-2] функция varphi(x)= sqrt[LARGE{3}]{x^2+9x-9} удовлетворяет условию |varphi'(x)|&lt;1.

На отрезке [0,!5;2] используем другой вид уравнения: x=frac{x^3}{9}-frac{x^2}{9}+1. Также легко проверить, что функция varphi(x)=frac{x^3}{9}-frac{x^2}{9}+1 удовлетворяет достаточному условию сходимости на отрезке [0,!5;2].

2. В качестве начальных приближений выберем:
– точку x^{(0)}=-2 на отрезке [-4;-2];
– точку x^{(0)}=0,!5 на отрезке [0,!5;-2];
– точку x^{(0)}=2 на отрезке [2;4];.
В поставленной задаче varepsilon=0,!001.

3,4. Выполним расчеты по формуле

x^{(k+1)}= sqrt[LARGE{3}]{(x^{(k)})^2+9x^{(k)}-9},quad k=0,1,2,ldots

с начальными значениями x^{(0)}=-2 и x^{(0)}=2 и по формуле

x^{(k+1)}=frac{(x^{(k)})^3}{9}-frac{(x^{(k)})^2}{9}+1,quad k=0,1,2,ldots

с начальным значением x^{(0)}=0,!5.

Результаты расчетов занесены в табл. 3.6–3.8.

begin{aligned}& begin{aligned} mathit{Table~3.6}~&\ begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|}hline k&! scriptstyle{0}!&! scriptstyle{1}!&! scriptstyle{2}!&! scriptstyle{3}!&! scriptstyle{4}!&! scriptstyle{5}!&! scriptstyle{6}!&! scriptstyle{7}!&! scriptstyle{8}!&! scriptstyle{9}!&! scriptstyle{10}!&! scriptstyle{11}!&! scriptstyle{12}!\hline x^{(k)}&! scriptstyle{2,0000}!&! scriptstyle{2,3513}!&! scriptstyle{2,6056}!&! scriptstyle{2,7694}!&! scriptstyle{2,8682}!&! scriptstyle{2,9255}!&! scriptstyle{2,9582}!&! scriptstyle{2,9767}!&! scriptstyle{2,9870}!&! scriptstyle{2,9927}!&! scriptstyle{2,9959}!&! scriptstyle{2,9977}!&! scriptstyle{2,9987}!\hline  bigl|x^{(k)}-x^{(k-1)}bigr|&! -!&! scriptstyle{0,3513}!&! scriptstyle{0,2543}!&! scriptstyle{0,1638}!&! scriptstyle{0,0988}!&! scriptstyle{0,0573}!&! scriptstyle{0,0327}!&! scriptstyle{0,0185}!&! scriptstyle{0,0102}!&! scriptstyle{0,0057}!&! scriptstyle{0,0032}!&! scriptstyle{0,0018}!&! scriptstyle{0,0010}!\hline end{array}& end{aligned}<br />\[6pt] & begin{aligned} mathit{Table~3.7}~&\ begin{array}{|c|c|c|}hline k&  x^{(k)}&  bigl|x^{(k)}-x^{(k-1)}bigr|\hline 0&-2,!0000&-\hline 1&-2,!8438& 0,!8438\hline 2&-2,!9816& 0,!1378\hline 3&-2,!9979& 0,!0163\hline 4&-2,!9997& 0,!0018\hline 5&-2,!99997& 0,!00027\hline end{array}&end{aligned} qquadqquadqquad begin{aligned} mathit{Table~3.8}~&\ begin{array}{|c|c|c|} hline k&  x^{(k)}&  bigl|x^{(k)}-x^{(k-1)}bigr|\hline 0& 0,!50000&-\hline 1& 0,!98611& 0,!4861\hline 2& 0,!99849& 0,!01238\hline 3& 0,!99983& 0,!00134\hline 4& 0,!99998& 0,!00015\hline end{array}& end{aligned}end{aligned}

В результате получены приближенные значения корней:

x_{1ast}cong-2,!99997,qquad x_{2ast}cong0,!99998,qquad x_{3ast}cong2,!9987.

Обратим внимание на сильное различие в числе итераций, потребовавшихся для нахождения корней x_{ast}=3 (табл. 3.6) и x_{ast}=-3 (табл. 3.7), с помощью одной и той же формулы. Заметим, что в окрестности корня x_{ast}=3 значения модуля производной функции varphi(x)=sqrt[LARGE{3}]{x^2+9x-9} равны:

|varphi'(2)|=0,!784;qquad |varphi'(2,!3513)|=0,!673;qquad |varphi'(2,!6056)|=0,!618;qquad |varphi'(2,!9977)|=0,!556.

С другой стороны, в окрестности корня x_{ast}=-3 имеем:

|varphi'(-2)|=0,!206;qquad |varphi'(-2,!8438)|= 0,!124;qquad |varphi'(-2,!9977)|=0,!111.

Анализ результатов показывает, что чем меньше значения модуля производной |varphi'(x)|, тем быстрее сходимость.


Метод Ньютона для решения нелинейных уравнений

Метод Ньютона (метод касательных, или метод линеаризации) является одним из наиболее популярных численных методов. Он быстро сходится (имеет квадратичную сходимость) и допускает различные модификации, приспособленные для решения векторных задач и сеточных уравнений. Однако этот метод эффективен при весьма жестких ограничениях на характер функции f(x)colon

Геометрическая интерпретация метода Ньютона

1) существование второй производной функции f(x) на множестве G={aleqslant xleqslant b};
2) удовлетворение первой производной условию f(x)ne0 для всех xin G;
3) знакопостоянство f'(x),,f''(x) для всех xin G.

Поэтому его желательно использовать совместно с другими методами, например методом половинного деления, чтобы достигнуть диапазона widetilde{a}leqslant x leqslant widetilde{b}, где указанные условия начинают выполняться.

Геометрическая интерпретация метода Ньютона состоит в следующем. Задается начальное приближение x^{(0)}. Далее проводится касательная к кривой y=f(x) в точке x^{(0)} (рис. 3.11), т.е. кривая заменяется прямой линией. В качестве следующего приближения выбирается точка пересечения этой касательной с осью абсцисс. Процесс построения касательных и нахождения точек пересечения с осью абсцисс повторяется до тех пор, пока приращение не станет меньше заданной величины varepsilon.

Получим расчетную формулу метода Ньютона. Вместо участка кривой BC (точка C соответствует x_{ast}) возьмем участок AB — касательную, проведенную в точке (x^{(0)},f(x^{(0)}))). Для этого отрезка справедливо конечное соотношение:

frac{f(x^{(0)})-0}{x^{(0)}-x^{(1)}}= f'(x^{(0)})equiv operatorname{tg}alpha,

где alpha — угол наклона касательной в точке (x^{(0)},f(x^{(0)})) к оси абсцисс. Разрешая это соотношение относительно x^{(1)}, получаем x^{(1)}= x^{(0)}-frac{f(x^{(0)})}{f'(x^{(0)})}. Повторяя процесс, находим общую формулу:

x^{(k+1)}= x^{(0)}-frac{f(x^{(k)})}{f'(x^{(k)})},quad k=0,1,2,ldots

(3.14)

Подчеркнем, что если отбросить итерационный индекс, то (3.14) записывается в виде нелинейного уравнения

x=x-frac{f(x)}{f'(x)}equiv varphi(x),

(3.15)

которое, однако, на [a,b] не равносильно исходному, а является таковым только в одной точке при x=x_{ast}. Поэтому данный метод не служит разновидностью метода простых итераций.

Применим теперь для вывода формулы (3.14) метод линеаризации. Положим, что итерационный процесс имеет вид

x^{(k+1)}=x^{(k)}+delta^{(k)},quad k=0,1,2,ldots

(3.16)

где delta^{(0)} — поправка к k-му приближению, которую необходимо найти. Предполагая, что f(x) имеет непрерывную вторую производную, разложим f(x^{(k)}+delta^{(k)}) по формуле Тейлора относительно точки x^{(k)}colon

f(x^{(k)}+delta^{(k)})= f(x^{(k)})+ delta^{(k)}f'(x^{(k)})+ frac{1}{2}(delta^{(k)})^2 f''(xi),

где xiin bigl(x^{(k)},x^{(k+1)}bigr). Учитывая, что fbigl(x^{(k)}+ delta^{(k)}bigr)=0 (это соответствует нахождению точки пересечения с осью абсцисс), и оставляя только линейную (относительно delta^{(k)}) часть разложения (отсюда и название — метод линеаризации), записываем линейное относительно delta^{(k)} уравнение

f(x^{(k)})+ delta^{(k)} f'(x^{(k)})=0.

Отсюда выражается поправка delta^{(k)}=-frac{f(x^{(k)})}{f'(x^{(k)})}. Подставляя delta^{(k)} в (3.16), получаем (3.14).

Теорема 3.11 (о достаточных условиях сходимости метода Ньютона). Пусть выполняются следующие условия:

1. Функция f(x) определена и дважды дифференцируема на [a,b].

2. Отрезку [a,b] принадлежит только один простой корень x_{ast}, так что f(a)cdot f(b)&lt;0.

3. Производные f'(x),,f''(x) на [a,b] сохраняют знак, и f'(x)ne0.

4. Начальное приближение x^{(0)} удовлетворяет неравенству f(x^{(0)})cdot f''(x^{(0)})&gt;0 (знаки функций f(x) и f''(x) в точке x^{(0)} совпадают).

Тогда с помощью метода Ньютона (3.14) можно вычислить корень уравнения f(x)=0 с любой точностью.

Замечания

1. Метод Ньютона характеризуется вторым порядком сходимости вблизи корня и первым порядком — вдали от него. Данную оценку проверяем для двух случаев, когда x^{(k)} находится далеко от корня x_{ast} (это возможно на первых итерациях) и когда x^{(k)} располагается вблизи x_{ast}.

Первый случай. Пусть отрезок omega=[x^{(k)},x_{ast}] не мал. Тогда на основе теоремы Лагранжа получим (где m_1=minlimits_{omega}|f'(x)|)

bigl|f(x^{(k)})bigr|= bigl|f(x_{ast})-f(x^{(k)})bigr|= bigl|f'(xi)bigr|cdot bigl|x_{ast}-x^{(k)}bigr| geqslant m_1 bigl|x_{ast}-x^{(k)}bigr|.

(3.17)

Преобразуем с использованием (3.17) итерационную формулу (3.14) (где M_1= maxlimits_{xin[a,b]}|f'(x)|):

x^{(k+1)}=x^{(k)}-frac{f(x^{(k)})}{f'(x^{(k)})};qquad bigl|x^{(k+1)}-x^{(k)}bigr|= frac{|f(x^{(k)})|}{f'(x^{(k)})} geqslant frac{m_1}{M_1} bigl|x_{ast}-x^{(k)}bigr|.

В силу монотонности последовательности x^{(0)},x^{(1)},ldots имеем

begin{gathered}x_{ast}-x^{(k+1)}= x_{ast}-x^{(k)}-bigl(x^{(k+1)}-x^{(k)}bigr),\ bigl|x_{ast}-x^{(k+1)}bigr|= bigl|x_{ast}-x^{(k)}bigr|-bigl|x^{(k+1)}-x^{(k)}bigr| geqslant bigl|x_{ast}-x^{(k)}bigr|- frac{m_1}{M_1} bigl|x_{ast}-x^{(k)}bigr|= left(1-frac{m_1}{M_1}right)! bigl|x_{ast}-x^{(k)}bigr|. end{gathered}

Таким образом, вдали от корня получаем линейную сходимость

bigl|x_{ast}-x^{(k+1)}bigr| leqslant ccdot bigl|x_{ast}-x^{(k)}bigr|, где 0 leqslant c=1-frac{m_1}{M_1}&lt;1.

Второй случай. Пусть теперь отрезок omega=[x^{(k)},x] мал, т.е. итерации выполняются вблизи корня. Тогда, полагая, что указанные выше предположения 1–4 теоремы 3.10 выполнены, разложим функцию f(x) в окрестности корня x_{ast} относительно точки x^{(k)}, учитывая члены до второго порядка. Получим

Bigl.{f(x)}Bigr|_{x=x^{(k)}}= f(x^{(k)})+ bigl(x_{ast}-x^{(k)}bigr) f'(x^{(k)})+ bigl(x_{ast}-x^{(k)}bigr)^2 frac{1}{2}f''(xi)=0,

где xiin bigl(x^{(k)}-delta,,x^{(k)}+deltabigr) (delta&gt;0 — малая величина). Из данного соотношения выражаем x_{ast}colon

x_{ast}=x^{(k)}-frac{f(x^{(k)})}{f'(x^{(k)})}-frac{(x_{ast}-x^{(k)})^2}{2f'(x^{(k)})},f''(xi).

Но первые два слагаемых в правой части в соответствии с (3.14) равны x^{(k+1)}. Тогда будем иметь

x_{ast}-x^{(k)}=-frac{(x_{ast}-x^{(k)})^2}{2f'(x^{(k)})},f''(xi).

Из последнего соотношения следует оценка погрешности (k+1)-го приближения через погрешность k-го приближения:

bigl|x_{ast}-x^{(k+1)}bigr|leqslant frac{M_2}{2m_1} bigl|x_{ast}-x^{(k)}bigr|^2,

(3.18)

где принято M_2=maxlimits_{omega}|f''(x)|,~ m_1=minlimits_{omega}|f'(x)|. Оценка (3.18) свидетельствует о квадратичной сходимости метода касательных вблизи корня. С вычислительной точки зрения это означает, что на каждом приближении количество верных цифр результата удваивается.

2. Для нахождения комплексных корней уравнения f(z)=0 можно также использовать (3.14) в форме (где z=x+iy — комплексная переменная)

z^{(k+1)}=z^{(k)}-frac{f(z^{(k)})}{f'(z^{(k)})},quad k=0,1,2,ldots

Метод Ньютона может применяться не только для нахождения простых корней, но для определения кратных корней, т.е. когда на отрезке [a,b] содержащем корень, не выполняется условие f(a)cdot f(b)&lt;0 (условие 2 теоремы 3.11). Наряду с теоремой 3.11 удобно также пользоваться следующей теоремой.


Достаточные условия сходимости метода Ньютона

Теорема 3.12 (достаточные условия сходимости метода Ньютона). Пусть:

а) дана функция f(x)colon Dto mathbb{R}, где D — открытый интервал, и f'(x)in operatorname{Lip}_{gamma}(D);

б) для некоторого rho&gt;0 выполняется условие |f'(x)|leqslantrho при всех x из D.

Если уравнение f(x)=0 имеет решение x_{ast}in D, то существует некоторое eta&gt;0, такое, что если |x^{(0)}-x_{ast}|&lt;eta, то последовательность bigl{x^{(0)},x^{(1)},x^{(2)},ldotsbigr}, задаваемая формулой (3.14), существует и сходится к x_{ast}. Более того, справедлива оценка

bigl|x^{(k+1)}-x_{ast}bigr| leqslant frac{gamma}{2rho} bigl|x^{(k)}-x_{ast}bigr|^2,quad k=0,1,2,ldots

Здесь обозначение f'(x)in operatorname{Lip}_{gamma}(D) означает, что функция f'(x) непрерывна по Липшицу с константой gamma на множестве D, то есть |f'(x)-f'(y)| leqslant gamma cdot|x-y| для любых x,,y из D.

Замечания

1. Требование теоремы 3.12, чтобы производная f'(x) имела ненулевую нижнюю границу в D, определяет, что значение f'(x_{ast}) должно быть ненулевым для квадратичной сходимости метода Ньютона. Если же f'(x_{ast})=0, то x_{ast} является кратным корнем, а метод Ньютона сходится лишь линейно.

2. Выполнение условий теоремы 3.12 гарантирует сходимость метода Ньютона только из “хорошего” начального приближения x^{(0)}.

3. Метод Ньютона является локально сходящимся, так как он сходится с определенной скоростью к истинному решению при условии, что стартует в достаточной близости от этого решения.

Методика решения задачи

1. Задать начальное приближение x^{(0)} так, чтобы выполнялось неравенство f(x^{(0)})cdot f''(x^{(0)})&gt;0, а также малое положительное число varepsilon. Положить k=0.

2. Вычислить x^{(k+1)} по формуле x^{(k+1)}= x^{(k)}-frac{f(x^{(k)})}{f'(x^{(k)})}.

3. Если |x^{(k+1)}-x^{(k)}|leqslant varepsilon, процесс завершить и положить x_{ast}cong x^{(k+1)}.

Если |x^{(k+1)}-x^{(k)}|&gt;varepsilon, положить k=k+1 и перейти к п.2.

▼ Примеры 3.11-3.14

Пример 3.11. Методом Ньютона с точностью varepsilon=0,!001 уточнить корень трансцендентного уравнения x^2-e^{-x}=0, причем искомый корень x_{ast}in[0,!5;1,!0]equiv G.

Решение

Можно проверить, что на множестве G удовлетворяются условия 1, 2, 3 теоремы 3.11, обеспечивающие сходимость метода касательных.

1. Зададим начальное приближение из условия 4. Так как для f(x)=x^2-e^{-x} справедливо f''(x)=2-e^{-x}&gt;0 на множестве G,~ f(a)=f(0,!5)&lt;0, f(b)=f(1)&gt;0, то f(1)cdot f''(1)&gt;0, поэтому x^{(0)}=1.

2,3. Результаты расчетов по формуле (3.14) x^{(k+1)}= x^{(k)}-frac{(x^{(k)})^2-e^{-x^{(k)}}}{2x^{(k)}+e^{-x^{(k)}}},~k=0,1,2,ldots помещены в табл. 3.9.

begin{aligned} mathit{Table~3.9}~&\ begin{array}{|c|c|c|c|c|} hline k& 0& 1& 2& 3\hline begin{matrix}{}\[-8pt]{}end{matrix} x^{(k)}& 1,!000& 0,!73304& 0,!70381& 0,!703467\hline begin{matrix}{}\[-8pt]{}end{matrix} bigl|x^{(k)}-x^{(k-1)}bigr|&-& 0,!27& 0,!029& 0,!00034\hline begin{matrix}{}\[-8pt]{}end{matrix} f(x^{(k)})& 0,!63212& 0,!05690& 0,!00065& 8,!25cdot10^{-7}\hline end{array}& end{aligned}

Из табл. 3.9 можно сделать следующие выводы:

1. Для достижения заданной точности, проверяемой по модулю разности bigl|x^{(k)}-x^{(k-1)}bigr|, потребовалось выполнить три приближения. Если же выход организовать по условию bigl|f(x^{(k)})bigr|leqslant varepsilon, то достаточно двух приближений.

2. Вблизи корня x_{ast} количество верных цифр в результатах x^{(k)} удваивается, так что все цифры в x^{(3)} являются верными, тогда как в x^{(2)} верными являются первые три цифры после запятой.

3. Скорость сходимости метода Ньютона выше скорости сходимости метода простых итераций (та же точность была достигнута за пять итераций).

Пример 3.12. Методом Ньютона найти корень уравнения x^3-x+1=0.

Решение

Пример 3.13. Найти корни уравнения x^3-x^2-9x+9=0 методом Ньютона с точностью varepsilon=0,!001.

Решение

Процедура отделения корней была выполнена в примере 3.3. В качестве отрезков [a_i;b_i], которым принадлежат корни уравнения, выберем [-4;-2], [2,!5;4], [0,!5;2].

Так как f(-4)=-3,!5;~ f(-2)=15, то есть f(-4)f(-2)&lt;0, производные f''(x)=6x-2&lt;0, f'(x)=3x^2-2x-9&gt;0 сохраняют знак при xin[-4;-2], то условия сходимости выполняются.

Так как f(2,!5)=-4,!125;~ f(4)=21, то есть f(2,!5)f(4)&lt;0, и производные f'(x)&gt;0,~ f''(x)&gt;0 сохраняют знак при xin[2,!5;4], то условия сходимости на этом отрезке тоже выполняются.

Так как f(0,!5)=4,!375;~ f(2)=-5, то есть f(0,!5)f(2)&lt;0, и производные f'(x)&lt;0,~ f''(x)&gt;0 сохраняют знак при xin[0,!5;2], то условия сходимости выполняются.

1. Зададим начальные приближения: на отрезке [0,!5;2] выберем x^{(0)}= 0,!5, так как f(0,!5)cdot f''(0,!5)&gt;0; на отрезке [-4;-2] выберем x^{(0)}=-4, так как f(4)cdot f''(4)&gt;0; аналогично на отрезке [2,!5;4] выберем x^{(0)}=4. В поставленной задаче varepsilon= 0,!001.

2,3. Результаты расчетов по формуле (3.14) x^{(k+1)}= x^{(k)}-frac{(x^{(k)})^3-(x^{(k)})^2-9x^{(k)}+9}{3(x^{(k)})^2-2x^{(k)}-9},~ k=0,1,2,ldots приведены в табл. 3.11–3.13.

begin{aligned}& begin{aligned} mathit{Table~3.11}~&\ begin{array}{|c|c|c|c|c|c|} hline k& 0& 1& 2& 3& 4 \hline begin{matrix}{}\[-8pt]{}end{matrix} x^{(k)}&-4,!00000&-3,!255319&-3,!023383&-3,!000225&-3,!000000 \hline begin{matrix}{}\[-8pt]{}end{matrix} bigl|x^{(k)}-x^{(k-1)}bigr|&-& 0,!744681& 0,!231936& 0,!023158& 0,!000225 \hline end{array}& end{aligned}\[2pt] & begin{aligned} mathit{Table~3.12}~&\ begin{array}{|c|c|c|c|c|} hline k& 0& 1& 2& 3 \hline begin{matrix}{}\[-8pt]{}end{matrix} x^{(k)}&0,!5000& 0,!972973& 0,!9998246& 1,!0000000 \hline begin{matrix}{}\[-8pt]{}end{matrix} bigl|x^{(k)}-x^{(k-1)}bigr|&-& 0,!472973& 0,!0268516& 0,!0001754 \hline end{array}& end{aligned}\[2pt] & begin{aligned} mathit{Table~3.13}~&\ begin{array}{|c|c|c|c|c|c|c|} hline k& 0& 1& 2& 3& 4& 5 \hline begin{matrix}{}\[-8pt]{}end{matrix} x^{(k)}& 4,!0000& 3,!322581& 3,!051484& 3,!001674& 3,!000002& 3,!0000 \hline begin{matrix}{}\[-8pt]{}end{matrix} bigl|x^{(k)}-x^{(k-1)}bigr|&-& 0,!6774194& 0,!2710969& 0,!049809& 0,!001671& 2cdot10^{-6} \hline end{array}& end{aligned} end{aligned}

В результате получены приближенные значения корней:

x_{ast1}cong-3,!0000;qquad x_{ast2}cong1,!0000;qquad x_{ast3}cong 3,!0000.

Пример 3.14. Найти корень уравнения x^2-2x+1=0 методом Ньютона с точностью varepsilon=0,!01.

Решение

Очевидно, уравнение имеет один кратный корень x_{ast}=1. Согласно замечанию к теореме 3.12 применение метода Ньютона для решения поставленной задачи сопровождается линейной сходимостью (табл. 3.14).

begin{aligned} mathit{Table~3.14}~&\ begin{array}{|c|c|c|c|c|c|c|c|c|} hline k& 0& 1& 2& 3& 4& 5& 6& 7\hline begin{matrix}{}\[-8pt]{}end{matrix} x^{(k)}& 2& 1,!5& 1,!25& 1,!125& 1,!0625& 1,!03125& 1,!015625& 1,!007813 \hline begin{matrix}{}\[-8pt]{}end{matrix} bigl|x^{(k)}-x^{(k-1)}bigr|&-& 0,!5& 0,!25& 0,!125& 0,!0625& 0,!03125& 0,!015625& 0,!0078125 \hline end{array}& end{aligned}

Полученное приближенное решение x_{ast}cong1,!007813.


Нарушение знакопостоянства производных функции

Метод касательных

Метод касательных, являясь весьма эффективным средством численного анализа, к сожалению, имеет достаточно жесткие ограничения. Действительно, он не может применяться для сеточных уравнений (см. рис. 3.2); при нарушении знакопостоянства производных (рис. 3.12); при существовании неограниченных вторых производных и др. Так, если даже условие знакопостоянства нарушено вдали от корня, где выбрано x^{(0)}, а вблизи корня выполняется, то все равно метод касательных неприменим (см. рис. 3.12), если не произвести сужения начального отрезка.

Кроме того, если функция f(x) очень сложная, то будет сложной и ее производная, и поэтому на каждой итерации приходится рассчитывать две функции, что снижает эффективность метода касательных.

Процесс последовательных приближений по методу Ньютона

В силу этого в ряде случаев могут оказаться более предпочтительными модификации метода касательных. Рассмотрим три из них.

Упрощенный метод Ньютона. Методика его применения совпадает с изложенной ранее, но вместо формулы (3.14) используется

x^{(k+1)}=x^{(k)}-frac{f(x^{(k)})}{f'(x^{(0)})},quad k=0,1,2,ldotsqquad mathsf{(3.19)}

Отличие от метода Ньютона заключается в том, что производная функции f(x) подсчитывается только в точке начального приближения, а на последующих итерациях не уточняется. Процесс последовательных приближений отражен на рис. 3.13. Первая итерация совпадает с первой итерацией метода Ньютона. На последующих итерациях соответствующие отрезки параллельны касательной, проведенной в начальной точке.

Для этой модификации снимаются некоторые ограничения метода касательных, например условие знакопостоянства производных. Сходимость упрощенного метода Ньютона линейная.

Пример 3.15. Найти корень уравнения x^3-x+1=0 упрощенным методом Ньютона.

Решение

Корень уравнения отделен в примере 3.2: x_{ast}in[-2;-1].

1. Выберем начальное приближение x^{(0)}=-2 и зададим varepsilon_1=0,!01 и varepsilon_2=0,!001.

2,3. Выполним расчеты по формуле (3.19):

x^{(k+1)}= x^{(k)}-frac{(x^{(k)})^3-x^{(k)}+1}{3(x^{(0)})^2-1}= x^{(k)}-frac{(x^{(k)})^3-x^{(k)}+1}{11},quad k=0,1,2,ldots

Результаты расчетов приведены в табл. 3.15.

begin{aligned} mathit{Table~3.15}~&\ begin{array}{|c|c|c||c|c|c|} hline begin{matrix} {}\[-6pt]{}end{matrix} k& x^{(k)}& bigl|x^{(k)}-x^{(k-1)}bigr|& k& x^{(k)}& bigl|x^{(k)}-x^{(k-1)}bigr|\hline 0&-2,!00001&-& 6&-1,!3388& 0,!0092\hline 1&-1,!5455& 0,!4545& 7&-1,!3333& 0,!0005\hline 2&-1,!4413& 0,!1042& 8&-1,!3299& 0,!00034\hline 3&-1,!3911& 0,!0502& 9&-1,!3279& 0,!002\hline 4&-1,!3637& 0,!0274& 10&-1,!3267& 0,!0012\hline 5&-1,!348& 0,!0157& 11&-1,!3259& 0,!0008\hline end{array}& end{aligned}

При varepsilon=0,!01 получено решение x_{ast}cong-1,!3388, а при varepsilon=0,!001 — решение x_{ast}cong-1,!3259. Очевидно, по сравнению с методом Ньютона сходимость замедляется (см. пример 3.12).


Метод Ньютона-Бройдена

Этот метод позволяет увеличить скорость сходимости последовательных приближений благодаря использованию формулы

x^{(k+1)}= x^{(k)}-c_kcdot frac{f(x^{(k)})}{f'(x^{(k)})},quad k=0,1,2,ldots

(3.20)

где c_k — число, которое выбирается на каждой итерации так, чтобы уменьшить значение bigl|f(x^{(k+1)})bigr| по сравнению с bigl|f(x^{(k)})bigr|. При c_k=1 метод Ньютона-Бройдена совпадает с методом Ньютона.

Как правило, при плохой сходимости или ее отсутствии полагают 0&lt;c_k&lt;1 (рис. 3.14,д), а при хорошей сходимости для c_k=1 полагают c_k&gt;1 (это ускоряет сходимость (рис. 3.14,б)).

Сходимость при методе Ньютона-Бройдена

На рис. 3.14 прямоугольниками отмечены точки x^{(1)}, полученные при c_0=1,~ delta^{(k)}= frac{f(x^{(k)})}{f'(x^{(k)})},~k=0,1,2,ldots, — поправка, соответствующая методу Ньютона, а точки x^{(1)}=x^{(0)}-c_0delta^{(0)} получены по методу Ньютона-Бройдена.


Тангенс угла наклона секущей

Метод секущих

В этом методе производная функции f(x) подсчитывается с помощью конечно-разностных соотношений:

– в точке x^{(0)} используется формула f'(x^{(0)})approx frac{f(x^{(0)})-f(x^{(0)}-delta)}{delta}, где delta — малая положительная величина;

– в точках x^{(k)},~k=1,2,ldots, используется формула f'(x^{(k)})approx frac{f(x^{(k)})-f(x^{(k-1)})}{x^{(k)}-x^{(k-1)}}.

Вычисленное значение f'(x^{(k)}) определяет тангенс угла наклона секущей (рис. 3.15).

Методика применения метода секущих совпадает с описанной ранее, но вместо (3.14) используется формула

x^{(k+1)}= x^{(k)}-frac{f(x^{(k)})}{f(x^{(k)})-f(x^{(k-1)})}cdot bigl(x^{(k)}-x^{(k-1)}bigr),quad k=1,2,ldots

(3.21)

Аппроксимация сеточной функции

Замечания

1. Метод секущих является более экономичным по сравнению с методом Ньютона по количеству функций, подлежащих расчету: на каждой итерации в методе секущих необходимо рассчитать только значение f(x^{(k)}), так как величина f(x^{(k-1)}) уже подсчитана на предыдущей итерации.

2. Метод секущих может применяться и для решения сеточных уравнений. Для сеточной функции производные в методе секущих определяются так же, но для определения f(x^{(k)}) в промежуточных точках осуществляется аппроксимация (как правило, интерполяция) функции f(x_i) (рис. 3.16). На этом рисунке штриховой линией показана аппроксимационная кривая.

3. Для всех описанных модификаций скорость сходимости p по сравнению с методом касательных снижается: p&lt;2. Однако для некоторых из них (метод секущих) значение p&gt;1 и может достигать p=1,!5.

Пример 3.16. Методом секущих найти корень уравнения x^3-x+1=0 с точностью varepsilon=0,!001.

Решение

1. Зададим начальное приближение x^{(0)}=-2(см. пример 3.12).

2. Для вычисления f'(x^{(0)}) зададим delta=0,!1. Тогда

f'(x^{(0)})cong frac{f(-2)-f(-2,!1)}{0,!1}= frac{-5-(-6,!161)}{0,!1}= 11,!61.

Отсюда x^{(1)}= x^{(0)}-frac{f(x^{(0)})}{f'(x^{(0)})}=-2-frac{-5}{11,!61}=-1,!36934.

Дальнейшие расчеты выполняются по формуле (3.21):

begin{aligned}x^{(2)}&=x^{(1)}-frac{f(x^{(1)})}{f(x^{(1)})-f(x^{(0)})}cdot bigl(x^{(1)}-x^{(0)}bigr)=-1,!56934-frac{-1,!29567}{3,!704325}cdot0,!43066=-1,!41871;\[2pt] x^{(3)}&=x^{(2)}-frac{f(x^{(2)})}{f(x^{(2)})-f(x^{(1)})}cdot bigl(x^{(2)}-x^{(1)}bigr)=-1,!41871-frac{-1,!43678}{0,!858893}cdot0,!15063=-1,!34211;\[2pt] x^{(4)}&=x^{(3)}-frac{f(x^{(3)})}{f(x^{(3)})-f(x^{(2)})}cdot bigl(x^{(3)}-x^{(2)}bigr)=-1,!34211-frac{-1,!07538}{0,!361404}cdot0,!0766=-1,!32613;\[2pt] x^{(5)}&=x^{(4)}-frac{f(x^{(4)})}{f(x^{(4)})-f(x^{(3)})}cdot bigl(x^{(4)}-x^{(3)}bigr)=-1,!32613-frac{-1,!00603}{0,!069348}cdot0,!01598=-1,!32474;\[2pt] x^{(6)}&=x^{(5)}-frac{f(x^{(5)})}{f(x^{(5)})-f(x^{(4)})}cdot bigl(x^{(5)}-x^{(4)}bigr)=-1,!32474-frac{-1,!000139}{0,!005936}cdot0,!00139=-1,!32472cong x_{ast}.\[2pt] end{aligned}

Результаты расчетов приведены в табл. 3.16.

begin{aligned} mathit{Table~3.16}~&\ begin{array}{|c|c|c|c|c|c|c|c|} hline k& 0& 1& 2& 3& 4& 5& 6\hline begin{matrix}{}\[-8pt]{}end{matrix} x^{(k)}&-2,!00000&-1,!56934&-1,!41871&-1,!34211&-1,!32613&-1,!32474&-1,!32472\hline begin{matrix}{}\[-8pt]{}end{matrix} bigl|x^{(k)}-x^{(k-1)}bigr|&-& 0,!43066& 0,!15063& 0,!07660& 0,!01598& 0,!00139& 0,!00002 \hline end{array}& end{aligned}

Очевидно, метод сходится чуть хуже метода Ньютона (см. пример 3.12), однако скорость сходимости выше линейной.

Математический форум (помощь с решением задач, обсуждение вопросов по математике).

Кнопка "Поделиться"

Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.

Добавить комментарий