-
Экстремумы функций двух и трёх переменных
Определение
1
Точка
называется
точкой максимума функции
,
если
для любых точек
,
принадлежащих
окрестности точки
,
выполняется неравенство:
.
Определение
2
Точка
называется
точкой минимума функции
,
если
для любых точек
,
принадлежащих окрестности точки
,
выполняется
неравенство:
.
Определение
3
Точки
максимума и минимума называются
точками
экстремума
функции.
Теорема
1 (необходимое условие экстремума)
Если
точка
является точкой экстремума функции
,
то её частные производные в точке
равны нулю или не существуют.
При
доказательстве теоремы 1 используются
определения частных производных и
теорема о необходимых условиях экстремума
функции одной переменной.
Замечание
1.
Аналогично формулируются определения
1 и 2 и теорема 1 для функции трёх и более
переменных.
Теорема
2
(достаточные
условия экстремума функции двух
переменных)
Если
функция
дважды дифференцируема в критической
точке
и её окрестности и определитель
,
то в точке
есть экстремум. Причём, если
,
то точка
является точкой минимума функции, а
если
,
то точка
является точкой максимума.
Замечание
2.
Если определитель
,
то в точке
нет экстремума, при этом точку
называют седловой точкой. Если
,
то вопрос об экстремуме в точке
остаётся нерешённым, нужны исследования
функции
по её производным более высокого порядка.
Теорема
3
(достаточные
условия экстремума функции трёх
переменных)
Пусть
функция
дважды дифференцируема в
критической точке
и её окрестности. Определитель
имеет все главные диагональные миноры
,
,
положительные, то
–точка минимума функции
.
Если
,
и
, то точка
– точка максимума функции
.
Замечание
3.
Если
критическая точка функции
и
,
но не выполняются условия теоремы 3, то
в точке
нет экстремума, при этом точка
называется седловой точкой. Если все
,
то вопрос об экстремуме в точке
решается с помощью производных более
высокого порядка.
Пример
1.
Найти экстремумы функции:
.
Решение.
;
.
.
Получили
две точки
и
;
;
а)
Исследуем точку
:
;
;
.
Тогда
точка
не является точкой экстремума.
б)
Исследуем точку
:
;
;
.
Тогда
точка
является точкой экстремума. Причём так
как
,
то точка
является точкой минимума функции:
.
Ответ:
-
Условный экстремум
Пусть
задана функция
на множестве
.
Требуется найти экстремумы функции
,
если
и
связаны некоторым условием
,
называемым уравнением
связи.
Определение
4.
Точка
называется точкой
условного экстремума
функции
при выполнении дополнительных условий
– уравнений связи.
Для
нахождения точек условного экстремума
существует два метода: метод прямого
отыскания и метод Лагранжа. Прямой
метод состоит в том, что из уравнения
связи
выражается одна из переменных через
другую, и её подставляют в функцию
.
Получают функцию одной переменной, для
которой и решают задачу нахождения
обычного экстремума. Такой метод
применяют тогда, когда удаётся из
уравнения связи выразить одну переменную
через другую.
Пример
2.
Найти условный экстремум функции
при
условии
Решение.
Используем метод прямого отыскания
точек условного экстремума. Из условия
выразим
и подставим его в функцию
.
Тогда
Найдём
для функции
обычный экстремум.
,
– +
x
Следовательно,
– точка минимума функции
.
Подставляем
в функцию
и получим:
.
Ответ:
.
Определение
5.
Функция
называется функцией
Лагранжа,
а коэффициент λ
–
множителем
Лагранжа.
Замечание
4.
Если связи не одно уравнение, а несколько
(например,
),
то функция Лагранжа для функции
записывается с
множителями Лагранжа:
Теорема
4
(необходимое
условие поиска условного экстремума)
Пусть
функции
и
,
дифференцируемые в точке
а
является точкой условного экстремума
функции
при условии
.
Тогда найдется такое число
,
при котором точка
является критической для функции
Лагранжа
.
Метод
Лагранжа
поиска условного экстремума состоит в
следующем:
1)
составляют функцию Лагранжа
;
2)
находят её частные производные по
;
3)
приравнять частные производные к нулю
и решают систему уравнений
;
4)
исследуют найденную в результате решения
системы точку
при найденном значении
и решают задачу обычного экстремума
для
.
Теорема
5 (достаточное условие поиска условного
экстремума для случая одного уравнения
связи)
Пусть
точка
и
найдены из решения системы
.
Пусть
определитель
.
Если
,
то функция
имеет в точке
условный максимум.
Если
,
то функция
имеет в точке
условный минимум.
Пример
3.
Методом Лагранжа найти условный экстремум
для функции
при условии
.
Решение.
Составим функцию Лагранжа
.
Найдём
её частные производные по
:
при
.
Выясним
характер точки
по теореме 5:
;
;
;
;
.
Составим
определитель:
.
Так
как
,
то
– точка условного минимума.
.
Ответ:
.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Условный экстремум. Метод множителей Лагранжа. Вторая часть.
Продолжим разбор примеров на нахождение условного экстремума функций нескольких переменных. В первой части мы работали с функциями двух переменных, а здесь обратимся к функциям трёх переменных. Если понадобятся примеры для функций большего количества переменных, отпишите мне, пожалуйста, на форум или в комментариях.
Пример №4
Найти условный экстремум функции $u=2x+y-z+1$, если переменные $x$ и $y$ удовлетворяют уравнению связи $x^2+y^2+2z^2=22$.
Решение
Обозначим $f(x,y,z)=x^2+y^2+2z^2-22$. Для нахождения условного экстремума функции трёх переменных $u(x,y,z)$ составим функцию Лагранжа, которая будет иметь вид:
$$F(x,y,z)=u(x,y,z)+lambdacdot{f(x,y,z)}=2x+y-z+1+lambdacdotleft(x^2+y^2+2z^2-22right)$$
Составляем систему уравнений:
$$left{begin{aligned}
& F_{x}^{‘}=0;\
& F_{y}^{‘}=0;\
& F_{z}^{‘}=0;\
& f(x,y,z)=0.
end{aligned} right.
Rightarrow
left{begin{aligned}
& 2+2lambda{x}=0;\
& 1+2lambda{y}=0;\
& -1+4lambda{z}=0;\
& x^2+y^2+2z^2=22.
end{aligned} right.
Rightarrow
left{begin{aligned}
& 1+lambda{x}=0;\
& 1+2lambda{y}=0;\
& -1+4lambda{z}=0;\
& x^2+y^2+2z^2=22.
end{aligned} right.
$$
Решая данную систему, получим две точки: $M_1(4;2;-1)$ (при $lambda=-frac{1}{4}$) и $M_2(-4;-2;1)$ (при $lambda=frac{1}{4}$). Процесс решения системы я скрыл под примечание.
Как мы решили систему? показатьскрыть
Характер экстремума в найденных точках можно выяснить либо с помощью знака $d^2F$, либо же с помощью угловых миноров матрицы $L$, о чём говорилось в первой части данной темы. В этом примере и примере №6 определим характер экстремума с помощью угловых миноров матрицы $L$, а в примере №7 – с помощью знака $d^2F$. Для наглядности я запишу матрицу $L$ в общем виде:
$$
L=left(begin{array} {cccc}
0 & frac{partial{f}}{partial{x}} & frac{partial{f}}{partial{y}} & frac{partial{f}}{partial{z}}\
frac{partial{f}}{partial{x}} & frac{partial^2F}{partial{x}^2} & frac{partial^2F}{partial{x}partial{y}} & frac{partial^2F}{partial{x}partial{z}}\
frac{partial{f}}{partial{y}} & frac{partial^2F}{partial{x}partial{y}} & frac{partial^2F}{partial{y}^2}& frac{partial^2F}{partial{y}partial{z}}\
frac{partial{f}}{partial{z}} & frac{partial^2F}{partial{x}partial{z}} & frac{partial^2F}{partial{y}partial{z}} & frac{partial^2F}{partial{z}^2}\
end{array}right)
$$
Находим искомые частные производные и подставляем их в матрицу $L$:
$$f_{x}^{‘}=2x;;f_{y}^{‘}=2y;;f_{z}^{‘}=4z;\
F_{xx}^{”}=2lambda;;F_{xy}^{”}=0;;F_{xz}^{”}=0;;F_{yy}^{”}=2lambda;;F_{yz}^{”}=0;;F_{zz}^{”}=4lambda.$$
Соответственно, матрица $L$ будет такой: $L=left(begin{array}{cccc}0 & 2x & 2y & 4z\2x & 2lambda & 0 & 0\2y & 0 & 2lambda & 0\4z & 0 & 0 & 4lambdaend{array}right)$. Используем правило в первой части темы. Нам нужно найти знаки угловых миноров $H_{2m+1},; H_{2m+2},ldots,H_{m+n}$ матрицы $L$. Параметр $m$ равен количеству условий связи, а параметр $n$ равен количеству переменных. В данной задаче мы имеем одно условие связи и три переменных, поэтому $m=1$ и $n=3$. Так как $2m+1=3$ и $m+n=4$, то нужно найти угловые миноры $H_3$ и $H_4$. Запишем эти миноры (минор $H_4$ совпадает с определителем матрицы $L$). В принципе, указанные миноры несложно вычислить в общем виде, что мы и сделаем. Минор $H_3$ вычислим с помощью готовой формулы, а минор $H_4$ вычислим с помощью разложения по четвёртой строке:
$$H_3=left|begin{array}{ccc} 0 & 2x & 2y\2x & 2lambda & 0\2y & 0 & 2lambdaend{array}right|=-8y^2lambda-8x^2lambda=-8lambdacdotleft(x^2+y^2right);\
H_4=left|begin{array}{cccc}0 & 2x & 2y & 4z\2x & 2lambda & 0 & 0\2y & 0 & 2lambda & 0\4z & 0 & 0 & 4lambdaend{array}right|=-4zcdotleft|begin{array}{ccc}2x & 2y & 4z\2lambda & 0 & 0\0 & 2lambda & 0end{array}right|+4lambdacdotleft|begin{array}{ccc}0 & 2x & 2y\2x & 2lambda & 0\2y & 0 & 2lambdaend{array}right|=\
=-4zcdot{16lambda^2z}+4lambdacdotleft(-8y^2lambda-8x^2lambdaright)=-32lambda^2cdotleft(x^2+y^2+2z^2right).$$
Кстати, по полученным выражениям уже можно сделать вывод, что знак $H_3$ противоположен знаку $lambda$, а $H_4<0$. Поэтому вычислять значения указанных миноров просто нет необходимости, так как нас интересует лишь их знак. Однако в стандартных задачах типовых расчётов требуется считать до конца, поэтому вычислим значения угловых миноров $H_3$ и $H_4$:
$$
begin{aligned}
& H_3(M_1)=-8cdotleft(-frac{1}{4}right)left(4^2+2^2right)=40;;H_4(M_1)=-32cdotleft(-frac{1}{4}right)^2cdotleft(4^2+2^2+2cdot(-1)^2right)=-44;\
& H_3(M_2)=-8cdotfrac{1}{4}left((-4)^2+(-2)^2right)=-40;;H_4(M_2)=-32cdotleft(frac{1}{4}right)^2cdotleft((-4)^2+2^2+(-2)cdot 1^2right)=-44.
end{aligned}
$$
Знаки $H_3(M_1)$ и $H_4(M_1)$ чередуются, причем знак $H_3(M_1)$ совпадает с знаком $(-1)^{m+1}=(-1)^2=1$, поэтому $M_1$ – точка условного максимума. Знаки $H_3(M_2)$ и $H_4(M_2)$ совпадают с знаком $(-1)^{m}=(-1)^1=-1$, поэтому $M_2$ – точка условного минимума.
$$
begin{aligned}
& u_{min}=u(M_2)=-10;\
& u_{max}=u(M_1)=12.
end{aligned}
$$
Ответ: в точке $M_1(4;2;-1)$ функция имеет условный максимум, $u_{max}=12$. В точке $M_2(-4;-2;1)$ функция имеет условный минимум, $u_{min}=-10$.
Пример №5
Найти условный экстремум функции $u=2x+y^2-2z^2$, если переменные $x$ и $y$ удовлетворяют уравнениям связи $2x+y-5z=6$, $-x+3y-z=3$.
Решение
Для нахождения условного экстремума функции трёх переменных $u(x,y,z)$ можно составить функцию Лагранжа, которая будет иметь такой вид:
$$F(x,y,z)=2x+y^2-2z^2+lambda_1cdotleft(2x+y-5z-6right)+lambda_2cdotleft(-x+3y-z-3right)$$
Дальнейшее решение в этом случае предполагало бы составление системы уравнений, аналогичных размещённым в предыдущих задачах:
$$left{begin{aligned}
& F_{x}^{‘}=0;\
& F_{y}^{‘}=0;\
& F_{z}^{‘}=0;\
& 2x+y-5z-6=0;\
& -x+3y-z-3=0.
end{aligned} right.
Rightarrow
left{begin{aligned}
& 2+2lambda_1-lambda_2=0;\
& 2y+lambda_1+3lambda_2=0;\
& -4z-5lambda_1-lambda_2=0;\
& 2x+y-5z-6=0;\
& -x+3y-z-3=0.
end{aligned} right.$$
Решаем данную систему, получив точки возможного экстремума. Затем, после определения знака $d^2F$ в каждой найденной точке, делаем выводы о наличии в означенных точках экстремумов. Однако в данном случае можно поступить проще, выразив из уравнений связи переменные $x$ и $y$ через $z$. Для этого перенесём слагаемые, содержащие $z$, в правые части уравнений связи, а затем применим метод Крамера:
$$left{begin{aligned}
& 2x+y=5z+6;\
& -x+3y=z+3end{aligned}right.$$
$$Delta=left|begin{array} {cc} 2 & 1\ -1 & 3 end{array}right|=7;;
Delta_x=left|begin{array} {cc} 5z+6 & 1\ z+3 & 3 end{array}right|=14z+15;;
Delta_y=left|begin{array} {cc} 2 & 5z+6\ -1 & z+3 end{array}right|=7z+12.$$
$$x=frac{Delta_x}{Delta}=frac{14z+15}{7}=2z+frac{15}{7};;y=frac{Delta_y}{Delta}=frac{7z+12}{7}=z+frac{12}{7}.$$
Полученный результат легко истолковать с геометрической точки зрения. Уравнения $2x+y-5z=6$ и $-x+3y-z=3$ определяют плоскости в трёхмерном пространстве. Линия их пересечения есть прямая, параметрические уравнения которой, по сути, мы и получили выше.
Подставляя $x=2z+frac{15}{7}$ и $y=z+frac{12}{7}$ в заданную функцию $u$, получим функцию одной переменной $z$. Обозначим эту функцию как $f(z)$:
$$f(z)=2left(2z+frac{15}{7}right)+left(z+frac{12}{7}right)^2-2z^2=-z^2+frac{52z}{7}+frac{354}{49}$$
Осталось найти экстремум функции $f(z)$:
$$
f'(z)=-2z+frac{52}{7};\
-2z+frac{52}{7}=0;; z=frac{26}{7}.
$$
Так как $f”(z)=-2<0$, то $z=frac{26}{7}$ – точка максимума функции $f(z)$, при этом максимум равен $f_{max}=fleft(frac{26}{7}right)=frac{1030}{49}$.
Напомню, что значения функции $f(z)$ при заданных условиях связи совпадают с значениями функции $u(x,y,z)$, т.е. найденный экстремум функции $f(z)$ и есть искомым условным экстремумом функции $u(x,y,z)$. В принципе, несложно также указать остальные координаты точки условного экстремума:
$$
x=2z+frac{15}{7}=2cdotfrac{26}{7}+frac{15}{7}=frac{67}{7};\
y=z+frac{12}{7}=frac{26}{7}+frac{12}{7}=frac{38}{7}.\
$$
Итак, $left(frac{67}{7};frac{38}{7};frac{26}{7}right)$ – точка условного максимума функции $u(x,y,z)$. Разумеется, выразить две переменные через третью представляется возможным далеко не всегда. В следующем примере мы разберём такой случай.
Ответ: в точке $left(frac{67}{7};frac{38}{7};frac{26}{7}right)$ функция имеет условный максимум, $u_{max}=frac{1030}{49}$.
Пример №6
Исследовать функцию $u(x,y,z)=xy+yz+3$ на условный экстремум при условиях связи $x^2+y^2=2$, $y+z=2$, если $x>0$, $y>0$, $z>0$.
Решение
Обозначим $f(x,y,z)=x^2+y^2-2$, $g(x,y,z)=y+z-2$. Запишем функцию Лагранжа:
$$F(x,y,z)=u(x,y,z)+lambda_1cdot{f(x,y,z)}+lambda_2cdot{g(x,y,z)}=xy+yz+3+lambda_1cdotleft(x^2+y^2-2right)+lambda_2cdotleft(y+z-2right)$$
Составим систему уравнений:
$$left{begin{aligned}
& F_{x}^{‘}=0;\
& F_{y}^{‘}=0;\
& F_{z}^{‘}=0;\
& x^2+y^2-2=0;\
& y+z-2=0.
end{aligned} right.
Rightarrow
left{begin{aligned}
& y+2lambda_1x=0;\
& x+z+2lambda_1y+lambda_2=0;\
& y+lambda_2=0;\
& x^2+y^2-2=0;\
& y+z-2=0.
end{aligned} right.$$
Из третьего уравнения имеем: $lambda_2=-y$; из пятого уравнения: $z=2-y$; из четвёртого уравнения: $x=sqrt{2-y^2}$ (берём корень со знаком “плюс”, так как по условию $x>0$). Отметим, что $yneqsqrt{2}$, так как если бы $y=sqrt{2}$, то из третьего уравнения получили бы $x^2=0$, $x=0$. А этого быть не может, так как $x>0$ по условию. Так как $yneqsqrt{2}$, то из первого уравнения получим: $lambda_1=-frac{y}{2x}=-frac{y}{2sqrt{2-y^2}}$. Подставляя выражения для $lambda_1$, $lambda_2$, $z$, $x$ во второе уравнение, получим:
$$
sqrt{2-y^2}+2-y+2cdotleft(-frac{y}{2sqrt{2-y^2}}right)cdot{y}+(-y)=0;\
sqrt{2-y^2}+2-2y-frac{y^2}{sqrt{2-y^2}}=0.
$$
Домножая обе части равенства на $sqrt{2-y^2}$ и упрощая, получим:
$$
2-2y^2+(2-2y)sqrt{2-y^2}=0;\
(1-y)(1+y)+(1-y)sqrt{2-y^2}=0;\
(1-y)cdotleft(1+y+sqrt{2-y^2}right)=0.
$$
Так как по условию $y>0$, то $1+y+sqrt{2-y^2}>0$, поэтому последнее равенство возможно лишь при $y-1=0$, т.е. $y=1$. Значения остальных переменных таковы:
$$x=sqrt{2-1^2}=1;;z=2-1=1;;lambda_1=-frac{1}{2cdot{1}}=-frac{1}{2};;lambda_2=-1.$$
Итак, получили точку $M(1;1;1)$. Характер экстремума в данной точке можно выяснить либо с помощью знака $d^2F$ либо же с помощью миноров матрицы $L$, о чём говорилось в первой части данной темы. В этом примере определим характер экстремума с помощью угловых миноров матрицы $L$, а в следующем примере – с помощью знака $d^2F$. Запишем матрицу $L$ в общем виде:
$$
L=left(begin{array} {ccccc}
0 & 0 & frac{partial{f}}{partial{x}} & frac{partial{f}}{partial{y}} & frac{partial{f}}{partial{z}}\
0 & 0 & frac{partial{g}}{partial{x}} & frac{partial{g}}{partial{y}} & frac{partial{g}}{partial{z}}\
frac{partial{f}}{partial{x}} & frac{partial{g}}{partial{x}} & frac{partial^2F}{partial{x}^2} & frac{partial^2F}{partial{x}partial{y}} & frac{partial^2F}{partial{x}partial{z}}\
frac{partial{f}}{partial{y}} & frac{partial{g}}{partial{y}} & frac{partial^2F}{partial{x}partial{y}} & frac{partial^2F}{partial{y}^2}& frac{partial^2F}{partial{y}partial{z}}\
frac{partial{f}}{partial{z}} & frac{partial{g}}{partial{z}} & frac{partial^2F}{partial{x}partial{z}} & frac{partial^2F}{partial{y}partial{z}} & frac{partial^2F}{partial{z}^2}\
end{array}right)
$$
Запишем искомые частные производные и определим их значение в точке $M$.
$$
f_{x}^{‘}=2x;;f_{y}^{‘}=2y;;f_{z}^{‘}=0;\
g_{x}^{prime}=0;;g_{y}^{prime}=1;;g_{z}^{prime}=1;\
F_{xx}^{”}=2lambda_1;;F_{xy}^{”}=1;;F_{xz}^{”}=0;;F_{yy}^{”}=2lambda_1;;F_{yz}^{”}=1;;F_{zz}^{”}=0.
$$
Подставляя $x=y=z=1$, $lambda_1=-frac{1}{2}$ и $lambda_2=-1$, получим:
$$
f_{x}^{‘}(M)=2;;f_{y}^{‘}(M)=2;;f_{z}^{‘}(M)=0;\
g_{x}^{prime}(M)=0;;g_{y}^{prime}(M)=1;;g_{z}^{prime}(M)=1;\
F_{xx}^{”}(M)=-1;;F_{xy}^{”}(M)=1;;F_{xz}^{”}(M)=0;;F_{yy}^{”}(M)=-1;;F_{yz}^{”}(M)=1;;F_{zz}^{”}(M)=0.
$$
Матрица $L$ примет следующий вид: $L=left(begin{array} {ccccc} 0 & 0 & 2 & 2 & 0\0 & 0 & 0 & 1 & 1\2 & 0 & -1 & 1 & 0\2 & 1 & 1 & -1 & 1\0 & 1 & 0 & 1 & 0 end{array}right)$. Обратимся к правилу в первой части темы. Напомню, что нам нужно найти знаки угловых миноров $H_{2m+1},; H_{2m+2},ldots,H_{m+n}$ матрицы $L$. Параметр $m$ равен количеству условий связи, а параметр $n$ равен количеству переменных. В данной задаче мы имеем два условия связи и три переменных, поэтому $m=2$ и $n=3$. Так как $2m+1=5$ и $m+n=5$, то нужно найти лишь один минор $H_5$.
Так как матрица $L$ пятого порядка, то минор $H_5$ совпадает с определителем матрицы $L$. Применяя, к примеру, метод эффективного понижения порядка, будем иметь:
$$H_5=left|begin{array} {ccccc} 0 & 0 & 2 & 2 & 0\0 & 0 & 0 & 1 & 1\2 & 0 & -1 & 1 & 0\2 & 1 & 1 & -1 & 1\0 & 1 & 0 & 1 & 0 end{array}right|
begin{array} {l} phantom{0} \ phantom{0} \ phantom{0} \ phantom{0}\V-IV end{array}=
left|begin{array} {ccccc} 0 & 0 & 2 & 2 & 0\0 & 0 & 0 & 1 & 1\2 & 0 & -1 & 1 & 0\2 & 1 & 1 & -1 & 1\-2 & 0 & -1 & 2 & -1 end{array}right|=
left|begin{array} {cccc} 0 & 2 & 2 & 0\0 & 0 & 1 & 1\2 & -1 & 1 & 0\-2 & -1 & 2 & -1 end{array}right|
begin{array} {l} phantom{0} \ phantom{0} \ phantom{0} \ IV+III end{array}=\
=left|begin{array} {cccc} 0 & 2 & 2 & 0\0 & 0 & 1 & 1\2 & -1 & 1 & 0\0 & -2 & 3 & -1 end{array}right|=
2cdotleft|begin{array} {ccc} 2 & 2 & 0\0 & 1 & 1\-2 & 3 & -1end{array}right|=2cdot(-12)=-24.$$
Так как $(-1)^{m+1}=(-1)^3=-1$, то знаки $H_{2m+1}$ и $(-1)^{m+1}$ совпадают. Следовательно, функция $u$ имеет в точке $(1;1;1)$ условный максимум, при этом $u_{max}=5$. Условный экстремум функции $u$ найден, осталось лишь записать ответ.
Ответ: в точке $left(1;1;1right)$ функция имеет условный максимум, $u_{max}=5$.
Пример №7
Найти условные экстремумы функции $u=xyz+4$, если $x+y+z=5$ и $xy+yz+xz=8$.
Решение
Применим метод множителей Лагранжа для исследования заданной функции трёх переменных. Составим функцию Лагранжа:
$$F=xyz+4+lambda_1(x+y+z-5)+lambda_2(xy+yz+xz-8)$$
Запишем соответствующую систему уравнений:
$$
begin{equation}
left{begin{aligned}
& yz+lambda_1+lambda_2y+lambda_2z=0;\
& xz+lambda_1+lambda_2z+lambda_2x=0;\
& xy+lambda_1+lambda_2y+lambda_2x=0;\
& x+y+z=5;\
& xy+yz+xz=8.
end{aligned}right.
end{equation}
$$
Процесс решения системы (1) довольно громоздкий, поэтому я буду скрывать под примечания некоторые преобразования. Выберем первые два уравнения, из которых выразим $lambda_1$ и $lambda_2$, применив метод Крамера:
$$left{begin{aligned}
& lambda_1+lambda_2(y+z)=-yz;\
& lambda_1+lambda_2(x+z)=-xz.end{aligned}right.$$
$$Delta=left|begin{array} {cc} 1 & y+z\ 1 & x+z end{array}right|=x-y;;
Delta_x=left|begin{array} {cc} -yz & y+z\ -xz & x+z end{array}right|=xz^2-yz^2;;
Delta_y=left|begin{array} {cc} 1 & -yz\ 1 & -xz end{array}right|=yz-xz.$$
Рассмотрим два случая: $Delta=0$ и $Deltaneq{0}$. Если $Delta=0$, т.е. $y=x$, то получим две точки: $M_1left(frac{4}{3};frac{4}{3};frac{7}{3}right)$ (при $lambda_1=frac{16}{9}$, $lambda_2=-frac{4}{3}$) и $M_2(2;2;1)$ (при $lambda_1=4$, $lambda_2=-2$).
Как мы получили эти точки? показатьскрыть
Если же $Deltaneq{0}$, т.е. $x-yneq{0}$, то получим:
$$lambda_1=frac{xz^2-yz^2}{x-y}=frac{z^2(x-y)}{x-y}=z^2;;lambda_1=frac{yz-xz}{x-y}=frac{-z(x-y)}{x-y}=-z.$$
Подставляя $lambda_1=z^2$ и $lambda_2=-z$ в систему уравнений (1), будем иметь:
$$
begin{equation}
left{begin{aligned}
& z^2+xy-xz-yz=0;\
& x+y+z=5;\
& xy+yz+xz=8.
end{aligned} right.
end{equation}
$$
Из данной системы получим: $z_1=frac{4}{3}$ и $z_2=2$.
Как мы получили эти значения? показатьскрыть
Если $z_1=frac{4}{3}$, то $lambda_1=frac{16}{9}$ и $lambda_2=-frac{4}{3}$. Получим две точки: $M_3left(frac{4}{3};frac{7}{3};frac{4}{3}right)$ и $M_4left(frac{7}{3};frac{4}{3};frac{4}{3}right)$.
Как мы получили эти точки? показатьскрыть
Если $z_2=2$, то $lambda_1=4$ и $lambda_2=-2$. Получим две точки: $M_5(1;2;2)$ и $M_6(2;1;2)$.
Как мы получили эти точки? показатьскрыть
Подытожим всё вышеизложенное, записав найденные точки и соответствующие им значения $lambda_1$ и $lambda_2$:
$$begin{aligned}
&M_1left(frac{4}{3};frac{4}{3};frac{7}{3}right),;lambda_1=frac{16}{9},;lambda_2=-frac{4}{3};\
&M_2(2;2;1),;lambda_1=4,;lambda_2=-2;\
&M_3left(frac{4}{3};frac{7}{3};frac{4}{3}right),;lambda_1=frac{16}{9},;lambda_2=-frac{4}{3};\
&M_4left(frac{7}{3};frac{4}{3};frac{4}{3}right),;lambda_1=frac{16}{9},;lambda_2=-frac{4}{3};\
&M_5(1;2;2),;lambda_1=4,;lambda_2=-2;\
&M_6(2;1;2),;lambda_1=4,;lambda_2=-2.end{aligned}$$
Чтобы выяснить характер условного экстремума в данных точках, запишем $d^2F$, предварительно найдя соответствующие частные производные:
$$F_{xx}^{”}=0;; F_{yy}^{”}=0;;F_{zz}^{”}=0;;F_{xy}^{”}=z+lambda_2;;F_{xz}^{”}=y+lambda_2;;F_{yz}^{”}=x+lambda_2.\
d^2F=2left(z+lambda_2right)dxdy+2left(y+lambda_2right)dxdz+2left(x+lambda_2right)dydz$$
Если в рассматриваемой точке $y=z$, то в этой точке $d^2F=-2left(x+lambda_2right)dy^2$. Если в некоторой точке $yneq{z}$, то:
$$d^2F=left(2left(z+lambda_2right)cdotfrac{x-z}{z-y}+2left(y+lambda_2right)frac{y-x}{z-y}+2left(x+lambda_2right)frac{(y-x)(x-z)}{(z-y)^2}right)dx^2$$
Как мы получили эти формулы? показатьскрыть
Теперь осталось лишь подставить в формулы для $d^2F$ координаты найденных точек и соответствующие значения $lambda_1$ и $lambda_2$. Для удобства эти данные я поместил в таблицу:
Ответ: $u_{min}=8$, $u_{max}=frac{220}{27}$.
Экстремум функции трёх переменных
Содержание:
- Некоторые сведения о квадратичных формах
- Функции трех переменных
Достаточные условия экстремума функции можно сформулировать и языке квадратичной формы, изучаемой в разделе «Аналитическая геометрия и линейная алгебра». Достаточные условия экстремума функции многих (и не только двух) переменных сводятся к положительной (или отрицательной) определенности квадратичной формы
где — значение в исследуемой точке.
Прежде чем сформулировать соответствующие теоремы приведем некоторые сведения из о квадратичных формах.
Некоторые сведения о квадратичных формах
Функция вида
называется квадратичной формой от переменных коэффициенты зависят от
Если для всех то квадратичная форма называется симметричной.
По этой ссылке вы найдёте полный курс лекций по высшей математике:
Симметричная квадратичная форма от переменных называется положительно определенной (отрицательно определенной), если она имеет положительные (отрицательные) значения при всех значениях переменных не равных одновременно нулю.
Примеры с решением
Пример 1.
Проверить положительную определенность формы
Решение:
Форму можно представить в виде
Следовательно предложенная для проверки квадратичная форма является положительно определенной.
Положительно определенные и отрицательно определенные квадратичные формы объединяют под названием знакоопреде-ленных форм.
Если симметричная квадратичная форма имеет как положительные, так и отрицательные значения, то она называется знакопеременной.
Возможно вам будут полезны данные страницы:
Пример 2.
Показать знакопеременность формы
Решение:
Значение формы равно +6 при и равно —1 при Следовательно, предложенная для проверки квадратичная форма принимает как положительные, так и отрицательные значения и поэтому является знакопеременной.
Сформулируем критерий знакоопределенности симметричной квадратичной формы. Будем называть матрицу
матрицей квадратичной формы
Определители этой матрицы
называются главными минорами матрицы квадратичной формы
Функции трех переменных
Другая трудность возникает при геометрическом истолковании функции, так как в пространстве «не хватает размерности». Сравнительно лучше дело обстоит для функций трех переменных В этом случае областью определения служит или все пространство аргументов или некоторая его часть, т. е. одна или несколько областей в пространстве (см. п. 12.2), хотя теперь понятие невырожденности должно быть естественно изменено), и потому эту область определения можно представить вполне наглядно. Например, для функции областью определения служит
все пространство, тогда как функция определена только если
или
т. е. в данном случае областью определения служит шар радиуса I с центром в начале координат.
Аналогично п. 12.1 можно рассматривать поверхности уровня функции т. е. такие поверхности в пространстве на которых эта функция постоянна,
Точки разрыва, если они имеются, находятся в пространстве аргументов и потому их также можно представить наглядно. При этом для функции трех переменных могут быть отдельные точки, линии и даже целые поверхности разрыва, т. е. поверхности, целиком состоящие из точек разрыва. Например, при изучении различных сред многие из рассматриваемых величин имеют разрывы на поверхностях раздела (вода-воздух, стекло-воздух и т. п.).
Лекции:
- Преобразование графиков тригонометрических функций
- Геометрический смысл производной
- Производная показательно степенной функции
- Математика для чайников
- Область значения функции
- Линейные преобразования
- Разложение в ряд Фурье четных и нечетных функций
- Функции многих переменных
- Наибольшее и наименьшее значение функции
- Уравнение плоскости
Содержание:
Функции нескольких переменных:
Многим явлениям, в том числе экономическим, присуща многофакторная зависимость. Исследование таких зависимостей потребовало совершенствования математического аппарата, в частности введения понятия функции нескольких переменных.
Определение. Пусть имеется
Например, формула задает объем цилиндра как функцию двух переменных: (радиуса основания) и (высоты).
Переменные называются независимыми переменными или аргументами, — зависимой переменной, а символ означает закон соответствия. Множество называется областью определения функции. Очевидно, это подмножество -мерного пространства.
Пример:
Найти область определения функции:
Решение:
а)Область определения задается условием: или т.е. представляет собой единичный круг с центром в начале координат.
б) Имеем т.е. область определения — это плоскость за исключением координатных прямых и
Рассмотрим некоторые примеры функций нескольких переменных.
1. Функция где — постоянные числа, называется линейной. Ее можно рассматривать как сумму линейных функций от переменных
2.Функция,— постоянные числа) называется квадратической. В отличие от предыдущего примера квадратическая функция не является сепарабельной, т.е. не раскладывается в сумму функций одной переменной.
3. В § 5.6 была определена функция полезности — одно из базовых понятий экономической теории. Многомерный ее аналог — это функция выражающая полезность от п приобретенных товаров. Чаще всего встречаются следующие ее виды:
— логарифмическая функция;
Здесь
Такая функция называется функцией постоянной эластичности.
Также на случай переменных обобщается понятие производственной функции (см. § 5.6), выражающей результат производственной деятельности от обусловивших его факторов Приведем здесь наиболее часто встречающиеся виды производственных функций (—величина общественного продукта, — затраты труда, — объем производственных фондов), полагая для простоты
а) функция Кобба—Дугласа
б) функция с постоянной эластичностью замещения:
В настоящей главе мы будем вести изложение в основном для функций двух переменных при этом практически все понятия и теоремы, сформулированные для легко переносятся и на случай Однако рассмотрение случая двух переменных позволяет использовать наглядную геометрическую иллюстрацию основных понятий настоящей главы.
Функцию двух переменных будем обозначать в дальнейшем Тогда ее область определения есть подмножество координатной плоскости
Окрестностью точки называется круг, содержащий точку (см. рис. 15.1).
Очевидно, круг на плоскости есть двумерный аналог интервала на прямой.
При изучении функций нескольких переменных во многом используется уже разработанный в предыдущих главах математический аппарат. А именно: любой функции можно поставить в соответствие пару функций одной переменной: при фиксированном значении функцию и при фиксированном значении функцию
Следует иметь в виду, что хотя функции и имеют одно и то же «происхождение», вид их может существенно различаться. Рассмотрим, например, функцию , выражающую величину вклада через лет при ставке . Очевидно, что это функция степенная по и показательная по .
Графиком функции двух переменных называется множество точек трехмерного пространства аппликата которых связана с абсциссой и ординатой у функциональным соотношением .
График функции двух переменных , вообще говоря, представляет собой некоторую поверхность в трехмерном пространстве.
Для построения графика функции полезно рассматривать функции одной переменной представляющие сечения графика плоскостями, параллельными координатным плоскостям т.е. плоскостями
Пример:
Построить график функции
Решение:
Сечения поверхности плоскостями, параллельными координатным плоскостям представляют параболы (например, при и т.д.). В сечении поверхности координатной плоскостью получается окружность График функции представляет поверхность, называемую параболоидом (см. рис. 15.2). ►
Как видно, график функции двух переменных — значительно более сложный объект, чем график функции одной переменной. Как правило, построение поверхности оказывается довольно трудной задачей. В то же время поверхность в пространстве обладает гораздо меньшей наглядностью, чем линия на плоскости. Поэтому в случае двух переменных для изучения поведения функции желательно использовать другие, более наглядные инструменты. Важнейшим из них являются линии уровня.
Определение. Линией уровня функции двух переменных называется множество точек на плоскости, таких, что во всех этих точках значение функции одно и то же и равно . Число в этом случае называется уровнем.
На рис. 15.3 изображены линии уровня, соответствующие значениям Как видно, линия уровня состоит из двух непересекающихся кривых. Линия — самопересекающаяся кривая.
Многие примеры линий уровня хорошо известны и привычны. Например, параллели и меридианы на глобусе — это линии уровня функций широты и долготы. Синоптики публикуют карты с изображением изотерм — линий уровня температуры. В § 15.10 мы рассмотрим примеры использования линий уровня функций нескольких переменных в экономическом анализе. Построение линий уровня оказывается существенно более легкой задачей, чем построение графиков самих функций.
Пример:
Построить линии уровня функции
Решение:
Линия уровня — это кривая на плоскости задаваемая уравнением Это уравнение окружности с центром в точке и радиусом (рис. 15.4).
Точка—это вырожденная линия уровня, соответствующая минимальному значению функции достигаемому в точке . Линии уровня — концентрические окружности, радиус которых увеличивается с ростом ,причем расстояния между линиями с одинаковым шагом уровня уменьшаются по мере удаления от центра. Линии уровня позволяют представить график данной функции, который бы ранее построен на рис. 15.2. ►
Предел и непрерывность
Большая часть понятий математического анализа, определенных ранее для функций одной переменной, может быть перенесена на случай двух переменных.
Определение. Число называется пределом функции (или ), если для любого даже сколь угодно малого положительного числа найдется положительное число (зависящее от ), такое, что для всех точек , отстоящих от точки на расстояние меньшее, чем (т.е. при ), выполняется неравенство
Обозначается предел так:
Пример:
Найти предел
Решение:
Обозначим Условие равносильно тому, что Запишем предел в виде
Как правило, вычисление пределов функций двух переменных оказывается существенно более трудной задачей по сравнению со случаем одной переменной. Причина заключается в том, что на прямой существуют всего два направления, по которым аргумент может стремиться к предельной точке — а именно, справа и слева (см. § 6.2). На плоскости же таких направлений — бесконечное множество, и пределы функции по разным направлениям могут не совпадать.
Пример:
Доказать, что не существует.
Решение:
Будем приближаться к точке по прямым
Если
Получили, что значение предела зависит от углового коэффициента прямой. Но так как предел функции не должен зависеть от способа приближения точки к точке (например, по прямой ), то рассматриваемый предел не существует. ►
Определение. Функция называется непрерывной в точке если она: 1) определена в точке 2) имеет конечный предел при 3) этот предел равен значению функции в точке
Геометрический смысл непрерывности очевиден: график в точке представляет собой сплошную, нерасслаивающуюся поверхность.
Частные производные
Дадим аргументу приращение , аргументу — приращение Тогда функция получит наращенное значение Величина называется полным приращением функции в точке Если задать только приращение аргумента или только приращение аргумента , то полученные приращения функции соответственно называются частными.
Полное приращение функции, вообще говоря, не равно сумме частных, т.е.
Пример:
Найти частные и полное приращения функции
Решение:
Получили, что
Определение. Частной производной функции нескольких переменных по одной из этих переменных называется предел отношения соответствующего частного приращения функции к приращению рассматриваемой независимой переменной при стремлении последнего к нулю (если этот предел существует).
Обозначается частная производная так: или или
Таким образом, для функции по определению
Геометрический смысл частных производных функции в точке показан на рис. 15.5.
Пусть график функции представляет некоторую поверхность Тогда при мы получаем кривую — сечение этой поверхности соответствующей плоскостью.
В этом случае производная выражает угловой коэффициент касательной к кривой , в заданной точке т.е. где угол наклона касательной к оси Аналогично
Из определения частных производных (15.1), (15.2) следует, что для нахождения производной надо считать постоянной переменную , а для нахождения — переменную . При этом сохраняются известные из гл. 7 правила дифференцирования.
Пример:
Найти частные производные функций:
Решение:
а) Чтобы найти частную производную по , считаем постоянной величиной. Таким образом, Аналогично, дифференцируя по , считаем постоянной величиной, т.е.
б) При фиксированном у имеем степенную функцию от . Таким образом, При фиксированном функция является показательной относительно
Пример:
Поток пассажиров выражается функцией, где — число жителей, — расстояние между городами. Найти частные производные и пояснить их смысл.
Решение:
Производная показывает, что при одном и том же расстоянии между городами увеличение потока пассажиров пропорционально удвоенному числу жителей. Производная показывает, что при одной и той же численности жителей увеличение потока пассажиров обратно пропорционально квадрату расстояния между городами. ►
Дифференциал функции
Дифференциал функции определялся как главная, линейная относительно , часть приращения функции, равная произведению
Обобщая определение дифференциала функции на случай двух независимых переменных, приходим к следующему определению.
Определение. Дифференциалом функции называется сумма произведений частных производных этой функции на приращения соответствующих независимых переменных, т.е.
Учитывая, что для функций согласно (15.3) формулу дифференциала (15.3) можно записать в виде
или
Определение. Функция называется дифференцируемой в точке , если ее полное приращение может быть представлено в виде
где — дифференциал функции, — бесконечно малые при
Таким образом, дифференциал функции двух переменных, как и в случае одной переменной, представляет главную, линейную относительно приращений часть полного приращения функции.
Можно показать, что если полное приращение функции представляет геометрически приращение аппликаты поверхности , то дифференциал функции есть приращение аппликаты касательной плоскости к поверхности в данной точке, когда переменные получают приращения (см. рис. 15.6).
Следует отметить, что для функции одной переменной существование конечной производной и представление приращения функции в виде (9.1), т.е. , являются равнозначными утверждениями, и любое из них могло быть взято за определение дифференцируемости функции.
Для функции нескольких переменных дело обстоит иначе: существование частных производных является лишь необходимым, но недостаточным условием дифференцируемости функции.
Следующая теорема выражает достаточное условие дифференцируемости функции двух переменных.
Теорема. Если частные производные функции существуют в окрестности точки и непрерывны в самой точке , то функция дифференцируема в этой точке.
Производная по направлению. Градиент
Пусть функция определена в некоторой окрестности точки — некоторое направление, задаваемое единичным вектором, где ибо (или ); — косинусы углов, образуемых вектором с осями координат и называемые направляющими косинусами.
При перемещении в данном направлении точки в точку функция получит приращение называемое приращением функции в данном направлении (рис. 15.7).
Если , то, очевидно, следовательно,
Определение. Производной по направлению функции двух переменных называется предел отношения приращения функции в этом направлении к величине перемещения при стремлении последней к нулю, т.е.
Производная характеризует скорость изменения функции в направлении .
Очевидно, что рассмотренные ранее частные производные и представляют производные по направлениям, параллельным соответственно осям
Нетрудно показать, что
Рассмотрим понятие градиента функции
Определение. Градиентом функции называется вектор с координатами
Рассмотрим скалярное произведение (см. § 3.1) вектора и единичного вектора Получим
Сравнивая равенства (15.7) и (15.8), получим, что т.е. производная по направлению есть скалярное произведение градиента и единичного вектора, задающего направление .
Известно (см. § 3.1), что скалярное произведение двух векторов максимально, если они одинаково направлены. Следовательно, градиент функции в данной точке характеризует направление максимальной скорости изменения функции в этой точке.
Зная градиент функции в каждой точке, можно по крайней мере локально строить линии уровня функции. А именно, имеет место теорема.
Теорема. Пусть задана дифференцируемая функция и пусть в точке величина градиента отлична от нуля. Тогда градиент перпендикулярен линии уровня, проходящей через данную точку.
Линия уровня задается уравнением где ). Предположим, что это уравнение можно разрешить относительно , т.е. на (если это невозможно, то следует разрешить уравнение относительно х и повторить все рассуждения с точностью до обозначений).
Таким образом, касательный вектор имеет координаты Умножив его компоненты на получим, что вектор касателен к линии уровня (см. рис. 15.8).
Между тем на линии уровня т.е. откуда на . Но — скалярное произведение вектора градиентаи вектора касательного к , т.е. рассматриваемые векторы перпендикулярны. ■
Таким образом, линии уровня можно построить следующим образом (см. рис. 15.9). Предположим, мы начинаем с точки Построим градиент в этой точке. Задаем направление, перпендикулярное градиенту. Оно позволяет построить малую часть линии уровня. Далее рассмотрим близкую точку и построим градиент в ней.
Продолжая этот процесс, можно (с определенной погрешностью) построить линии уровня.
Экстремум функции нескольких переменных
Как и в случае одной переменной, функция имеет узловые, определяющие структуру графика точки. В первую очередь это точки экстремума.
Определение. Точка называется точкой максимума (минимума) функции если существует окрестность точки , такая, что для всех точек из этой окрестности выполняется неравенство
,
На рис.15.10 точка — есть точка минимума, а точка — точка максимума.
Обращаем внимание на локальный характер экстремума (максимума и минимума) функции, так как речь идет о максимальном и минимальном значении лишь в достаточно малой окрестности точки
Сформулируем необходимое условие экстремума — многомерный аналог теоремы Ферма.
Теорема. Пусть точка — есть точка экстремума дифференцируемой функции Тогда частные производные в этой точке равны нулю.
Пусть точка — точка максимума. Зафиксируем одну из переменных, например , полагая . Тогда получим функцию одной переменной которая, очевидно, будет иметь максимум при. Согласно теореме Ферма Аналогично можно доказать, что и
Точки, в которых выполнены необходимые условия экстремума функции т.е. частные производные равны нулю, называются критическими или стационарными.
Необходимое условие экстремума можно переформулировать также следующим образом: в точке минимума или максимума дифференцируемой функции градиент равен нулю. Можно доказать и более общее утверждение — в точке экстремума обращаются в нуль производные функции по всем направлениям.
Равенство частных производных нулю выражает лишь необходимое, но недостаточное условие экстремума функции нескольких переменных.
На рис. 15.11 изображена так называемая седловая точка Частные производные равны нулю, но, очевидно, никакого экстремума в точке нет.
Такие седловые точки являются двумерными аналогами точек перегиба функций одной переменной. Задача заключается в том, чтобы отделить их от точек экстремума. Иными словами, требуется знать достаточное условие экстремума.
Прежде чем это сделать, введем понятия частных производных второго порядка.
Если частные производные сами являются дифференцируемыми функциями, то можно найти также и их частные производные, которые называются частными производными второго порядка.
Вычислив частные производные функции получим Аналогично можно определить две частные производные функции которые обозначаются
Можно доказать, что если частные производные второго порядка функции непрерывны в точкето в этой точке
Теперь мы можем сформулировать достаточное условие экстремума.
Теорема (достаточное условие экстремума функции двух переменных). Пусть функция а) определена в некоторой окрестности критической точки в которой
б) имеет в этой точке непрерывные частные производные второго порядка Тогда, если то в точке функция имеет экстремум, причем если — максимум, если — минимум. В случае функция экстремума не имеет. Если то вопрос о наличии экстремума остается открытым.
Исследование функции двух переменных на экстремум рекомендуется проводить по следующей схеме:
- Найти частные производные функции .
- Решить систему уравнений и найти критические точки функции.
- Найти частные производные второго порядка, вычислить их значения в каждой критической точке и с помощью достаточного условия сделать вывод о наличии экстремумов.
- Найти экстремумы (экстремальные значения) функции.
Пример:
Найти экстремумы функции
Решение:
1°. Находим частные производные
2°. Критические точки функции находим из системы уравнений:
имеющей четыре решения
3°. Находим частные производные второго порядка:
вычисляем их значения в каждой критической точке и проверяем в ней выполнение достаточного условия экстремума.
Например, в точке Так как то точка есть точка максимума.
Аналогично устанавливаем, что — точка минимума, а в точках в которых — экстремума нет. Эти точки являются седловыми.
4°. Находим экстремумы функции
Наибольшее и наименьшее значения функции
При нахождении наибольшего и наименьшего значений (т.е. глобального максимума и минимума) функции нескольких переменных, непрерывной на некотором замкнутом множестве, следует иметь в виду, что эти значения достигаются или в точках экстремума, или на границе множества.
Пример №1
Найти наибольшее и наименьшее значения функции на круге радиуса 1 с центром в начале координат.
Решение:
1. Найдем частные производные функции
2. Найдем критические точки функции из системы откуда т.е. имеется одна критическая точка
3. Найдем критические точки функции на границе области — окружности, задаваемой уравнением Подставляя в функцию получим функцию одной переменной
причем
Найдя производную и приравнивая ее к нулю, получим критические точки на границе области:
4. Найдем значения функции в критических точках внутри области и на ее границе а также на концах отрезка [на границе области и выбираем среди них наибольшее меньшее. Итак, и
В заключение параграфа рассмотрим класс выпуклых функций, для которых задача нахождения экстремальных значений существенно упрощается.
Определим сначала множества, на которых задается этот класс функций.
Определение. Подмножество D -мерного пространства называется выпуклым, если для любых двух точек принадлежащих D, отрезок, соединяющий эти точки, также целиком принадлежит D.
Например, множества, изображенные на рис. 15.13а, — выпуклые, а множество на рис. 15.13б— невыпуклое. Простыми и наиболее естественными примерами выпуклых множеств являются само пространство, а также его положительный сектор, заданный условиями
Определение. Функция заданная на выпуклом множестве D, называется выпуклой вниз, если для любых двух точек
и выпуклой вверх, если
График функции, выпуклой вниз, изображен на рис. 15.14.
Очевидно, выпуклая функция не может иметь седловых точек, подобных изображенной на рис. 15.11. Это значит, что для выпуклой функции равенство ее частных производных нулю является не только необходимым, но и достаточным условием экстремума. Более того, экстремум выпуклой функции является глобальным, т.е. наименьшим значением в случае функции, выпуклой вниз, и наибольшим — в случае функции, выпуклой вверх.
Задача нахождения максимумов и минимумов функций многих переменных значительно сложнее аналогичной задачи для функций одной переменной. Даже в самых простых случаях чисто технические проблемы могут вызвать значительные трудности. Задаче нахождения подобных экстремумов посвящен специальный раздел математики — вариационное исчисление. В последние десятилетия бурное развитие переживает комплексная научная дисциплина — исследование операций, посвященная поиску оптимальных решений в различных, в том числе и экономических, задачах, в которых исследуемая (целевая) функция нескольких переменных принимает наибольшее или наименьшее значение.
Условный экстремум. Метод множителей Лагранжа
Рассмотрим задачу, специфическую для функций нескольких переменных, когда ее экстремум ищется не на всей области определения, а на множестве, удовлетворяющем некоторому условию.
Пусть рассматривается функция аргументы которой удовлетворяют условию называемому уравнением связи.
Определение. Точка называется точкой условного максимума (минимума), если существует такая окрестность этой точки, что для всех точек из этой окрестности, удовлетворяющих условию выполняется неравенство
На рис. 15.15 изображена точка условного максимума . Очевидно, что она не является точкой безусловного экстремума функции (на рис. 15.15 это точка ().
Наиболее простым способом нахождения условного экстремума функции двух переменных является сведение задачи к отысканию экстремума функции одной переменной. Допустим уравнение связи удалось разрешить относительно одной из переменных, например выразить : . Подставив полученное выражение в функцию двух переменных, получим , т.е. функцию одной переменной. Ее экстремум и будет условным экстремумом функции .
Пример №2
Найти точки максимума и минимума функции при условии
Решение:
Выразим из уравнения переменную через переменную и подставим полученное выражение в функцию . Получим или . Эта функция имеет единственный минимум при Соответствующее значение функции Таким образом, — точка условного экстремума (минимума). ►
В рассмотренном примере уравнение связи оказалось линейным, поэтому его легко удалось разрешить относительно одной из переменных. Однако в более сложных случаях сделать это не удается.
Для отыскания условного экстремума в общем случае используется метод множителей Лагранжа.
Рассмотрим функцию трех переменных
Эта функция называется функцией Лагранжа, а — множителем Лагранжа. Верна следующая теорема.
Теорема. Если точка является точкой условного экстремума функции при условии то существует значение такое, что точка является точкой экстремума функции
Таким образом, для нахождения условного экстремума функции при условии требуется найти решение системы
Последнее из этих уравнений совпадает с уравнением связи. Первые два уравнения системы можно переписать в виде
т.е. в точке условного экстремума градиенты функций и коллинеарны.
На рис. 15.16 показан геометрический смысл условий Лагран-жа. Линия пунктирная, линии уровня функции сплошные.
Из рис. 15.16 следует, что в точке условного экстремума линия уровня функции касается линии
Пример №3
Найти точки экстремума функции -при условии используя метод множителей Лагранжа.
Решение:
Составляем функцию Лагранжа . Приравнивая к нулю ее частные производные, получим систему уравнений
Ее единственное решениеТаким образом, точкой условного экстремума может быть только точка (3; 1). Нетрудно убедиться в том, что в этой точке функция имеет условный минимум. ►
В случае, если число переменных более двух, может рассматриваться и несколько уравнений связи. Соответственно в этом случае будет и несколько множителей Лагранжа.
Мы не рассматриваем здесь достаточные условия условного экстремума. Отметим только, что во многих задачах критическая точка функции Лагранжа оказывается единственной и соответствует не только локальному, но и глобальному условному минимуму или максимуму.
Задача нахождения условного экстремума используется при решении таких экономических задач, как нахождение оптимального распределения ресурсов, выбор оптимального портфеля ценных бумаг и др. (подробнее см. § 15.11).
Понятие об эмпирических формулах
Метод наименьших квадратов:
На практике мы часто сталкиваемся с задачей о сглаживании экспериментальных зависимостей.
Пусть зависимость между двумя переменными выражается в виде таблицы, полученной опытным путем. Это могут быть результаты опыта или наблюдений, статистической обработки материала и т.п.
Требуется наилучшим образом сгладить экспериментальную зависимость между переменными , т.е. по возможности точно отразить общую тенденцию зависимости от , исключив при этом случайные отклонения, связанные с неизбежными погрешностями измерений или статистических наблюдений. Такую сглаженную зависимость стремятся представить в виде формулы .
Формулы, служащие для аналитического представления опытных данных, получили название эмпирических формул.
Задача нахождения эмпирических формул разбивается на два этапа. На первом этапе нужно установить вид зависимости т.е. решить, является ли она линейной, квадратичной, логарифмической или какой-либо другой.
Предположим, например, что результаты экспериментальных исследований нанесены на плоскость (паре чисел соответствует точка с такими же координатами). Разумеется, существует множество кривых, проходящих через эти точки (см. рис. 15.17).
Для продвижения к цели обычно предполагают, что кривая истинной зависимости — это наиболее «гладкая» кривая, согласованная с эмпирическими данными. Так, в случае, изображенном на рис. 15.17, исследователь несомненно предпочтет кривую I кривой II.
Для проверки правильности вывода проводятся дополнительные исследования, т.е. производится еще ряд одновременных измерений величин Дополнительные точки наносятся на плоскость. Если они оказываются достаточно близкими к выбранной кривой (на рис. 15.17 дополнительные точки изображены крестиками), то можно считать, что вид кривой установлен. В противном случае кривую надо скорректировать и вновь провести дополнительные измерения.
Кроме того, для выбора функции привлекаются дополнительные соображения, как правило, не математического характера (теоретические предпосылки, опыт предшествующих исследований и т.п.).
Предположим, первый этап завершен — вид функции установлен. Тогда переходят ко второму этапу — определению неизвестных параметров этой функции.
Согласно наиболее распространенному и теоретически обоснованному методу наименьших квадратов в качестве неизвестных параметров функции выбирают такие значения, чтобы сумма квадратов невязок , или отклонений «теоретических» значений найденных по эмпирической формуле , от соответствующих опытных значений т.е.
была минимальной (рис. 15.18).
Следует отметить, что в качестве величины отклонения эмпирических точек от точек сглаживающей экспериментальную зависимость кривой в принципе можно было взять обычную сумму невязок или сумму их абсолютных величин
Но делать это нецелесообразно, так как в первом случае может быть малой или даже равняться нулю при значительном разбросе эмпирических точек, так как положительные отклонения , компенсируются отрицательными.
Во втором случае функция лишена этого недостатка,но имеет другой — она не является дифференцируемой, что существенно затрудняет решение задачи.
Пусть в качестве функции взята линейная функция и задача сводится к отысканию таких значений параметров а и Ь, при которых функция (15.9)
принимает наименьшее значение. Заметим, что функция есть функция двух переменных до тех пор, пока мы не нашли, а затем зафиксировали их «наилучшие» (в смысле метода наименьших квадратов) значения, а — постоянные числа, найденные экспериментально.
Таким образом, для нахождения прямой, наилучшим образом согласованной с опытными данными, достаточно решить систему
После алгебраических преобразований эта система принимает вид:
Система (15.10) называется системой нормальных уравнений.
Эта система имеет единственное решение, так как ее определитель
(а точнее что можно доказать методом математической индукции при ).
Убедимся, что найденные из системы (15.10) значения дают минимум функции Найдем частные производные
Выражение в силу изложенного выше и следовательно, согласно достаточному условию функция имеет единственную точку минимума, определяемую из системы нормальных уравнений (15.10). Заметим, что в этой точке функция имеет не просто локальный минимум, но наименьшее значение (глобальный минимум).
Пример:
Имеются следующие данные о цене на нефть (ден. ед.) и индексе акций нефтяных компаний (усл. ед.).
Предполагая, что между переменными существует линейная зависимость, найти эмпирическую формулу вида используя метод наименьших квадратов.
Решение:
Найдем необходимые для расчетов суммы
Промежуточные вычисления оформим в виде вспомогательной таблицы.
Система нормальных уравнений (15.10) имеет вид
Ее решение дает искомую зависимость: Таким образом, с увеличением цены нефти на 1 ден. ед. индекс акций нефтяных компаний в среднем растет на 12,08 ед. ►
Понятие двойного интеграла
В настоящем параграфе мы затронем некоторые вопросы, связанные с интегрированием функций нескольких переменных. В отличие от случая одной переменной здесь не удается ввести простого понятия первообразной и неопределенного интеграла. В то же время определенный интеграл вводится аналогично: интегрирование рассматривается как «суммирование бесконечного числа бесконечно малых величин».
Вначале определим двумерный аналог интегральной суммы (см. § 11.1).
Пусть рассматривается множество на плоскости (для простоты будем считать его выпуклым). Построим покрывающую это множество решетку (см. рис. 15.19).
На рис. 15.19 штриховкой обозначена часть множества , не покрытая полными клетками решетки. Очевидно, площадь этой части уменьшается по мере того, как увеличивается число клеток разбиения, т.е. уменьшаются размеры клеток (опять же для простоты будем считать, что все клетки имеют одинаковые размеры). Занумеруем клетки решетки индексами , где — номер клетки по горизонтали (считая слева направо), a — номер клетки по вертикали (считая снизу вверх). Пусть соответственно длина горизонтальной и вертикальной стороны клетки . Тогда при площадь заштрихованной части множества стремится к нулю и, несколько пренебрегая строгостью, можно сделать утверждение: — это часть множества покрытая целыми клетками решетки.
В каждой клетке выберем произвольную точку Интегральной суммой функции на множестве называется сумма
Обозначим через — диаметр клетки, т.е. наибольший линейный размер ее (в данном случае — длина диагонали клетки).
Определение. Функция называется интегрируемой на множестве , если существует конечный предел интегральной суммы этой функции на при условии Само значение предела называется двойным интегралом функции на множестве .
Обозначается двойной интеграл следующим образом:
Замечание. Указанный предел интегральной суммы не должен зависеть ни от способа разбиения множества на элементарные ячейки (лишь для простоты в качестве таких ячеек мы использовали прямоугольные клетки), ни от выбора точек в каждой ячейке.
Таким образом, по определению
Отметим геометрический смысл двойного интеграла. Если функция непрерывна и неотрицательна в области , то двойной интеграл представляет собой объем прямого цилиндрического тела (цилиндроида), построенного на области как на основании и ограниченного сверху поверхностью Если для всех то численно равен площади области .
Интегрирование функции двух переменных значительно более трудная задача по сравнению с аналогичной задачей для одной переменной. Однако в некоторых случаях можно получить завершенный результат. Рассмотрим один из таких важнейших случаев.
Множество на плоскости называется элементарным относительно оси если его граница состоит из графиков двух непрерывных функций определенных на некотором отрезке и таких, что и из отрезков прямых и (рис. 15.20).
Двойной интеграл может быть вычислен с помощью теоремы, представляющей двумерный аналог формулы Ньютона—Лейбница.
Теорема. Если функция непрерывна на элементарном множестве , то
Интеграл, стоящий в правой части формулы (15.12), называется повторным интегралом и обычно записывается в виде
Пример №4
Вычислить интеграл , где — круговой сектор, изображенный на рис. 15.21.
Решение:
Множество является элементарным. Здесь
Таким образом, искомый интеграл принимает вид:
Двойные и повторные интегралы находят свое применение в теории вероятностей, вариационном исчислении и многих других разделах математики, имеющих непосредственные экономические приложения.
Функции нескольких переменных в экономической теории
Рассмотрим некоторые приложения функций нескольких переменных в экономической теории.
Значительная часть экономических механизмов иллюстрируется на рисунках, изображающих линии уровня функции двух переменных Например, линии уровня производственной функции называются изоквантами.
Пусть — два различных фактора производства, а функция характеризует выпуск продукции, который позволяют значения факторов . На рис.15.22 линии уровня изображены сплошными линиями, а штриховкой выделена так называемая экономическая область, которая характеризуется тем, что высекаемые ею части изо-квант представляют собой графики убывающих функций, т.е. увеличение количества одного фактора позволяет уменьшить количество другого, не меняя размера выпуска. Иными словами, экономическая область — это множество значений факторов, допускающих замещение одного из них другим. Очевидно, что все «разумные» значения принадлежат экономической области.
Изокванты позволяют геометрически иллюстрировать решение задачи об оптимальном распределении ресурсов. Пусть — функция издержек, характеризующая затраты, необходимые для обеспечения значений ресурсов (часто можно считать, что функция издержек линейная: — «цены» факторов ).
Линии уровня этой функции также изображены на рис. 15.20. Комбинации линий уровня функции позволяют делать выводы о предпочтительности того или иного значения факторов . Очевидно, например, что пара значений более предпочтительна, чем пара , так как обеспечивает тот же выпуск, но с меньшими затратами. Оптимальными же значениями факторов будут значения — координаты точки касания линии уровня функции выпуска и функции издержек.
Линии уровня функции полезности (они называются кривыми безразличия) (см. § 5.6) также позволяют рассматривать вопросы замещения одного товара другим и иллюстрировать решение задачи об оптимальном потреблении (потребительского выбора) (см. рис. 15.23).
Линия уровня затрат на приобретение товаров изображены на рис. 15.23 пунктиром. Оптимальное потребление обеспечивается значениями — координатами точки касания кривой безразличия и линии уровня затрат. В этой точке заданная полезность достигается наиболее экономичным образом.
Другой пример кривых безразличия возникает в теории инвестиций.
Портфель ценных бумаг (под портфелем мы здесь будем понимать совокупность определенных ценных бумаг в определенных количествах) характеризуется двумя основными параметрами — ожидаемой доходностью и риском (точное определение этих величин здесь не может быть приведено, так как оно использует понятия теории вероятностей и математической статистики). Каждому портфелю можно поставить в соответствие точку на координатной плоскости , и тогда множество всех возможных портфелей представляет некоторую область (см. рис. 15.24).
Очевидно, что при равных доход-ностях инвестор предпочтет портфель с меньшим риском. Таким образом, кривые безразличия — линии уровня функции предпочтения — выпуклы вниз. Точка в которой линия безразличия касается области , соответствует наиболее предпочтительному для данного инвестора портфелю. Соответствующая теория была предложена американским экономистом Харри Марковицем в 1952 г. и с тех пор получила широкое развитие в теории инвестиций.
Понятие частной производной также находит применение в экономической теории. В § 7.6 было введено понятие эластичности функции одной переменной . Аналогично можно ввести понятие частной эластичности функции нескольких переменных относительно переменной : Так, например, в производственной функции Кобба—Дугласа (см. § 15.1) , как нетрудно убедиться,, т.е. показатели приближенно показывают, на сколько процентов изменится выпуск продукции при изменении только затрат труда или только объема производственных фондов на 1%.
Рассмотрим частные производные — функции полезности. Они называются предельными полезностями и обозначаются .Если измерять количество товара в стоимостном выражении, то предельные полезности можно рассматривать как функции спроса на соответствующий товар. Найдем предельные полезности для функции постоянной эластичности
Имеем т.е. функции спроса с ростом стоимости каждого товара являются убывающими, а параметры представляют частные эластичности спроса на эти товары.
Если рассматривать спрос как функцию нескольких переменных, например двух – цены товара и доходов потребителей то можно говорить о частных эластичностях спроса от цены и спроса от доходов Например, можно установить, что для качественных товаров и для низкосортных, так как с ростом доходов спрос на качественные товары увеличивается, а на низкосортные — уменьшается.
Если при исследовании спроса на данный товар рассматривать влияние другого, альтернативного товара ценой , т.е. рассматривать спрос как функцию трех переменных то можно ввести перекрестный коэффициент эластичности спроса, определяемый по формуле показывающий приближенно процентное изменение спроса на данный товар при изменении цены альтернативного товара на 1%. Очевидно, что для взаимозаменяемых товаров так как увеличение цены одного товара приводит к увеличению спроса на другой. В то же время для взаимодополняющих товаров ибо в этом случае рост цены любого товара приводит к снижению спроса.
Рассмотрим еще один коэффициент эластичности, характеризующий производственную функцию нескольких переменных и имеющий важное значение для экономической теории.
Пусть — производственная функция и — предельные продукты, соответствующие затратам ресурсов . Коэффициентом эластичности замещения называется величина
Так как при малых приращениях аргумента имеет место приближенное равенство приращение логарифма переменной величины можно рассматривать как относительное приращение самой величины. Таким образом, величина, обратная коэффициенту эластичности замещения, показывает приближенно, на сколько процентов изменится отношение предельных продуктов при изменении отношения затрат ресурсов на 1%.
В § 15.1 приведена производственная функция с постоянной эластичностью замещения. В общем случае коэффициент эластичности замещения есть функция от двух переменных. Рассмотрим ее выражение в точках изокванты. Так как вдоль изокванты значение функции постоянно, то полный дифференциал этой функции вдоль изокванты равен нулю, т.е. Отсюда имеем , т.е. при сохранении объема выпуска величина называемая предельной нормой замещения ресурса ресурсом , равна отношению их предельных продуктов. С учетом последнего равенства можно записать, что
Очевидно, что — тангенс угла наклона касательной к изокванте в точке — тангенс угла наклона радиуса-вектора точки (см. рис. 15.25).
Таким образом, величина характеризует относительное изменение угла наклона касательной к изокванте при изменении угла наклона ее радиуса вектора, т.е. кривизну изокванты.
Если рассматриватькак функцию есть коэффициент эластичности в обычном смысле (см. § 7.6).
Понятие выпуклости функции также играет существенную роль в понимании важнейших экономических законов. Многомерные аналоги примеров, рассмотренных в § 8.10, позволяют математически сформулировать законы убывающей доходности и убывающей предельной полезности.
Пример:
Определить оптимальное распределение ресурсов для функции выпуска , если затраты на факторы — линейны и задаются ценами
Решение:
В точке , задающей оптимальное распределение ресурсов , линия уровня функции издержек касается изокванты (см. § 15.11). На экономической области изокванта есть часть графика функции . Линия уровня функции издержек — это прямые угловой коэффициент которых
Таким образом, условие касания имеет вид и соответственно .
Таким образом, факторы следует распределить в отношении
Пример:
Результаты десяти одновременных измерений величин сведены в следующую таблицу:
Предполагая, что зависимость величины от величины имеет вид , найти значения параметров этой зависимости, используя метод наименьших квадратов.
Решение:
Величина , определенная равенством (15.10), имеет вид
Имеем
Приравнивая частные производные к нулю, критические точки функции определяем как решение системы нормальных уравнений:
Вычислив при необходимые суммы
получим систему нормальных уравнений в виде:
откуда
Определение функции от нескольких переменных
Во многих вопросах геометрии, естествознания и т. д. приходится иметь дело с функциями двух, трех переменных и более. Приведем примеры.
Пример:
Площадь треугольника U = ху/2 с основанием х и высотой у есть функция от двух переменных х и у, определенная в области х > 0 и у > 0.
Пример:
Разрешая уравнение сферы относительно, при получим
Здесь аппликата z точки верхней полусферы есть функция двух переменных х и у — абсциссы и ординаты этой точки. Данная функция определена в круге
Пример:
Объем прямоугольного параллелепипеда V = xyz с измерениями х, у и z есть функция этих трех переменных, определенная в положительном октанте пространства Oxyz.
Пример:
Сила притяжения F двух материальных точек, имеющих массы т и т, и занимающих соответственно положения М(х, у, z) и согласно закону Ньютона, равна
где k — некоторая константа (гравитационная постоянная). Следовательно, F есть функция от шести переменных
Сделаем одно важное замечание: всякая ‘ функция от нескольких переменных становится функцией от меньшего числа переменных, если часть переменных зафиксировать, т.е. придать постоянные значения.
Например, пусть мы имеем функцию
от трех переменных . Если положить, что z сохраняет постоянное значение z = с, то мы получим функцию от двух переменных х и у:
Далее, предполагая, что две переменные у и z сохраняют неизменные значения у = b и z = с, получим функцию от одной переменной х.
Таким образом, в разных вопросах, по желанию, функцию и можно рассматривать как функцию одной, двух или трех переменных.
Строго говоря, почти всякая физическая зависимость дает нам пример функции весьма большого количества переменных. Но при изучении этой зависимости мы игнорируем часть несущественных факторов и тем самым ограничиваем число переменных, сводя его к минимуму.
Например, путь s, пройденный свободно падающим телом за время t, зависит от следующих переменных: t — времени падения, Q — площади поперечного сечения тела, — широты места, h — высоты места над уровнем моря, р — давления воздуха, Т — температуры воздуха — коэффициента вязкости воздуха и т. д. Так что мы должны написать
В первом приближении все переменные, кроме времени t, являются малосущественными. Игнорируя их, получим s = f(t) и тем самым приходим к известной формуле
где — ускорение свободного падения, которое считается постоянным.
Если хотя бы частично учесть роль других переменных, то мы будем иметь формулы для s все более и более соответственно точные, зависящие от все более возрастающего числа переменных.
Геометрическим изображением (графиком) функции двух переменных
является, вообще говоря, поверхность в пространстве Oxyz.
В самом деле, пусть данная функция определена в некоторой области со плоскости Оху. Тогда каждой паре значений х и у из области (О соответствует по формуле (1) некоторое значение z; иными словами, каждой точке N(x, у, 0) ставится в соответствие точка М(х, у, z), принадлежащая графику функции и являющаяся концом перпендикуляра NM к плоскости Оху.
Если точка N занимает всевозможные положения, исчерпывающие область со, то связанная с ней точка М, в общем случае, опишет в пространстве некоторую поверхность Р «нависающую» над областью со. Наглядно можно представлять себе, что Р есть «крыша», построенная над площадкой . Поверхность Р и является геометрическим изображением функции (1) (рис. 208). Геометрические изображения функций трех и большего числа переменных не имеют простого геометрического смысла.
В некоторых случаях можно получить наглядное геометрическое представление о характере изменения функции, рассматривая ее линии уровня (или поверхности уровня), т.е. линии (или поверхности), где данная функция сохраняет постоянное значение.
Определение: Линией уровня функции
называется множество всех точек плоскости Охуу для которых данная функция имеет одно и то же значение (изокривая).
Таким образом, уравнение линии уровня есть
где С — некоторая постоянная.
Пример:
Построить семейство линий уровня функции Давая z неотрицательные значения (z, очевидно, не может быть отрицательным), получим соответственно уравнения линий уровня функции: — точка О(0, 0); — окружность радиуса R = 1 с центром О(0, 0); — окружность радиуса с центром О(0, 0) и т. д.
Таким образом, линии уровня нашей функции представляют собой семейство концентрических окружностей с центром О. Построив эти линии, получим «карту поверхности» для данной функции с отмеченными высотами (рис. 209).
На рис. 209 мы наглядно видим, что функция z растет вдоль каждого радиального направления. Поэтому в пространстве Oxyz геометрический образ функции представляет собой гигантскую «яму» с круто растущими краями. Теоретически это параболоид вращения.
Определение: Поверхностью уровня функции
называется множество всех точек пространства Oxyz, для которых данная функция имеет одно и то же значение (и з о-поверхности).
Линии и поверхности уровня постоянно встречаются в физических вопросах. Например, соединив на карте поверхности Земли точки с одинаковой средней суточной температурой или с одинаковым средним суточным давлением, получим соответственно изотермы и изобары, являющиеся важными исходными данными для прогноза погоды.
Непрерывность
Пусть есть функция от двух переменных х и у, совокупность значений (х, у) которых для краткости будем называть точкой; таким образом, z есть функция «точки».
Дадим переменной х приращение , оставляя переменную у неизменной. Тогда разность
называется частным приращением функции по переменной х. Следовательно, можно написать
Аналогично, если только переменной у дается приращение , а переменная х остается неизменной, то разность
называется частным приращением функции по переменной у.
Наконец, может случиться, что обе переменные х и у получили соответственно приращения . Тогда соответствующее приращение функции
называется полным приращением функции (или просто приращением функции).
Естественно, что здесь рассматриваются лишь такие точки
для которых функция f имеет смысл, т. е. определена.
Заметим, что из формул (2), (2′) и (3) следует, что полное приращение функции, вообще говоря, не равно сумме частных приращений этой функции:
Пример №5
Найти приращение функции , где х изменилось от 2 до 2,2 и у — от 1 до 0,9.
Решение:
Здесь = 0,2 и = -0,1. Имеем
Следовательно,
Аналогично определяются и записываются частные и полные приращения функции с числом переменных, большим двух.
Определение: Функция f(x, у) называется непрерывной в точке (х0, у0), если: 1) функция определена в данной точке и эта точка является предельной для области существования функции; 2) бесконечно малым приращениям
переменных х и у соответствует бесконечно малое приращение функции f(x, у), т. е. при любом способе стремления приращений к нулю, для которых имеет смысл, выполнено условие
Для наглядности можно мыслить, что функция, непрерывная в точке , определена как в самой этой точке, так и в некоторой окрестности ее, причем при достаточно малых по модулю Ах0 и Д у0 имеет место равенство (4).
Определение: Функция f(x, у) называется непрерывной в данной области у если эта функция непрерывна в каждой точке рассматриваемой области, т. е. если для каждой точки (х, у) области имеем
причем здесь мы, как обычно, предполагаем, что смещенная точка принадлежит данной области и существует (множество таких точек не пусто в любой окрестности точки {х, у) в силу определения 1). Таким образом, можно сказать, что функция непрерывна тогда и только тогда, когда бесконечно малым приращениям ее аргументов соответствует бесконечно малое приращение функции.
Пример №6
Функция определена и непрерывна в треугольнике: . Заметим, что точки границы множества не являются его внутренними точками.
Из формулы (5) следует, что
где а — бесконечно малая при . Таким образом, если функция f(x, у) непрерывна, то значения ее в двух бесконечно близких точках отличаются друг от друга на бесконечно малую функцию.
Положим ; очевидно, при , имеем и обратно. Тогда из формулы (5) получаем эквивалентное определение непрерывности функции
Частные производные первого порядка
Пусть дана функция
Для простоты здесь и в дальнейших параграфах по смыслу будем предполагать, что для каждой рассматриваемой точки {х, у) функция f(x, у) определена в некоторой полной окрестности этой точки.
Рассмотрим отношение частного приращения
функции z по переменной х к приращению этой переменной
Предел этого отношения при , стремящемся к нулю, если таковой существует, называется частной производной {первого порядка) функции z = f(x, у) по х и обозначается так:
Мы имеем, следовательно,
Аналогично определяется частная производная от функции х = f(x, у) по у:
Определение: Частной производной функции от нескольких переменных по одной из этих переменных называется предел отношения соответствующего частного приращения функции к приращению рассматриваемой независимой переменной при условии, что последнее стремится к нулю. Заметим, что если от функции z = f(x, у) берется производная , то у считается постоянным; если же находится , то х считается постоянным.
Поэтому частная производная функции от нескольких переменных равна производной той функции одной переменной, которая получится, если все независимые переменные данной функции, кроме соответствующей одной, считать постоянными, т.е.
Следовательно, частное дифференцирование не требует никаких новых правил дифференцирования, и мы можем пользоваться известными формулами.
Пример №7
Пусть
Легко видеть, что
Аналогично определяются и вычисляются частные производные функции трех переменных х, у, z и т. д.
Пример №8
Пусть ; тогда
Для функции
нетрудно выяснить геометрическии смысл ее частных производных . Геометрическим изображением данной функции является некоторая поверхность Р (рис. 210).
Полагая у = const, мы получаем плоскую кривую Гх, представляющую собой сечение поверхности Р соответствующей плоскостью, параллельной координатной плоскости Oxz. Пусть МК — касательная к кривой в точке М(х, у, z), а — угол, образованный этой касательной с положительным направлением оси Ох. Так как
на основании геометрического смысла обычной производной имеем
Аналогично, если Гу есть сечение поверхности Р плоскостью х = const и — угол, образованный с осью Оу касательной ML в точке М{х, у, z) к кривой Гу, то
Полный дифференциал функции
Пусть есть функция от двух независимых переменных х и у. Полное приращение этой функции
представляет собой разность значений данной функции в точках М(х, у) и . Обозначим через р расстояние между этими точками:
Если при можно подобрать не зависящие от величины А и В так, что выражение “
будет отличаться от полного приращения функции на величину высшего порядка малости по сравнению с р, то это выражение называется главной линейной частью полного приращения функции. В этом случае мы получим
где (или, что то же самое, и ).
Выражение (1) можно записать в другом виде. Поскольку (рис. 211), имеем
отсюда
где
при , т. е. при и и обратно.
Обобщая определение дифференциала функций одной независимой переменной на случай функции двух независимых переменных, приходим к следующим определениям.
Определение: Под дифференциалом независимой переменной понимается приращение этой переменной, т. е.
Определение: Полным дифференциалом функции (или, короче, дифференциалом функции) z = f(x9 у) двух независимых переменных х и у называется главная линейная часть полного приращения этой функции.
Это определение естественным образом распространяется на функции любого числа переменных.
Обозначая дифференциал функции буквой d, можно написать
где А и Б не зависят от и, сверх того,
где — бесконечно малые при . Функция, имеющая дифференциал в данной области, называется дифференцируемой в этой области. Если функция z дифференцируема, то для полного приращения функции имеет место формула (1) или(1′).
Заметим, что если функция дифференцируема, то эта функция непрерывна. Действительно, переходя к пределу в формуле (1′) при , получим
т. е. функция z непрерывна.
Пример №9
Найти дифференциал функции z = ху. Функцию z можно рассматривать как площадь прямоугольника со сторонами х и у (рис. 212). Давая сторонам х и у приращения , получим приращение площади z, представляющее собой площадь каймы:
Главная часть этого приращения при , состоящая из двух прямоугольников со сторонами есть дифференциал dz площади z; поэтому
ТЕОРЕМА 1. Дифференциал функции равен сумме произведений частных производных этой функции на дифференциалы соответствующих независимых переменных. .
Доказательство. Пусть функция z = f(x, у) дифференцируема, т. е. имеет дифференциал
Для определения коэффициентов А и В напишем полное приращение функции
где — бесконечно малые при . Полагая = 0 в формуле (4), получим частное приращение
Для наглядности мы считаем х и у положительными.
Отсюда
и, следовательно, при будем иметь
Аналогично, полагая = 0 в формуле (4), находим
Таким образом,
Подставляя эти значения в формулу (3) и учитывая, что и , получим окончательно
Следствие. Данная функция имеет единственный дифференциал.
Действительно, из доказательства теоремы 1 следует, что дифференциал функции , если он существует, обязательно выражается формулой (5).
Замечание. Из формулы (5) следует, что для функции двух независимых переменных х и у ее дифференциал dz есть функция четырех независимых переменных х, у, dx, dy, линейная (т. е. первой степени) относительно второй пары переменных. Первая пара переменных, х и у, представляет собой координаты точки М(х, у), в которой берется дифференциал; вторая пара переменных, dx и dy, есть координаты вектора смещения точки М(х, у) при переходе ее в бесконечно близкую точку М'(х + dx, у + dу), где dx и dy — проекции отрезка ММ’ на соответствующие оси координат Ох и Оу.
Теорема (достаточное условие дифференцируемости функции). Если функция обладает непрерывными частными производными = в данной области, то эта функция дифференцируема в этой области и ее дифференциал выражается формулой (5).
Доказательство. Рассмотрим полное приращение функции
Вычитая и прибавляя член , будем иметь
Первая квадратная скобка формулы (6) представляет собой приращение функции по переменной х при фиксированном значении второй переменной у, т.е. ее можно рассматривать как приращение функции одной переменной х. Фиксируя величину и применяя теорему Лагранжа о конечном приращении функции, находим
где — некоторое промежуточное значение между х и . Аналогично, вторая квадратная скобка формулы (6) есть приращение функции по переменной у при неизменном значении переменной х. Поэтому в силу теоремы Лагранжа имеем
где у — промежуточное значение между у и . Из формул (6), (7) и (8) следует
Пусть . Так как производные непрерывны, то значения их в бесконечно близких точках и соответственно (рис.213) отличаются друг от друга на бесконечно малые; поэтому
где — бесконечно малые при . Отсюда из формулы (9) имеем
По определению главная линейная часть полного приращения функции есть дифференциал dz этой функции. Следовательно, из формулы (10) получаем
что и требовалось доказать.
Пример №10
Найти дифференциал функции
Решение:
Здесь Отсюда
Замечание. Аналогично, если функция имеет непрерывные частные производные , то дифференциал этой функции выражается формулой
где
Пример №11
Найти дифференциал функции
Решение:
Имеем Следовательно,
При малых приращениях приращение дифференцируемой функции
приближенно можно заменить дифференциалом этой функции:
Отсюда имеем приближенное равенство
которое будет тем относительно точнее, чем меньше .
Пример №12
Дан прямоугольник со сторонами х = б м и у = 8 м. На сколько изменится диагональ этого прямоугольника, если сторона х увеличится на 5 см, а сторона у уменьшится на 10 см?
Решение:
Обозначая диагональ прямоугольника через и, имеем . Отсюда, заменяя приращение диагонали дифференциалом du этой диагонали, приближенно находим
Полагая в последней формуле х = б м, = 0,05 м, у = 8 м, = -0,10 м, получаем
Таким образом, диагональ прямоугольника уменьшится приблизительно на 5 см. Точный подсчет дает значение = -0,045 м.
Применение дифференциала функции к приближенным вычислениям
С помощью полного дифференциала функции можно выяснить, как отражаются на значении функции погрешности ее аргументов.
Пример №13
Определить предельную абсолютную погрешность функции
зная предельные абсолютные погрешности аргументов х, у:
Имеем
Заменяя приращение функции ее дифференциалом, получим
Отсюда выводим приближенную оценку: Следовательно, за предельную абсолютную погрешность функции z можно принять
Пример №14
Гипотенуза прямоугольного треугольника х = 120 м ± 2 м, а острый угол у = 30° ± 1о. С какой точностью можно найти противолежащий данному углу катет z этого треугольника?
Решение:
Имеем
Отсюда
Полагая х = 120, = 2 и , по формулам (2) и (1) находим
Следовательно,
z = 60 м ± 2,8 м.
Используя формулу (1), можно определить также предельную относительную погрешность функции:
В частности, положим
Тогда и, следовательно,
т. е. предельная относительная погрешность произведения равна сумме предельных относительных погрешностей сомножителей.
Понятие о производной функции по данному направлению
Пусть — функция, определенная в области со. Рассмотрим некоторую точку М(х, у) и некоторое направление , определяемое направляющими косинусами (т.е. — косинусы углов, образованных лучом с положительными направлениями осей координат Ох и Оу). При перемещении в данном направлении точки в точку функция получает приращение
которое называется приращением функции и в данном направлении (рис. 214). Если есть величина перемещения точки М, то из прямоугольного треугольника МРМ’ получаем
следовательно,
Определение: Под производной функции и в данном направлении понимается предел отношения приращения функции в этом направлении к величине перемещения при условии, что последняя стремится к нулю, т. е.
С этой точки зрения производные можно рассматривать как производные функции и в положительных направлениях осей координат Ох и Оу.
Производная дает скорость изменения функции в направлении .
Выведем формулу для производной , предполагая, что функция дифференцируема. Из определения дифференциала функции следует, что приращение функции отличается от дифференциала функции на величину высшего порядка малости относительно приращений независимых переменных. Поэтому, используя формулу полного дифференциала, будем иметь
где при . Отсюда в силу соотношений (2) получаем
Следовательно,
Переходя к пределу в последней формуле при , т.е. при , и основываясь на определении (3), получим искомую формулу для производной функции в данном направлении:
где
Пример №15
Найти приращение функции при перемещении точки М( 1, 2) в направлении , образующем угол с положительным направлением оси Ох, на расстояние . Чему равна производная в точке М?
Имеем tg а = 3/4, причем 0 < а < . Отсюда ; следовательно,
Используя полученные направляющие косинусы направления , находим для точки М приращения координат
Таким образом, перемещенная точка М’ имеет координаты
Отсюда искомое приращение функции и равно
Заметим, что . Далее, имеем
поэтому и, следовательно,
Замечание. Для функции ее производная в направлении , определяемом вектором = , равна
Градиент
Определение: Говорят, что в данной области определено скалярное поле> если для каждой точки задан некоторый скаляр (т. е. число)
Таким образом, и есть числовая функция точки.
По установившейся традиции слово область здесь служит синонимом слова множество. Точное определение понятия «область».
Примерами скалярных полей являются температурное поле, т. е. распределение температуры в нагретом теле; распределение концентрации вещества в растворе, и т. п.
Если область расположена на плоскости Оху, то любая ее точка М определяется двумя координатами (х, у) и плоское скалярное поле (1) может быть записано в виде
Аналогично, для области со, находящейся в пространстве Oxyz, мы будем иметь
Таким образом, понятие скалярного поля представляет собой физическую трактовку функции нескольких переменных.
Определение: Говорят, что в данной области со определено векторное* поле, если для каждой точки задан некоторый вектор
Примерами векторных полей являются поле скоростей в данный момент времени точек потока жидкости; силовое поле, создаваемое некоторым притягивающим центром, и т. п.
Для случая плоского векторного поля (3) мы будем иметь вектор-функцию
Отсюда, переходя к координатам вектора а, получим
Таким образом, задание плоского векторного поля (4) равносильно заданию двух скалярных полей (5).
Аналогично, для случая пространственного векторного поля получаем
или же, в координатах,
Итак, векторное поле (6) эквивалентно трем скалярным полям (7). Этим объясняется удобство векторного языка: он позволяет в одной векторной формуле записывать несколько скалярных соотношений.
Множество всех точек М, для которых скалярное поле (1) сохраняет постоянное значение
называется поверхностью (или линией) уровня скалярного ноля (изоповерхности).
Определение: Пусть
-дифференцируемое плоское скалярное поле. Тогда вектор называется градиентом поля; или подробнее
где — единичные векторы, направленные по осям координат Ох и Оу (координатные орты).
Аналогично, для пространственного скалярного поля
его градиент есть вектор
Таким образом, скалярное поле порождает векторное поле — поле градиентов.
Под производной скалярного поля (8′) в данном направлении понимается выражение
где — направляющие косинусы вектора данного направления. Производная представляет собой скорость изменения поля в данном направлении.
Теорема: Производная скалярного поля в данном направлении равна проекции градиента поля на данное направление (в соответствующей точке).
Доказательство: Обозначим через единичный вектор направления .
Тогда, учитывая формулу (9′) и вспоминая определение скалярного произведения, выражение (10) можно записать в следующем виде:
где (рис. 215).
Отсюда
Следствие. Градиент скалярного поля в данной точке по модулю и направлению равен максимальной скорости изменения поля в этой точке.
Действительно, из формулы (11) получаем, что
и при этом cos = 1. Отсюда находим, что = 0 и, следовательно, направление вектора должно совпадать с направлением grad и, т.е. и, где k > 0. Кроме того, для этого направления имеем
Замечание. Из следствия вытекает, что градиент поля не зависит от выбора прямоугольной системы координат Oxyz.
Пример №16
Найти модуль и направление градиента поля в точке М0(2, 1, 0).
Решение:
Имеем
Следовательно,
Отсюда
Точка М0, в которой grad u(M0) = 0, называется особой для скалярного поля; в противном случае точка М0 называется не-особой (обыкновенной).
Приведем без доказательства теорему, выясняющую направление градиента скалярного поля.
Теорема: Во всякой неособой точке плоского скалярного поля градиент поля направлен по нормали к линии уровня, проходящей через эту точку, в сторону возрастания поля.
Частные производные высших порядков
Пусть имеем некоторую функцию от двух переменных х и у. Ее частные производные
являются функциями от переменных х и у. В некоторых случаях для этих функций существуют снова частные производные, называемые частными производными второго порядка (или просто вторыми частными производными):
Продолжая таким путем дальше, мы можем определить частные производные третьего порядка (третьи частные производные) и т. д.
Аналогично определяются и записываются частные производные высших порядков от функции трех и большего числа переменных.
Можно доказать следующую теорему:
если все входящие в вычисления частные производные, рассматриваемые как функции своих независимых переменных, непрерывны, то результат частного дифференцирования не зависит от последовательности дифференцирования.
В частности, например, если производные непрерывны, то имеет место равенство
Не приводя доказательство в общем виде, проверим справедливость этого последнего утверждения на отдельных примерах.
Пример №17
Пусть
Имеем
Мы видим, что для данной функции соблюдается равенство
как и следовало ожидать.
Признак полного дифференциала
Если функция дифференцируема, то полный дифференциал ее имеет вид)
где
Возникает обратная задача: при каких условиях дифференциальное выражение
где функции непрерывны вместе со своими производными первого порядка, является полным дифференциалом некоторой функции и?
Необходимое условие полного дифференциала дается следующей теоремой.
Теорема: Для того чтобы дифференциальное выражение (3) являлось в области G полным дифференциалом некоторой функции , необходимо у чтобы в этой области тождественно было выполнено условие
(условие полного дифференциала).
Доказательство: Пусть (3) — полный дифференциал функции . Имеем
Отсюда в силу единственности дифференциала получим
Дифференцируя первое равенство (5) по у, а второе — по х, будем иметь ‘
Так как для непрерывных смешанных производных результат дифференцирования не зависит от порядка дифференцирования, то из (6) получаем
т. е. условие (а) выполнено.
Следствие. Если условие (а) не выполнено, то выражение не является в области G полным дифференциалом некоторой функции.
Замечание. Можно доказать, что для конечной или бесконечной прямоугольной области
выполнение условия (а) также достаточно для существования функции и такой, что
Пример №18
Являются ли выражения
полными дифференциалами некоторых функций?
Решение:
Для первого выражения имеем Р = у. Q = -х. Отсюда
и, следовательно, условие полного дифференциала не выполнено, т. е. не существует функции, полный дифференциал которой равен у dx – х dy.
Для второго выражения получаем Р = У, Q = х и, следовательно,
Условие полного дифференциала выполнено. Так как плоскость можно рассматривать как бесконечную прямоугольную область, то у dx + ху есть полный дифференциал некоторой функции. Действительно,
Максимум и минимум функции нескольких переменных
Напомним, что под окрестностью точки плоскости понимается внутренность любого прямоугольника, окружающего эту точку, исключая саму точку (проколотая окрестность).
Аналогично, под окрестностью точки пространства понимается внутренность произвольного параллелепипеда, содержащего эту точку, за вычетом самой точки.
Определение: Максимумом (строгим) функции f(x, у) называется такое значение этой функции, которое больше всех ее значений f(x, у), принимаемых данной функцией в точках некоторой окрестности точки . (Эта окрестность может быть весьма малой по своим линейным размерам.)
Аналогично у минимумом (строгим) функции f(x, у) называется такое значение этой функции, которое меньше всех ее значений f(x, у), принимаемых данной функцией в точках некоторой окрестности точки .
Максимум или минимум функции f(x, у) называется экстремумом этой функции, а точка, в которой достигается экстремум, называется точкой экстремума (соответственно точкой максимума или точкой минимума функции).
Аналогично определяется экстремум функции и т. д.
Укажем необходимый признак экстремума функции нескольких переменных.
Теорема: В точке экстремума функции нескольких переменных каждая ее частная производная первого порядка либо равна нулю, либо не существует.
Доказательство: Рассмотрим для простоты функцию двух переменных , и пусть — ее максимум (рассуждения для минимума функции аналогичны).
Зафиксируем одну из переменных, например у, полагая у = у0. Тогда получим функцию одной переменной
которая, очевидно, будет иметь максимум при х = х0. Отсюда на основании теории экстремума функции одной переменной получаем, что
или не существует.
По смыслу определения функция должна иметь смысл на некотором множестве точек этой окрестности.
Совершенно так же доказывается, что или не существует.
Следствие. В точке экстремума дифференцируемой функции f(x, у) выполнены равенства
Аналогично, если дифференцируемая функция имеет экстремум в точке , то
Замечание 1. Точку, в которой частные производные первого порядка некоторой функции либо равны нулю, либо не существуют, назовем критической для данной функции.
Тогда теорема эквивалентна утверждению: экстремумы функции нескольких переменных могут достигаться лишь в критических точках ее.
Замечание 2. Выведенные выше условия экстремума функции, вообще говоря, не являются достаточными, т. е. если, например, в некоторой точке все частные производные первого порядка функции равны нулю, то в этой точке функция не обязательно имеет экстремум.
Пример №19
Для функции f(x, у) = ху имеем
Следовательно,
Однако точка О(0, 0) не является точкой экстремума функции, так как в любой окрестности точки О имеются точки ( > 0 произвольно) такие, что
Пример №20
Из всех прямоугольных параллелепипедов, имеющих сумму трех измерений, равную данной положительной величине а, найти тот, объем которого наибольший.
Обозначим измерения рассматриваемого прямоугольного параллелепипеда через . Его объем V выразится так: V = . Кроме того, согласно условию задачи имеем
Выразив z через х и у из последнего уравнения и подставив это значение z в выражение для V, получим
где переменные х и у являются независимыми.
Возьмем частные производные от V по х и у:
Приравняв эти частные производные нулю, будем иметь
Так как для искомого параллелепипеда величины х и у заведомо не равны нулю, то мы можем наши уравнения сократить на них. После простых преобразований получим систему
Решая обычным методом эту систему, находим х = а/3 и у = а/3. Следовательно, также z = а/3.
Итак, искомый параллелепипед есть куб, ребро которого равно а/3 (можно строго доказать, что объем его при данных условиях наибольший).
Абсолютный экстремум функции
Рассмотрим некоторое множество G точек плоскости (или пространства).
Точка М называется внутренней для множества G, если она принадлежит этому множеству вместе с некоторой своей окрестностью (рис. 216).
Точка N называется граничной для множества G, если в любой ее полной окрестности имеются точки, как принадлежащие G, так и не принадлежащие ему (рис. 216). Сама точка N не обязательно принадлежит множеству G.
Совокупность всех граничных точек множества G называется его границей Г.
Определение: Множество G будем называть областью, если все его точки — внутренние.
Множество G с присоединенной границей Г, т. е. множество , называется замкнутой областью.
Область называется ограниченной, если она целиком содержится внутри круга (или шара) достаточно большого радиуса.
Пример:
Внутренность К круга (рис. 217)
есть область; граница ее — окружность ; круг с присоединенной границей, т. е. совокупность точек, для которых , — замкнутая область.
Определение: Наименьшее или наибольшее значение функции в данной области называется аболютным экстремумом функции (соответственно абсолютным минимумом или абсолютным максимумом) в этой области.
Имеет место следующая теорема:
Теорема Вейрштрасса: Функция, непрерывная в ограниченной и замкнутой области, достигает в этой области своего наименьшего и своего наибольшего значений.
Теорема: Абсолютный экстремум функции в данной области достигается либо в критической точке функции, принадлежащей этой области, либо в граничной точке области.
Пример №21
Найти абсолютный экстремум функции z = ху в треугольной области S с вершинами 0(0, 0), А(1, 0), В(0, 2) (рис. 218).
Решение:
Имеем
Отсюда находим критическую точку О(0, 0) с координатами х=0, у = 0, принадлежащую области S.
Изучим поведение функции z на границе Г = ОАВО области S. На участке OA имеем у = 0 . Поэтому z = 0.
Аналогично, на участке ОВ имеем х = 0 , получаем z = 0.
Наконец, отрезок АВ имеет уравнение , или Отсюда
Имеем
при х = 1/2, откуда у = 1. Так как
то в точке функция z достигает своего наибольшего значения на отрезке АВ.
Итак, наименьшее значение функции в области S есть и оно реализуется в точках отрезков OA и ОВ, составляющих часть границы Г области S; наибольшее ее значение М = 1/2 достигается в точке , принадлежащей отрезку АВ границы Г.
Построение эмпирических формул по способу наименьших квадратов
В естествознании, в частности в физических и биологических науках, приходится пользоваться эмпирическими формулами, составленными на основании опыта и наблюдения. Один из наилучших методов получения таких формул — это способ наименьших квадратов. Изложим идею этого способа, ограничиваясь случаем линейной зависимости двух величин.
Пусть мы хотим установить зависимость между двумя величинами х и у (например, температурой и удлинением прямолинейного металлического стержня). Производим соответствующие измерения (например, измерений) и результаты сопоставляем в таблице:
Будем рассматривать х и у как прямоугольные координаты точек на плоскости. Предположим, что точки с соответствующими координатами, взятыми из нашей таблицы, почти лежат на некоторой прямой линии, например располагаются так, как показано на рис. 219. Естественно в этом случае считать, что между х и у существует приближенная линейная зависимость, т. е. что у есть линейная функция от х, выражающаяся формулой
где — некоторые постоянные коэффициенты, подлежащие определению. Формула (1) может быть представлена в таком виде:
Так как точки (х, у) только приблизительно лежат на нашей прямой, то формулы (1) и (2) приближенные. Следовательно, подставляя в формулу (2) вместо х и у их значения взятые из предыдущей таблицы, мы получим равенства:
где
— некоторые числа, вообще говоря, не равные нулю, которые мы будем называть погрешностями.
Требуется подобрать коэффициенты таким образом, чтобы эти погрешности были по возможности малыми по абсолютной величине. Способ наименьших квадратов состоит в следующем: нужно подобрать коэффициенты а и b так, чтобы сумма квадратов погрешностей была возможно меньшей, т. е. потребуем, чтобы сумма
была наименьшей. Если эта минимальная сумма квадратов окажется малой, то тогда и сами погрешности будут малыми по абсолютной величине.
Примечание. Можно было бы попытаться вместо суммы квадратов погрешностей взять сумму их и искать коэффициенты а и b так, чтобы эта сумма была возможно малой по абсолютной величине. Однако это, очевидно, не обеспечит малости погрешностей, так как последние могут иметь различные знаки. Этого не может случиться, если задача решается методом наименьших квадратов.
Заменяя в выражении (5) числа (4) их значениями из равенств (3), получим такую величину:
В формуле (6) числа получены в результате измерений и рассматриваются как данные; коэффициенты же — неизвестные величины, подлежащие определению.
Итак, U можно рассматривать как функцию от двух переменных . Подберем коэффициенты а и b так, чтобы функция U получила возможно меньшее значение. Согласно предыдущему параграфу, для этого необходимо, чтобы соблюдались условия
Беря эти частные производные и для удобства выкладок снабжая их коэффициентом 1/2, будем иметь
Отсюда, приравнивая эти частные производные нулю, получим линейную систему двух уравнений с двумя неизвестными :
Производя обычные алгебраические преобразования, представим эту систему в более простом виде:
или, введя сокращенные обозначения, имеем
Это окончательный вид так называемой нормальной системы способа наименьших квадратов. Из этой системы мы находим а и bf а затем подставляем их в нашу эмпирическую формулу
Пример:
Пусть результаты измерений величин х и у и итоги обработки их занесены в следующую таблицу:
Положим
Нормальная система (7) имеет вид
Решая эти уравнения, получим а = 0,425, = 1,175. Отсюда
В последнем столбце таблицы даны соответствующие погрешности.
Вычисление функции нескольких переменных
Во многих вопросах естествознания приходится иметь дело с функциями двух, трех и более переменных.
Пример: Площадь прямоугольного треугольника с катетами
и может быть задана в виде функции где
Пример: Объем прямоугольного параллелепипеда с измерениями и представляет собой функцию где
Пример: Величина силы притяжения двух материальных точек, имеющих массы и и занимающих соответственно положения и согласно закону Ньютона задается формулой
где – некоторая константа, так называемая «постоянная тяготения».
Определение 10.1. Если каждой упорядоченной совокупности значений переменных соответствует определенное значение переменной то будем называть функцией независимых переменных и записывать В случае
Замечание 10.1. Всякая функция от нескольких переменных (ФНП) становится функцией от меньшего числа переменных, если часть переменных зафиксировать, т. е. придать им постоянные значения.
Как и в случае одной независимой переменной ФНП существует, вообще говоря, не для любых значений
Определение 10.2. Совокупность наборов (точек при которых определяется функция называется областью определения или областью существования этой функции.
Область определения функции двух переменных представляет собой некоторое множество точек плоскости и наглядно иллюстрируется геометрически. Если каждую пару значений и изображать точкой в плоскости то область определения функции будет представлять собой некоторую совокупность точек на плоскости. В частности, областью определения может быть и вся плоскость. На практике изучаются случаи областей, представляющих часть плоскости, ограниченную линией. Линия, ограничивающая данную область, называется границей области. Точки области, не лежащие на границе, называются внутренними точками области.
Пример №22
Найти область определения функции
Решение.
Область определения функции будет задана условием
или т. е. представляет собой единичный круг с центром в начале координат.
Определение 10.3. Геометрическим изображением или графиком функции двух переменных называется множество точек пространства определяющее, вообще говоря, поверхность в системе координат
Геометрические изображения функций трех и большего числа переменных не имеют простого геометрического смысла.
Определение 10.4. Линией уровня функции называется множество точек плоскости для которых данная функция имеет одно и то же значение (изокривая).
Таким образом, уравнение линии уровня имеет вид где – некоторая постоянная.
Пример №23
Построить семейство линий уровня функции
Решение.
Придавая неотрицательные значения получим следующие уравнения линий уровня функции:
– точка
– окружность радиуса
– окружность радиуса и т. д.
Таким образом, линии уровня данной функции представляют собой семейство концентрических окружностей с центром в точке Построив эти линии, получим «карту поверхности» для данной функции с отмеченными высотами (рис. 10.1).
На рисунке видно, что функция растет вдоль каждого радиального направления. Поэтому в системе координат геометрический образ функции представляет собой гигантскую «яму» с круто растущими краями. Геометрически – это параболоид вращения (рис. 10.2).
Определение 10.5. Поверхностью уровня функции
называется множество точек пространства для которых данная функция имеет одно и то же значение (изоповерхпость).
Линии и поверхности уровня постоянно встречаются в физических вопросах. Например, соединив на карте поверхности Земли точки с одинаковой среднесуточной температурой или давлением, получим изотермы и изобары, являющиеся важными исходными данными для прогноза погоды. Параллели и меридианы на глобусе -это линии уровня функций широты и долготы.
Предел и непрерывность ФНП
Рассмотрим функцию двух переменных
Определение 11.1. Окрестностью радиуса точки называется совокупность всех точек удовлетворяющих неравенству
т. е. совокупность всех точек, лежащих внутри круга радиуса с центром в точке
В дальнейшем, говоря, что функция обладает каким-либо свойством «вблизи точки » или «в окрестности точки», под этим будем подразумевать, что найдется такой круг с центром во всех точках которого данная функция обладает указанным свойством.
Пусть функция определена в некоторой области плоскости Рассмотрим некоторую определенную точку лежащую в области или на ее границе.
Определение 11.2. Число называется пределом функции при стремлении точки к точке (или при ), если для такое, что для всех точек удовлетворяющих условию будет выполнено: Обозначение:
- Заказать решение задач по высшей математике
Пример №24
Найти предел
Решение.
Обозначим
Условие равносильно тому, что Получим
Ответ: 0.
Вычисление пределов функций двух переменных, как правило, оказывается более трудной задачей по сравнению со случаем функций одной переменной. Причина состоит в том, что на прямой существуют всего два направления, по которым аргумент может стремиться к предельной точке – а именно, справа и слева. На плоскости же таких направлений бесконечное множество и пределы функций по разным направлениям могут не совпадать.
Пример №25
Доказать, что — не существует.
Решение.
Будем приближаться к точке по прямым
Таким образом, значение предела зависит от углового коэффициента прямой. Но, так как предел функции не должен зависеть от способа приближения точки к точке то рассматриваемый предел не существует.
Ответ: предел не существует.
Замечание 11.1. Для функции переменных можно рассматривать так называемых повторных пределов. В частности, в случае функции двух переменных можно рассматривать два повторных предела в точке
и
Пример №26
Вычислить повторные пределы функции в точке
Решение.
Вывод. Так как повторные пределы конечны, но имеют различные значения, то при вычислении повторных пределов порядок следования предельных переходов по разным значениям влияет на результат.
Определение 11.3. Функция называется непрерывной в точке если она:
1) определена в точке
2) имеет конечный предел при
3) предел равен значению функции в точке, т. е.
Нарушение любого или нескольких из условий определения дает точку разрыва функции.
Геометрический смысл непрерывности состоит в том, что график функции в точке представляет собой сплошную не расслаивающуюся поверхность.
Пусть переменной дано приращение а переменная у оставлена неизменной. Тогда разность
(11.1)
называется частным приращением функции по переменной
Если неизменной остается переменная то разность
(11.2)
называется частным приращением функции по переменной
В случае, когда обе переменные и получают соответствующие приращения и приращение функции
(11.3) называется полным приращением функции
Естественно, при определении данных понятий рассматриваются лишь такие точки и для которых функция определена. Из формул (11.1), (11.2) и (11.3) следует, что
Пример №27
Найти полное и частные приращения функции если изменяется от 2 до 2,2, изменяется от 1 до 0,9.
Решение.
Вычислим значения функции в точках (2; 1), (2,2; 1), (2; 0,9) и (2,2; 0,9). Получим
и
Тогда
Так как то имеем случай
Ответ:
Определение 11.4. Функция называется непрерывной в предельной точке из области определения функции, если
Заметим, что предельной точкой области определения называется точка, для которой функция определена как и в ней самой, так и в некоторой ее окрестности.
Определение 11.5. Функция называется непрерывной в области если функция непрерывна в каждой точке рассматриваемой области, т. е. если для каждой точки области выполнено:
Частные производные функции нескольких переменных
Определение 12.1. Частной производной функции нескольких переменных по одной из этих переменных называется предел отношения соответствующего частного приращения функции к приращению рассматриваемой независимой переменной при стремлении приращения переменной к нулю (если этот предел существует).
Обозначения в случае и или и или
и или и
Таким образом, для функции по определению:
(12.1)
(12.2)
Согласно формулам (12.1) и (12.2), если для функции вычисляется производная то переменная считается постоянной; если же вычисляется производная то переменная считается постоянной. Следовательно, частное дифференцирование не требует никаких новых правил, и можно пользоваться известными формулами.
В общем случае, если и требуется найти
постоянными следует считать переменные
Пример: Найти частные производные функции
Ответ:
Пример: Найти частные производные функции
Ответ:
Геометрический смысл частных производных: геометрическим изображением функции является некоторая поверхность Полагая получим некоторую плоскую кривую . (рис. 12.1). Пусть – касательная к кривой в точке – угол, образованный этой касательной с положительным направлением оси
Так как на основании геометрического смысла производной функции одной переменной, имеем
Аналогичный смысл имеет и
Частные производные высших порядков
Рассмотрим функцию Если данная функция имеет в некоторой открытой области частную производную по одной из переменных, то данная производная, сама являясь функцией от и может в свою очередь в некоторой точке иметь частную производную по той же или другой переменной. Для исходной функции частные производные и называют частными производными первого порядка. Тогда, если первая производная была взята, например, по ее производные
и
или и называются частными производными второго порядка.
Аналогичным образом определяются частные производные третьего, четвертого и более высоких порядков.
Частная производная высшего порядка, взятая по различным переменным, например, называется смешанной частной производной.
Пример №28
Найти все частные производные второго порядка
функции
Решение.
Ответ:
Пример №29
Найти все частные производные второго порядка
функции
Решение.
Ответ: Заметим, что равенство смешанных производных не вытекает из самого определения смешанных производных. Существуют случаи, когда такого совпадения не наблюдается.
Теорема 13.1*. Пусть:
1) функция определена в открытой области
2) в этой области существуют первые производные и
3) в этой области существуют вторые смешанные производные и которые, как функции и непрерывны в некоторой точке области
Тогда в этой точке
Дифференцируемость ФНП
Определение 14.1. Функция называется дифференцируемой в точке если ее полное приращение в этой точке можно представить в виде
(14.1)
где и – бесконечно малые функции при и
Теорема 14.1. Если функция дифференцируема в точке то она непрерывна в этой точке.
Доказательство.
Если функция дифференцируема в точке то из формулы (14.1) следует, что или
откуда что и означает непрерывность функции в точке.
Теорема 14.2 (необходимые условия дифференцируемости).
Если функция дифференцируема в точке то она имеет в этой точке частные производные и причем
Доказательство.
Так как функция дифференцируема в точке то ее приращение в этой точке представимо в виде (14.1). Полагая получим
где – бесконечно малая функция при
Разделив полученное выражение на и перейдя к пределу при получим
С другой стороны, по определению частной производной,
Следовательно, в точке существует
Аналогично доказывается, что в точке существует
Замечание 14.1. Обратные утверждения к теоремам 14.1 и 14.2 не верны, т. е. из непрерывности ФНП в точке и существования частных производных не следует дифференцируемость.
Пример:
Функция
непрерывна на всей плоскости, на всей плоскости имеет частные производные, однако формула (14.1) не имеет места для данной функции в точке
Теорема 14.3* (достаточное условие дифференцируемости).
Если функция имеет частные производные в некоторой окрестности точки непрерывные в самой точке то функция дифференцируема в этой точке.
Понятие дифференцируемости для функции трех и более переменных вводится аналогично.
Определение 14.2. Функция нескольких переменных, дифференцируемая в каждой точке некоторого множества, называется дифференцируемой на этом множестве.
Полный дифференциал ФНП и его использование в приближенных вычислениях
Определение 15.1. Полным дифференциалом дифференцируемой в точке функции называется главная, линейная относительно приращений и часть полного приращения этой функции в точке т. е.
Напомним (см. раздел 2), что для независимых переменных и их любые приращения и считают дифференциалами:
Тогда полный дифференциал функции можно записать в виде
(15.1)
Полный дифференциал имеет широкое применение в приближенных вычислениях. Если рассмотреть функцию дифференцируемую в точке то
откуда
Так как то, используя представление по формуле (15.1), получим
(15.2)
приближенная формула, верная с точностью до бесконечно малых более высоких порядков относительно и
Пример №30
Вычислить приближенно
Решение.
Рассмотрим функцию Искомое число можно считать приращенным значением функции в точке при
Согласно формуле (15.2):
Поскольку
то окончательно получим
Ответ:
С помощью полного дифференциала функции можно также выяснить, как отражаются на значении функции погрешности ее аргументов.
Пример №31
Определить предельную абсолютную погрешность функции зная предельные абсолютные погрешности и ее аргументов и и
Решение. По определению:
Заменяя приращение функции ее дифференциалом, получим
откуда можно получить оценку:
Следовательно, за предельную абсолютную погрешность функции можно принять
(15.3)
Используя (15.3), можно также определить относительную погрешность функции
Ответ:
Определение 15.2. Полным дифференциалом второго порядка функции
называется полный дифференциал от ее полного дифференциала.
По определению, получим
Частные производные сложной функции
Предположим, что в формуле
(16.1)
переменные и являются непрерывными функциями независимых переменных и
и (16.2)
В этом случае функция является сложной функцией аргументов и
Предположим, что функции имеют непрерывные частные производные по всем своим аргументам. Вычислим частные производные и исходя из формул (16.1) и (16.2) и не используя непосредственное представление функции через и
Придадим аргументу приращение сохраняя значение неизменным. Тогда, в силу (16.2), и получат приращения и но тогда и функция получит следующее приращение:
где и – бесконечно малые функции при Разделим обе части формулы на
Если то, в силу непрерывности и и
Переходя к пределу при получим
(16.3)
Если придать аргументу приращение сохраняя значение неизменным, то с помощью аналогичных рассуждений можно получить
(16.4)
Пример №32
Найти частные производные и для функции если и
Решение.
Получим
где и
Заметим, что при записи ответа в выражения для частных производных вместо и можно подставить их выражения через и однако это повлечет за собой громоздкие выражения.
Ответ:
где и
Для случая большего числа переменных формулы (16.3) и (16.4) естественным образом обобщаются. Например, если где и то
Пусть исходная функция имеет вид где и зависят от одной переменной Тогда, по сути, функция является функцией только одной переменной и можно ставить вопрос о нахождении производной которая называется полной производной функции
(16.5)
Пример №33
Найти и для функции если
Решение:
Формула (16.5) в данном случае принимает вид:
Поэтому
Ответ:
где
Производная от функции, заданной неявно
Теорема 17.1. Пусть непрерывная функция от задается уравнением
(17.1)
и – непрерывные функции в некоторой области содержащей точку координаты которой удовлетворяют уравнению (17.1), причем
Тогда функция от будет иметь производную
(17.2)
Доказательство.
Пусть некоторому значению соответствует значение функции при этом
Придадим независимой переменной приращение тогда функция получит приращение т. е. значению переменной соответствует значение функции В силу (17.1)
поэтому
Выражение слева представляет собой полное приращение функции двух переменных, которое также можно записать в виде:
где и – БМФ при и
Откуда
Разделим обе части равенства на и выразим
Переходя к пределу при получим
Следует заметить, что в данном случае производная определяемая формулой (17.2), представляет собой производную функции одной переменной заданной неявно.
Пример №34
Найти производную функции заданной уравнением
Решение.
Заметим, что уравнение задает две непрерывные
функции и поэтому непосредственное вычисление производной не может быть выполнено.
dF dF
Воспользуемся формулой (17.2). Так как то
Ответ:
Теорема 17.2*. Пусть функция непрерывна в окрестности точки и имеет в ней непрерывные частные производные, причем a Тогда существует окрестность, содержащая точку в которой уравнение определяет однозначную функцию
Пусть функция от переменных и задается уравнением
Найдем частные производные и Считая переменную
постоянной и используя формулу (17.2), получим частную производную Аналогично можно получить Заметим, что при получении формул использовано предположение
Пример №35
Найти частные производные функции заданной уравнением
Решение.
Преобразуем исходное уравнение к виду и найдем
частные производные
Воспользуемся формулами и Получаем
Ответ:
Производная ФНП по направлению
Рассмотрим в области непрерывную функцию имеющую непрерывные частные производные по всем своим переменным. Проведем из некоторой точки данной области вектор По направлению вектора на расстоянии от его начала, рассмотрим точку рис. 18.1
Таким образом,
Рассмотрим полное приращение функции
(18.1)
где – БМФ при
Разделим обе части равенства (18.1) на
(18.2)
Очевидно, что
Следовательно, равенство (18.2) можно переписать в виде:
(18.3)
где – бесконечно малые функции при
Определение 18.1. Производной от функции в точке по направлению вектора называется предел отношения при
Обозначение:
Производная показывает скорость изменения функции в направлении вектора
Переходя к пределу в равенстве (18.3), получим
(18.4)
Из (18.4) следует, что, зная частные производные функции, легко найти производную по любому направлению вектора
Заметим, что частные производные являются, по сути, частными случаями производной по направлению.
Так, например, при и
Пример №36
Для функции найти производную в точке по направлению вектора
Решение.
Найдем частные производные функции в точке
Так как то направляющие косинусы вектора будут определяться формулами:
Тогда
Следовательно,
Ответ:
Градиент
Рассмотрим функцию определенную в области
Определение 19.1. Говорят, что в области определено скалярное поле, если для каждой точки задано некоторое число (скаляр), т. е.
Таким образом, функция – числовая функция точки.
Пример: Температурное поле; распределение концентрации вещества в растворе.
Определение 19.2. Говорят, что в области определено векторное поле, если для каждой точки задан некоторый вектор, т. е.
Пример: Силовое поле, создаваемое некоторым притягивающим центром.
В каждой точке области в которой задана функция определим вектор, проекциями которого на оси координат являются частные производные и этой функции в соответствующей точке:
Этот вектор называется градиентом функции
Обозначение: – набла).
Таким образом, скалярное поле, задаваемое функцией порождает векторное поле – поле градиентов
Теорема 19.1. Пусть дано скалярное поле и в нем определено поле градиентов. Тогда производная по направлению некоторого вектора равна проекции вектора на вектор
Доказательство.
Рассмотрим единичный вектор соответствующий вектору
Вычислим скалярное произведение векторов и
(19.1)
Правая часть формулы (19.1) – производная функции по направлению вектора Следовательно,
Если обозначить угол между векторами и через то можно записать:
(19.2)
Свойства градиента
1. Производная в точке по направлению вектора имеет наибольшее значение, если направление вектора совпадает с направлением градиента. Это наибольшее значение производной равно (следует непосредственно из равенства (19.2)).
2. Производная по направлению вектора, перпендикулярного к вектору равна нулю (следует из равенства (19.2) при
Определение 19.3. Точка в которой
называется особой для скалярного поля; в противном случае обыкновенной (неособой).
Теорема 19.2*. Во всякой неособой точке плоского скалярного поля градиент поля направлен по нормали к линии уровня, проходящей через эту точку, в сторону возрастания поля.
Пример №37
Найти скорость и направление наибыстрейшего возрастания функции в точке
Решение.
Направление наибыстрейшего возрастания функции в точке совпадает с направлением градиента, а его скорость равна значению длины градиента в этой точке.
Найдем градиент функции в общем виде
В данном случае В точке
Скорость возрастания составит:
Ответ: направление наибыстрейшего возрастания функции в точке задается вектором а его скорость составляет
Касательная плоскость и нормаль к поверхности
Рассмотрим функцию Ее графиком является некоторая поверхность
Определение 20.1. Касательной плоскостью к поверхности в данной точке называется плоскость, которая содержит все касательные к кривым, проведенным на поверхности через эту точку.
Получим уравнение касательной плоскости к поверхности в точке Рассмотрим сечения поверхности плоскостями и (рис. 20.1). Линия пересечения поверхности с плоскостью будет определяться системой линия пересечения поверхности с плоскостью
будет определяться системой
Уравнения касательных прямых и к линиям и в точке можно представить через пересечение плоскостей соответственно
(20.1)
(20.2)
Уравнение плоскости по точке и вектору нормали имеет вид откуда при
(20.3)
Касательные прямые и к линиям и получаются сечением плоскости (формула (20.3)) двумя плоскостями и Следовательно, уравнения касательной прямой имеют вид
(20.4)
уравнения касательной прямой имеют вид
(20.5)
Сравнивая коэффициенты при в формулах (20.2) и (20.5), при в формулах (20.1) и (20.4), получим
Подставим эти значения в уравнение (20.3), преобразуем и получим уравнение касательной плоскости проходящей через касательные прямые и
(20.6)
В случае неявного задания поверхности уравнением так как
уравнение касательной плоскости проходящей через касательные прямые и принимает вид
(20.7)
Заметим, что точка, в которой хотя бы одна из частных производных или не существует
или обращается в нуль, называется особой точкой поверхности. В такой точке поверхность может не иметь касательной плоскости.
Определение 20.2. Нормалью к поверхности в точке называется прямая, проходящая через эту точку перпендикулярно к касательной плоскости, проведенной в данной точке поверхности.
Воспользуемся условием перпендикулярности прямой и плоскости и запишем уравнения нормали к поверхности в точке
(20 8)
В случае неявного задания поверхности уравнением уравнения нормали к поверхности в точке примут вид
(20.9)
Пример №38
Найти уравнения касательной плоскости и нормали к поверхности в точке
Решение.
Найдем частные производные функции в точке
Уравнение касательной плоскости найдем по формуле (20.6):
Уравнения нормали найдем по формуле (20.8):
или
Ответ:
Пример №39
Найти уравнения касательной плоскости и нормали к поверхности в точке
Решение.
Найдем частные производные функции в точке
Уравнение касательной плоскости найдем по формуле (20.7):
Уравнения нормали найдем по формуле (20.9):
или
Ответ:
Необходимые и достаточные условия локального экстремума функции двух переменных
Определение 21.1. Функция имеет локальный максимум (минимум) в точке если существует окрестность данной точки, такая, что для всех точек этой окрестности выполняется неравенство
Пример: Функция достигает минимума в точке
Теорема 21.1*(необходимые условия экстремума). Если функция имеет экстремум в точке то каждая частная производная первого порядка данной функции или обращается в этой точке в нуль, или не существует.
Так же, как и в случае функции одной переменной, точки, в которых частные производные обращаются в нуль или не существуют, называются критическими (стационарными) точками функции
Теорема 21.2* (достаточные условия экстремума). Пусть функция определена и имеет непрерывные частные производные второго порядка в некоторой области Пусть точка — критическая точка функции Обозначим
Тогда, если
то в точке функция имеет экстремум, причем если – максимум, если – минимум;
— функция экстремума не имеет;
– необходимы дополнительные исследования.
Заметим, что в случае т.е. когда в точке функция не имеет ни минимума, ни максимума, поверхность, служащая графиком функции, может вблизи этой точки иметь форму «седла». Например, (рис. 21.1). В этом случае говорят, что в данной точке наблюдается явление минимакса.
Теорема 21.3* (достаточные условия экстремума). Пусть функция определена и имеет непрерывные частные производные второго порядка в некоторой области Пусть точка — критическая точка функции Тогда, если:
(при ), то в точке функция имеет максимум;
(при ), то в точке функция имеет минимум.
Пример №40
Исследовать на экстремум функцию
Решение.
Используя необходимые условия экстремума, найдем критические точки. Для этого найдем частные производные первого порядка
и решим систему уравнении
Таким образом, получены две критические точки и
Для исследования характера критических точек найдем частные производные второго порядка
Тогда
Для точки т. е. в этой точке функция не имеет экстремума.
Для точки т. е. в этой точке функция имеет экстремум, причем следовательно, это минимум.
Если для определения характера экстремума использовать дифференциал второго порядка, то рассуждения будут следующие. Для данной функции
Тогда
т. е. еще раз показано, что в точке функция имеет минимум.
Ответ:
Наибольшее и наименьшее значения функции двух переменных в замкнутой области
Рассмотрим некоторое множество точек на плоскости.
Напомним ряд следующих определений.
Точка называется внутренней точкой множества если она принадлежит этому множеству вместе с некоторой своей окрестностью.
Точка называется граничной точкой множества если в любой ее окрестности имеются точки как принадлежащие так и не принадлежащие этому множеству.
Совокупность всех граничных точек множества называется его границей
Множество называется областью (открытым множеством), если все его точки внутренние.
Множество с присоединенной границей т. е. называется замкнутой областью.
Область называется ограниченной, если она целиком содержится внутри круга достаточно большого радиуса.
Определение 22.1. Наибольшее или наименьшее значение функции в данной области называется абсолютным экстремумом (абсолютным максимумом или абсолютным минимумом) функции в этой области.
Теорема 22.1*. Абсолютный экстремум непрерывной функции в области достигается либо в критической точке функции, принадлежащей этой области, либо в граничной точке области.
Пример №41
Найти наибольшее и наименьшее значения функции в треугольной области с вершинами и
Решение.
Изобразим область графически, рис. 22.1. Найдем частные производные функции:
Определим ее критические точки из решения системы уравнений:
Таким образом, критической точкой функции является точка принадлежащая области Вычислим
Исследуем поведение функции на границе области.
На отрезке следовательно, для всех точек отрезка. Имеем функцию одной переменной
Найдем производную для и определим критические точки на данном отрезке из решения уравнения Получаем, Вычислим значение функции в точке Вычислим также значения функции на концах отрезка:
На отрезке следовательно для всех точек отрезка. Имеем функцию одной переменной
Найдем производную для и определим критические точки на данном отрезке из решения уравнения Получаем Вычислим значение функции в точке Вычислим также значения функции на концах отрезка: (получено ранее),
Рассмотрим отрезок Он представляет собой часть прямой, проходящей через точки и Получим уравнение данной прямой по формуле Имеем
Таким образом, на отрезке следовательно
Имеем функцию одной переменной Найдем производную для
и определим критические точки на данном отрезке из решения уравнения Получаем Вычислим значение функции в точке Значения функции на концах отрезка вычислены ранее.
Сравнив все вычисленные значения функции, имеем и
Ответ: и
Условный экстремум ФНП
В ряде задач на поиск наибольших и наименьших значений ФНП переменные бывают связаны друг с другом некоторыми добавочными условиями. В этом случае говорят об условном экстремуме. Заметим, что необходимым условием разрешимости является то, что число уравнений обязательно меньше числа переменных.
Рассмотрим вопрос об условном экстремуме функции двух переменных, если переменные связаны одним условием.
Пусть требуется найти экстремумы функции
(23.1)
при условии, что и связаны уравнением
(23.2)
В определенных случаях данная задача может быть решена методом подстановки. Если удастся, например, разрешить уравнение (23.2) относительно то, подставляя в (23.1) вместо найденное выражение, получим функцию одной переменной и тогда исходная задача будет сведена к задаче исследования на экстремум функции одной независимой переменной .
В случае, когда разрешить уравнение (23.2) не представляется возможным, используют другие методы. В частности, используется метод множителей Лагранжа.
Суть метода сводится к следующему: на основании исходной функции (23.1) и условия связи (23.2) строится вспомогательная функция Лагранжа
Функция – функция трех переменных. Необходимым условием существования экстремума данной функции (в предположении, что исходные функции непрерывно дифференцируемы) является равенство нулю частных производных. Система для определения критических точек функции Лагранжа имеет вид:
или (23.3)
Решения системы (23.3) определяют критические точки функции Лагранжа, а также – критические точки функции (23.1) при условии (23.2).
Достаточные условия условного экстремума связаны с изучением знака дифференциала второго порядка функции Лагранжа.
Теорема 23.1*. Пусть функции и определены и имеют непрерывные частные производные второго порядка в некоторой области Пусть точка — критическая точка функции причем Тогда, если при выполнении условий
то в точке функция имеет условный максимум; то в точке функция имеет условный минимум.
Теорема 23.2*. Пусть функции и определены и имеют непрерывные частные производные второго порядка в некоторой области Пусть точка – критическая точка функции причем Тогда если
то в точке функция имеет условный максимум; если то в точке функция имеет условный минимум.
Заметим, что параметр носит вспомогательный характер и в вычислении значений условных экстремумов не используется.
Пример №42
Найти экстремумы функции при условии
Решение.
Преобразуем условие связи к виду (23.2):
Составим функцию Лагранжа
Найдем частные производные функции Лагранжа:
Система для определения критических точек имеет вид:
Решив систему, получим: и . Для определения характера экстремума найдем частные производные второго порядка функции Лагранжа:
Выполнение условия означает: тогда
Так как то в точке исходная функция имеет условный минимум, причем
так как то в точке исходная функция имеет условный максимум, причем
Для определения характера экстремума с использованием определителя, составим его в общем виде:
Так как то в точке исходная функция имеет условный минимум, причем так как то в точке исходная функция имеет условный максимум, причем
Ответ:
В случае если требуется найти экстремумы функции переменных при условии, что переменные связаны уравнениями связи
составляется функция Лагранжа с множителями
Для определения критических точек необходимо решить систему из уравнений:
Наличие и характер экстремума можно установить, используя дифференциал второго порядка функции Лагранжа.
Метод наименьших квадратов нахождения приближенной функциональной зависимости двух переменных
Пусть на основании наблюдений требуется установить функциональную зависимость показателя от фактора
(24.1)
Пусть в результате наблюдений получено значений при соответствующих значениях фактора табл. 24.1.
Таблица 24.1
Вид функции (24.1), называемой функцией регрессии, устанавливается или из теоретических соображений, или на основании характера расположения на координатной плоскости точек, соответствующих результатам наблюдений (поле корреляции).
При выбранном виде функции где -неизвестные параметры, остается подобрать их так, чтобы в каком-то смысле функция наилучшим образом описывала рассматриваемый процесс.
Широко распространенным методом решения данной задачи является метод наименьших квадратов (МНК). Рассмотрим сумму квадратов разностей значений yt, полученных в результате наблюдений, и функции в соответствующих точках:
(24.2)
Подберем параметры так, чтобы эта сумма имела наименьшее значение. Таким образом, задача сводится к нахождению таких значений параметров при которых функция имеет минимум.
На основании необходимых условий экстремума ФНП получаем, что значения параметров должны удовлетворять системе уравнений
или (24.3)
В системе (24.3) уравнений столько, сколько неизвестных параметров имеет функция (24.2).
Заметим, что вопрос о существовании решения системы уравнений (24.3) и существовании минимума функции (24.2) исследуется в каждом конкретном случае в зависимости от вида выбранной функции
Случай линейной зависимости
Предположим, что между значениями фактора и признака существует линейная зависимость вида Функция (24.2) в этом случае принимает вид:
(24.4)
Это функция с двумя переменными и так как и – заданные числа. Следовательно, система для определения критических точек функции (24.4) будет следующей:
Откуда
Так как неизвестными в данной системе являются и то удобнее привести ее к виду:
(24.5)
Заметим, что методом математической индукции можно доказать, что определитель матрицы коэффициентов системы (24.5),
при положителен, т. е. Это позволяет сделать вывод, что (24.5) имеет единственное решение. Получаем
(24.6)
Покажем, что найденные значения параметров и определяют минимум функции (24.4). Для этого найдем частные производные второго порядка:
Тогда а это означает, что при найденных значениях параметров и функция (24.4) имеет экстремум. Очевидно, что Значит, функция (24.4), при данных значениях и имеет единственную точку минимума.
Случай квадратичной зависимости
Предположим, что между значениями фактора и признака
существует квадратичная зависимость вида: Функция (24.2) в этом случае принимает вид:
Это функция трех переменных: Система уравнений (24.3) принимает вид:
После преобразований, получаем
Получена система линейных уравнений для определения неизвестных Можно доказать, что определитель этой системы отличен от нуля, следовательно, она будет иметь единственное решение. При полученных значениях параметров функция будет иметь минимум.
Случаи сведения функций к линейной. Выбор «лучшей» функции
Рассмотрим другие виды функций, используемых в экономических исследованиях и способы их сведения к линейной зависимости, табл. 24.2.
Таблица 24.2
Для проверки адекватности построенной зависимости реальному поведению значений и можно использовать коэффициент аппроксимации МАРЕ:
(24.7)
где – значения функции регрессии, вычисленные по соответствующим значениям
В случае, если полученная функция регрессии имеет высокую точность. Если точность функции регрессии хорошая (допустимая). При точность полученной функции удовлетворительная, однако использование данной зависимости на практике спорно. При точность неудовлетворительная и использование данной функции в анализе недопустимо.
В случае если при исследованиях зависимость и определили с помощью нескольких функций, то для выбора «лучшей» рассчитывают среднюю квадратичную ошибку
(24.8)
где – количество параметров полученной функции.
Для дальнейших исследований обычно используют функцию с наименьшей квадратичной ошибкой.
Пример: В табл. 24.3 приведены данные о зависимости значений признака от значений фактора
Таблица 24.3
Требуется:
1) построить функцию регрессии вида оценить ее качество, найти среднюю квадратичную ошибку уравнения регрессии;
2) построить функцию регрессии вида оценить ее качество, найти среднюю квадратичную ошибку уравнения регрессии;
3) сравнить полученные результаты и сделать вывод о возможности их использования в прогнозировании.
Решение.
Для построения функций регрессии будем использовать метод наименьших квадратов. Все расчеты будем выполнять с точностью до трех знаков после запятой.
1. В случае линейной регрессии система для определения параметров и будет иметь вид (24.5).
Все вспомогательные вычисления по определению постоянных коэффициентов данной системы представим в табл. 24.4.
Таблица 24.4
Система для определения параметров принимает вид:
Воспользуемся формулами (24.6) и получим
Таким образом, в случае линейной зависимости, функция регрессии принимает вид
Для оценки качества полученной функции регрессии будем использовать коэффициент аппроксимации МАРЕ (24.7), среднюю квадратичную ошибку рассчитаем по формуле (24.8). Все вспомогательные вычисления представим в табл. 24.5. Согласно расчетам, коэффициент аппроксимации что соответствует высокой точности функции.
Средняя квадратичная ошибка составит
Таблица 24.5
2. В случае зависимости вида предварительно требуется выполнить замену Выполнив все вспомогательные вычисления по определению постоянных коэффициентов получим систему:
откуда Таким образом, в случае квадратичной зависимости, функция регрессии принимает вид
Кроме того, в данном случае вычисления позволяют получить следующие результаты:
что соответствует допустимой точности функции регрессии; средняя квадратичная ошибка составит
3. Таким образом, функция регрессии обладает высокой точностью, функция регрессии -допустимой точностью, а это означает, что использование первой функции обеспечит более достоверные результаты при прогнозировании. Средняя квадратичная ошибка для функции также меньше, чем для функции
Вывод. На основе данных о зависимости значений признака от значений фактора были построены две функции регрессии: и В целях прогнозирования рекомендуется использовать зависимость вида так как она обладает высокой точностью соответствия исходным данным и меньшей средней квадратичной ошибкой функции регрессии.
- Комплексные числ
- Координаты на прямой
- Координаты на плоскости
- Линейная функция
- Знакопеременные ряды
- Степенные ряды
- Элементы матричного анализа
- Уравнение линии