Экстремум функции нескольких переменных Понятие экстремума функции нескольких переменных. Необходимые и достаточные условия экстремума Условный экстремум Наибольшее и наименьшее значения непрерывных функций. Локальные экстремумы
УСЛОВНЫЙ ЭКСТРЕМУМ
Минимальное или максимальное значение, достигаемое данной функцией (или функционалом) при условии, что нек-рые другие функции (функционалы) принимают значения из заданного допустимого множества. Если условия, ограничивающие в указанном смысле изменения независимых переменных (функций), отсутствуют, то говорят о безусловном экстремуме.
Классич. задачей на У. э. является задача определения минимума функции многих переменных
При условии, что нек-рые другие функции принимают заданные значения:
В этой задаче G, к-рому должны принадлежать значения вектор-функции g=
(g 1 , ...,g m
),
входящей в дополнительные условия (2), есть фиксированная точка c=
(c 1 , ..., с т
)в m-мерном евклидовом пространстве
Если в (2) наряду со знаком равенства допускаются знаки неравенства
То это приводит к задаче нелинейного программирования
(1), (3).
В задаче (1), (3) множество Gдопустимых значений вектор-функции gпредставляет собой нек-рый криволинейный , принадлежащий (n-m 1)-мерной гиперповерхности, задаваемой т 1 , m
1
Частным случаем задачи (1), (3) на У. в. является задача линейного программирования,
в к-рой все рассматриваемые функции f и g i
являются линейными по x l , ... , х п.
В задаче линейного программирования множество Gдопустимых значений вектор-функции g,
входящей в условия, ограничивающие область изменения переменных x 1 , .....x n ,
представляет собой , принадлежащий (п-т 1)-мерной гиперплоскости, задаваемой m 1 условиями типа равенства в (3).
Аналогичным образом большинство задач оптимизации функционалов, представляющих нрактич. интерес, сводится к задачам на У. э. (см. Изопериметрическая задача, Кольца задача, Лагранжа задача, Манера задача
).
Так же, как и в математич. программировании, основными задачами вариационного исчисления и теории оптимального управления являются задачи на У. э.
При решении задач на У. э., особенно при рассмотрении теоретич. вопросов, связанных с задачами на У. э., весьма полезным оказывается использование неопределенных Лагранжа множителей,
позволяющих свести задачу на У. э. к задаче на безусловный и упростить необходимых условий оптимальности. Использование множителей Лагранжа лежит в основе большинства классич. методов решения задач на У. э.
Лит.
: Xедли Дж., Нелинейное и , пер. с англ., М., 1967; Блисс Г. А., Лекции по вариационному исчислению, пер. с англ., М., 1950; Понтрягин Л. С. [и др.], Математическая оптимальных процессов, 2 изд., М., 1969.
И. Б. Вапнярский.
Математическая энциклопедия. - М.: Советская энциклопедия . И. М. Виноградов . 1977-1985 .
Смотреть что такое "УСЛОВНЫЙ ЭКСТРЕМУМ" в других словарях:
Относительный экстремум, экстремум функции f (x1,..., xn + m) от п + т переменных в предположении, что эти переменные подчинены ещё т уравнениям связи (условиям): φk (x1,..., xn + m) = 0, 1≤ k ≤ m (*) (см. Экстремум).… …
Пусть открытое множество и на заданы функции. Пусть. Эти уравнения называют уравнениями связей (терминология заимствованна из механики). Пусть на G определена функция … Википедия
- (от лат. extremum крайнее) значение непрерывной функции f (x), являющееся или максимумом, или минимумом. Точнее: непрерывная в точке х0 функция f (x) имеет в x0 максимум (минимум), если существует окрестность (x0 + δ, x0 δ) этой точки,… … Большая советская энциклопедия
У этого термина существуют и другие значения, см. Экстремум (значения). Экстремум (лат. extremum крайний) в математике максимальное или минимальное значение функции на заданном множестве. Точка, в которой достигается экстремум,… … Википедия
Функция, используемая при решении задач на условный экстремум функций многих переменных и функционалов. С помощью Л. ф. записываются необходимые условия оптимальности в задачах на условный экстремум. При этом не требуется выражать одни переменные … Математическая энциклопедия
Математическая дисциплина, посвященная отысканию экстремальных (наибольших и наименьших) значений функционалов переменных величин, зависящих от выбора одной или нескольких функций. В. и. является естественным развитием той главы… … Большая советская энциклопедия
Переменные, с помощью к рых строится Лагранжа функция при исследовании задач на условный экстремум. Использование Л. м. и функции Лагранжа позволяет единообразным способом получать необходимые условия оптимальности в задачах на условный экстремум … Математическая энциклопедия
Вариационное исчисление это раздел функционального анализа, в котором изучаются вариации функционалов. Самая типичная задача вариационного исчисления состоит в том, чтобы найти функцию, на которой заданный функционал достигает… … Википедия
Раздел мате.матики, посвященный исследованию методов отыскания экстремумов функционалов, зависящих от выбора одной или нескольких функций при разного рода ограничениях (фазовых, дифференциальных, интегральных И т. п.), накладываемых на эти… … Математическая энциклопедия
Вариационное исчисление это раздел математики, в котором изучаются вариации функционалов. Самая типичная задача вариационного исчисления состоит в том, чтобы найти функцию, на которой функционал достигает экстремального значения. Методы… … Википедия
Книги
- Лекции по теории управления. Том 2. Оптимальное управление , В. Босс. Рассматривается классическая проблематика теории оптимального управления. Изложение начинается с базовых понятий оптимизации в конечномерных пространствах: условный и безусловный экстремум,…
Определение1 : Говорят, что функция имеет в точке локальный максимум, если существует такая окрестность точки, для которой для всякой точки M с координатами (x, y) выполняется неравенство: . При этом, т. е. приращение функции < 0.
Определение2 : Говорят, что функция имеет в точке локальный минимум, если существует такая окрестность точки, для которой для всякой точки M с координатами (x, y) выполняется неравенство: . При этом, т. е. приращение функции > 0.
Определение 3 : Точки локальных минимума и максимума называются точками экстремума .
Условные Экстремумы
При отыскании экстремумов функции многих переменных часто возникают задачи, связанные с так называемым условным экстремумом. Это понятие можно разъяснить на примере функции двух переменных.
Пусть заданы функция и линия L на плоскости 0xy . Задача состоит в том, чтобы на линии L найти такую точку P(x, y), в которой значение функции является наибольшим или наименьшим по сравнению со значениями этой функции в точках линии L , находящихся вблизи точки P . Такие точки P называются точками условного экстремума функции на линии L . В отличие от обычной точки экстремума значение функции в точке условного экстремума сравнивается со значениями функции не во всех точках некоторой ее окрестности, а только в тех, которые лежат на линии L .
Совершенно ясно, что точка обычного экстремума (говорят также безусловного экстремума ) является и точкой условного экстремума для любой линии, проходящей через эту точку. Обратное же, разумеется, неверно: точка условного экстремума может и не быть точкой обычного экстремума. Поясню сказанное обычным примером. Графиком функции является верхняя полусфера (Приложение 3 (Рис 3)).
Эта функция имеет максимум в начале координат; ему соответствует вершина M полусферы. Если линия L есть прямая, проходящая через точки А и В (ее уравнение x+y-1=0 ), то геометрически ясно, что для точек этой линии наибольшее значение функции достигается в точке, лежащей посередине между точками А и В. Это и есть точка условного экстремума (максимума) функции на данной линии; ей соответствует точка M 1 на полусфере, и из рисунка видно, что ни о каком обычном экстремуме здесь не может быть речи.
Отметим, что в заключительной части задачи об отыскании наибольшего и наименьшего значений функции в замкнутой области нам приходится находить экстремальные значения функции на границе этой области, т.е. на какой-то линии, и тем самым решать задачу на условный экстремум.
Приступим теперь к практическому отысканию точек условного экстремума функции Z= f(x, y) при условии, что переменные x и y связаны уравнением (x, y) = 0. Это соотношение будем называть уравнение связи. Если из уравнения связи y можно выразить явно через х: y=(x), мы получим функцию одной переменной Z= f(x, (x)) = Ф(х).
Найдя значение х, при которых эта функция достигает экстремума, и определив затем из уравнения связи соответствующие им значения у, мы и получим искомые точки условного экстремума.
Так, в вышеприведенном примере из уравнения связи x+y-1=0 имеем y=1-х. Отсюда
Легко проверить, что z достигает максимума при х = 0,5; но тогда из уравнения связи y=0,5, и мы получаем как раз точку P, найденную из геометрических соображений.
Очень просто решается задача на условный экстремум и тогда, когда уравнение связи можно представить параметрическими уравнениями х=х(t), y=y(t). Подставляя выражения для х и у в данную функцию, снова приходим к задаче отыскания экстремума функции одной переменной.
Если уравнение связи имеет более сложный вид и нам не удается ни явно выразить одну переменную через другую, ни заменить его параметрическими уравнениями, то задача отыскания условного экстремума становится более трудной. Будем по-прежнему считать, что в выражении функции z= f(x, y) переменная (x, y) = 0. Полная производная от функции z= f(x, y) равна:
Где производная y`, найдена по правилу дифференцирования неявной функции. В точках условного экстремума найденная полная производная должна ровняться нулю; это дает одно уравнение, связывающее х и у. Так как они должны удовлетворять еще и уравнению связи, то мы получаем систему двух уравнений с двумя неизвестными
Преобразуем эту систему к гораздо более удобной, записав первое уравнение в виде пропорции и введя новую вспомогательную неизвестную:
(знак минус перед поставлен для удобства). От этих равенств легко перейти к следующей системе:
f` x =(x,y)+` x (x,y)=0, f` y (x,y)+` y (x,y)=0 (*),
которая вместе с уравнением связи (x, y) = 0 образует систему трех уравнений с неизвестными х, у и.
Эти уравнения (*) легче всего запомнить при помощи следующего правила: для того, чтобы найти точки, которые могут быть точками условного экстремума функции
Z= f(x, y) при уравнении связи (x, y) = 0, нужно образовать вспомогательную функцию
Ф(х,у)=f(x,y)+(x,y)
Где -некоторая постоянная, и составить уравнения для отыскания точек экстремума этой функции.
Указанная система уравнений доставляет, как правило, только необходимые условия, т.е. не всякая пара значений х и у, удовлетворяющая этой системе, обязательно является точкой условного экстремума. Достаточные условия для точек условного экстремума я приводить не стану; очень часто конкретное содержание задачи само подсказывает, чем является найденная точка. Описанный прием решения задач на условный экстремум называется методом множителей Лагранжа.
Пример
Найти экстремум
функции
при условии, чтох
и у
связаны
соотношением:
.
Геометрически задача означает
следующее: на эллипсе
плоскостью
.
Эту задачу можно
решать так: из уравнения
находим
х
:
при условии, что
,
свелась к задаче нахождения экстремума
функции одной переменной,
на отрезке
.
Геометрически
задача означает следующее: на эллипсе
,
полученном при пересечении цилиндра
плоскостью
,
требуется найти максимальное или
минимальное значение аппликаты(рис.9). Эту задачу можно решать так: из
уравнения
находим
.
Подставляя найденное значение у в
уравнение плоскости, получаем функцию
одной переменнойх
:
Тем самым задача
о нахождении экстремума функции
при условии, что
,
свелась к задаче нахождения экстремума
функции одной переменной,
на отрезке.
Итак, задача
отыскания условного экстремума
– это задача о нахождении экстремума
целевой функции
,
при условии, что переменныех
и у
подчиняются ограничению
,
называемомууравнением
связи.
Будем говорить,
что точка
,
удовлетворяющая уравнению связи,является
точкой локального условного максимума
(минимума
),
если существует окрестность
такая,
что для любых точек
,
координаты которых удовлетворяют
уравнению связи, выполнено неравенство.
Если из уравнения связи можно найти выражение для у , то, подставляя это выражение в исходную функцию, превращаем последнюю в сложную функцию одной переменной х.
Общим методом решения задачи на условный экстремум является метод множителей Лагранжа . Составим вспомогательную функцию, где─ некоторое число. Это функция называетсяфункцией Лагранжа , а ─ множителем Лагранжа. Таким образом, задача нахождения условного экстремума свелась к нахождению точек локального экстремума для функции Лагранжа. Для нахождения точек возможного экстремума надо решить систему из 3-х уравнений с тремя неизвестнымих, у и.
Затем следует воспользоваться следующим достаточным условием экстремума.
ТЕОРЕМА
.
Пусть точка
является точкой возможного экстремума
для функции Лагранжа. Предположим, что
в окрестности точки
существуют непрерывные частные
производные второго порядка функцийи.
Обозначим
Тогда, если
,
то
─ точка условного экстремума функции
при уравнении связи
при этом, если
,
то
─ точка условного минимума, если
,
то
─ точка условного максимума.
§8. Градиент и производная по направлению
Пусть функция
определена в некоторой (открытой)
области. Рассмотрим любую точку
этой области и любую направленную прямую
(ось),
проходящую через эту точку (рис. 1). Пусть
– какая-нибудь другая точка этой оси,
– длина отрезка между
и
,
взятая со знаком «плюс», если направление
совпадает с направлением оси,
и со знаком «минус», если их направления
противоположны.
Пусть
неограниченно приближается к
.
Предел
называется
производной
от функции
по направлению
(или вдоль оси)
и обозначается следующим образом:
.
Эта производная
характеризует «скорость изменения»
функции в точке
по направлению.
В частности, и обычные частные производные,также можно рассматривать как производные
«по направлению».
Предположим теперь,
что функция
имеет в рассматриваемой области
непрерывные частные производные. Пусть
осьобразует с осями координат углы
и.
При сделанных предположениях производная
по направлениюсуществует и выражается формулой
.
Если вектор
задан своими координатами
,
то производную функции
по направлению вектора
можно вычислить по формуле:
.
Вектор с координатами
называетсявектором-градиентом
функции
в точке
.
Вектор-градиент указывает направление
наиболее быстрого возрастания функции
в данной точке.
Пример
Дана функция
,
точка A(1,
1) и вектор
.
Найти: 1)grad
z
в точке A;
2) производную в точке A
по направлению вектора
.
Частные производные
данной функции в точке
:
;
.
Тогда вектор-градиент
функции в этой точке:
.
Вектор-градиент еще можно записать с
помощью разложения по векторами:
. Производная функции по направлению вектора:
Итак,
,
.◄
Экстремумы функций нескольких переменных. Необходимое условие экстремума. Достаточное условие экстремума. Условный экстремум. Метод множителей Лагранжа. Нахождение наибольших и наименьших значений.
Лекция 5.
Определение 5.1. Точка М 0 (х 0 , у 0) называется точкой максимума функции z = f (x, y), если f (x o , y o) > f (x, y) для всех точек (х, у) М 0 .
Определение 5.2. Точка М 0 (х 0 , у 0) называется точкой минимума функции z = f (x, y), если f (x o , y o) < f (x, y) для всех точек (х, у) из некоторой окрестности точки М 0 .
Замечание 1. Точки максимума и минимума называются точками экстремума функции нескольких переменных.
Замечание 2. Аналогичным образом определяется точка экстремума для функции от любого количества переменных.
Теорема 5.1 (необходимые условия экстремума). Если М 0 (х 0 , у 0) – точка экстремума функции z = f (x, y), то в этой точке частные производные первого порядка данной функции равны нулю или не существуют.
Доказательство.
Зафиксируем значение переменной у , считая у = у 0 . Тогда функция f (x, y 0) будет функцией одной переменной х , для которой х = х 0 является точкой экстремума. Следовательно, по теореме Ферма или не существует. Аналогично доказывается такое же утверждение для .
Определение 5.3. Точки, принадлежащие области определения функции нескольких переменных, в которых частные производные функции равны нулю или не существуют, называются стационарными точками этой функции.
Замечание. Таким образом, экстремум может достигаться только в стационарных точках, но не обязательно он наблюдается в каждой из них.
Теорема 5.2 (достаточные условия экстремума). Пусть в некоторой окрестности точки М 0 (х 0 , у 0) , являющейся стационарной точкой функции z = f (x, y), эта функция имеет непрерывные частные производные до 3-го порядка включительно. Обозначим Тогда:
1) f (x, y) имеет в точке М 0 максимум, если AC – B ² > 0, A < 0;
2) f (x, y) имеет в точке М 0 минимум, если AC – B ² > 0, A > 0;
3) экстремум в критической точке отсутствует, если AC – B ² < 0;
4) если AC – B ² = 0, необходимо дополнительное исследование.
Доказательство.
Напишем формулу Тейлора второго порядка для функции f (x, y), помня о том, что в стационарной точке частные производные первого порядка равны нулю:
где Если угол между отрезком М 0 М , где М (х 0 + Δх, у 0 + Δу ), и осью Ох обозначить φ, то Δх = Δρ cosφ, Δy = Δρsinφ. При этом формула Тейлора примет вид: . Пусть Тогда можно разделить и умножить выражение в скобках на А . Получим:
Рассмотрим теперь четыре возможных случая:
1) AC-B ² > 0, A < 0. Тогда , и при достаточно малых Δρ. Следовательно, в некоторой окрестности М 0 f (x 0 + Δx, y 0 + Δy) < f (x 0 , y 0) , то есть М 0 – точка максимума.
2) Пусть AC – B ² > 0, A > 0. Тогда , и М 0 – точка минимума.
3) Пусть AC-B ² < 0, A > 0. Рассмотрим приращение аргументов вдоль луча φ = 0. Тогда из (5.1) следует, что , то есть при движении вдоль этого луча функция возрастает. Если же перемещаться вдоль луча такого, что tg φ 0 = -A/B, то , следовательно, при движении вдоль этого луча функция убывает. Значит, точка М 0 не является точкой экстремума.
3`) При AC – B ² < 0, A < 0 доказательство отсутствия экстремума проводится
аналогично предыдущему.
3``) Если AC – B ² < 0, A = 0, то . При этом . Тогда при достаточно малых φ выражение 2B cosφ + C sinφ близко к 2В , то есть сохраняет постоянный знак, а sinφ меняет знак в окрестности точки М 0 . Значит, приращение функции меняет знак в окрестности стационарной точки, которая поэтому не является точкой экстремума.
4) Если AC – B ² = 0, а , , то есть знак приращения определяется знаком 2α 0 . При этом для выяснения вопроса о существовании экстремума необходимо дальнейшее исследование.
Пример. Найдем точки экстремума функции z = x ² - 2xy + 2y ² + 2x. Для поиска стационарных точек решим систему . Итак, стационарная точка (-2,-1). При этом А = 2, В = -2, С = 4. Тогда AC – B ² = 4 > 0, следовательно, в стационарной точке достигается экстремум, а именно минимум (так как A > 0).
Определение 5.4. Если аргументы функции f (x 1 , x 2 ,…, x n) связаны дополнительными условиями в виде m уравнений (m < n) :
φ 1 (х 1 , х 2 ,…, х n) = 0, φ 2 (х 1 , х 2 ,…, х n) = 0, …, φ m (х 1 , х 2 ,…, х n) = 0, (5.2)
где функции φ i имеют непрерывные частные производные, то уравнения (5.2) называются уравнениями связи .
Определение 5.5. Экстремум функции f (x 1 , x 2 ,…, x n) при выполнении условий (5.2) называется условным экстремумом .
Замечание. Можно предложить следующее геометрическое истолкование условного экстремума функции двух переменных: пусть аргументы функции f(x,y) связаны уравнением φ(х,у) = 0, задающим некоторую кривую в плоскости Оху . Восставив из каждой точки этой кривой перпендикуляры к плоскости Оху до пересечения с поверхностью z = f (x,y), получим пространственную кривую, лежащую на поверхности над кривой φ(х,у) = 0. Задача состоит в поиске точек экстремума полученной кривой, которые, разумеется, в общем случае не совпадают с точками безусловного экстремума функции f(x,y).
Определим необходимые условия условного экстремума для функции двух переменных, введя предварительно следующее определение:
Определение 5.6. Функция L (x 1 , x 2 ,…, x n) = f (x 1 , x 2 ,…, x n) + λ 1 φ 1 (x 1 , x 2 ,…, x n) +
+ λ 2 φ 2 (x 1 , x 2 ,…, x n) +…+λ m φ m (x 1 , x 2 ,…, x n) , (5.3)
где λ i – некоторые постоянные, называется функцией Лагранжа , а числа λ i – неопределенными множителями Лагранжа .
Теорема 5.3 (необходимые условия условного экстремума). Условный экстремум функции z = f (x, y) при наличии уравнения связи φ (х, у) = 0 может достигаться только в стационарных точках функции Лагранжа L (x, y) = f (x, y) + λφ (x, y).
Доказательство. Уравнение связи задает неявную зависимость у от х , поэтому будем считать, что у есть функция от х : у = у(х). Тогда z есть сложная функция от х , и ее критические точки определяются условием: . (5.4) Из уравнения связи следует, что . (5.5)
Умножим равенство (5.5) на некоторое число λ и сложим с (5.4). Получим:
, или .
Последнее равенство должно выполняться в стационарных точках, откуда следует:
(5.6)
Получена система трех уравнений относительно трех неизвестных: х, у и λ, причем первые два уравнения являются условиями стационарной точки функции Лагранжа. Исключая из системы (5.6) вспомогательное неизвестное λ, находим координаты точек, в которых исходная функция может иметь условный экстремум.
Замечание 1. Проверку наличия условного экстремума в найденной точке можно провести с помощью исследования частных производных второго порядка функции Лагранжа по аналогии с теоремой 5.2.
Замечание 2. Точки, в которых может достигаться условный экстремум функции f (x 1 , x 2 ,…, x n) при выполнении условий (5.2), можно определить как решения системы (5.7)
Пример. Найдем условный экстремум функции z = xy при условии х + у = 1. Составим функцию Лагранжа L(x, y) = xy + λ (x + y – 1). Система (5.6) при этом выглядит так:
Откуда -2λ=1, λ=-0,5, х = у = -λ = 0,5. При этом L (x, y) можно представить в виде L (x, y) = - 0,5 (x – y )² + 0,5 ≤ 0,5, поэтому в найденной стационарной точке L (x, y) имеет максимум, а z = xy – условный максимум.