Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, T. 512, № 1, стр. 78-80
МЕТОД ЛОКАЛИЗАЦИИ ФИКТИВНЫХ ЭКСТРЕМУМОВ В ЗАДАЧЕ ГЛОБАЛЬНОЙ ОПТИМИЗАЦИИ
Академик Ю. Г. Евтушенко 1, 2, *, А. А. Третьяков 1, 3, **
1 Федеральный исследовательский центр
“Информатика и управление”
Российской академии наук
Москва, Россия
2 Московский физико-технический институт (национальный исследовательский университет)
Долгопрудный, Московская обл., Россия
3 Siedlce University, Faculty of Sciences
Siedlce, Poland
* E-mail: yuri-evtushenko@yandex.ru
** E-mail: prof.tretyakov@gmail.com
Поступила в редакцию 19.04.2023
После доработки 04.07.2023
Принята к публикации 13.07.2023
- EDN: PNRHVU
- DOI: 10.31857/S2686954323600222
Аннотация
Рассматривается задача поиска глобального экстремума неотрицательной функции на положительном параллелепипеде в n-мерном евклидовом пространстве. Предложен метод локализации фиктивных экстремумов в ограниченной области вблизи начала координат, что позволяет отделить точку глобального экстремума от фиктивных экстремумов путем отбрасывания его на существенное расстояние от множества локализации фиктивных минимумов. При этом за счет выбора начальной точки в методе градиентного спуска удается обосновать сходимость итерационной последовательности к глобальному экстремуму минимизируемой функции.
Рассматривается задача
где $\Pi = \{ x \in {{\mathbb{R}}^{n}}\,{\text{|}}\,{{a}^{i}} \leqslant {{x}^{i}} \leqslant {{b}^{i}},i = 1, \ldots ,m\} $. При этом считаем, что в точке минимума $x{\kern 1pt} * = \mathop {\arg \min }\limits_{x \in \Pi } \varphi (x)$, $\varphi (x{\kern 1pt} *) = 0$ и ${{a}^{i}} > 0$, $i = 1, \ldots ,m$.Данные предположения не являются принципиальными, но облегчают описание предложенного подхода решения таких задач. Пусть $\{ x_{j}^{*}\} $, $j \in P$, множество локальных минимумов для задачи (1), $P = \{ 1, \ldots ,p\} $, и глобальный минимум достигается при $j = {{j}_{0}}$ в точке $x_{{{{j}_{0}}}}^{*} = x{\kern 1pt} *$. В общем случае данная задача является многоэкстремальной. Один из способов ее решения – это классический градиентный метод [1], схема которого имеет следующую структуру
(2)
${{x}_{{k + 1}}} = {{x}_{k}} - {{\alpha }_{k}}\varphi {\kern 1pt} '({{x}_{k}}),\quad {{x}_{0}} \in {{\mathbb{R}}^{n}},$(3)
$\begin{gathered} \varphi ({{x}_{k}}) - \varphi ({{x}_{{k + 1}}}) \geqslant {{q}_{k}}{\kern 1pt} {{\alpha }_{k}}{\text{||}}\varphi {\kern 1pt} '({{x}_{k}}){\text{|}}{{{\text{|}}}^{2}}, \\ {{q}_{k}} \in \left( {\frac{1}{2},1} \right),\quad k = 0,1, \ldots , \\ \end{gathered} $– итерационная последовательность (2), определенная начальной точкой ${{x}_{0}}$, будет сходиться к ближайшему локальному минимуму, т.е.
(4)
$x_{j}^{*}({{x}_{0}}) = \mathop {\arg \min }\limits_{j \in P} {\text{||}}{{x}_{0}} - x_{j}^{*}{\text{||}}.$Предположение (4) весьма естественно, и мы примем его в качестве отправного.
Отметим, что функция $\varphi (x)$ определена только в прямоугольнике $\Pi $, но мы можем ее доопределить гладким образом за границы прямоугольника (параллелепипеда) $\Pi $ так, что

Новизна метода состоит в том, что делается замена координат
и минимизируется функция $\bar {\varphi }(y) = \varphi (x(y))$ во всем пространстве ${{\mathbb{R}}^{n}}$, где $x(y)$ – решение системы (6). Здесь $\varepsilon > 0$ достаточно малое число, при котором фиктивные (локальные) минимумы $y_{j}^{*}\, = \,\frac{{x_{j}^{*}}}{{\varphi (x_{j}^{*})\, + \,\varepsilon }}$, $j \in P{{\backslash }}\{ {{j}_{0}}\} $, функции $\bar {\varphi }(y)$ остаются в ограниченном параллелепипеде(7)
${{y}_{{k + 1}}} = {{y}_{k}} - {{\alpha }_{k}}\bar {\varphi }{\kern 1pt} '(x({{y}_{k}})),\quad k = 0,1, \ldots ,$При этом $\bar {\varphi }'(y) = \varphi _{x}^{'}(x(y)) \cdot x{\kern 1pt} '(y)$, где $x(y)$ берем как решение уравнения (6) и по теореме о неявной функции
Очевидно, что для существования $\bar {\varphi }{\kern 1pt} '(y)$ нужно требовать невырожденность матрицы $x{\kern 1pt} '(y)$ во всех точках $y \in {{\mathbb{R}}^{n}}$.
Все вышеизложенное можно сформулировать в виде следующего результата:
Теоpема 1. Пусть $\varphi \in {{C}^{2}}({{\mathbb{R}}^{n}})$, ${\text{||}}\varphi {\kern 1pt} '{\kern 1pt} '(x){\text{||}} \leqslant C$, $x\, \in \,{{\mathbb{R}}^{n}}$, выполняется предположение (4) и матрица $x{\kern 1pt} '(y)$ невырождена для всех $y \in {{\mathbb{R}}^{n}}$.
Тогда существует достаточно большое ${{N}_{0}} > 0$, такое, что при $N \geqslant {{N}_{0}}$ и ${{y}_{0}} = (2N, \ldots ,2N{{)}^{ \top }}$ выполняется неравенство
Доказательство. Достаточно показать, что вне области $\bar {\Pi }$ не будет локальных экстремумов, кроме $y{\kern 1pt} *$, т.е. $\bar {\varphi }{\kern 1pt} '(y) \ne 0$, $y \in {{\mathbb{R}}^{n}}{{\backslash }}\bar {\Pi }$.
Действительно, если для некоторого $\tilde {y} \in {{\mathbb{R}}^{n}}{{\backslash }}\bar {\Pi }$ будет $\bar {\varphi }{\kern 1pt} '(\tilde {y}) = 0$, то либо $\varphi _{x}^{'}(x(\tilde {y})) = 0$, либо матрица $x{\kern 1pt} '(\tilde {y})$ вырождена. Второе очевидно невозможно в силу условий теоремы. Если же $\varphi _{x}^{'}(x(\tilde {y})) = 0$, то либо $\tilde {y} \in \bar {\Pi }$, что и требовалось, либо соответствующий . Но в последнем случае градиент $\varphi _{x}^{'}(x(\tilde {y}))$ не может равняться нулю вне области $\Pi $, согласно (5). Теорема доказана. ◻
Подчеркнем тот факт, что по формуле
(8)
$\begin{gathered} {{y}_{k}} = \frac{x}{{\varphi (x) + \varepsilon }} = \frac{{t \cdot {{y}_{k}}}}{{\varphi (t \cdot {{y}_{k}}) + \varepsilon }}, \\ {\text{откуда}}\quad {\kern 1pt} {{x}_{k}} = x({{y}_{k}}), \\ \end{gathered} $Другой подход к решению задачи глобальной оптимизации можно найти, например, в [3].
ИСТОЧНИК ФИНАНСИРОВАНИЯРабота выполнена при финансовой поддержке Российского научного фонда (проект №~21-71-30005).
Список литературы
Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации. М.: Наука, 1982.
Карманов В.Г. Математическое программирование. М.: Наука, 1986.
Grishagin V., Israfilov R., Sergeyev Y. Convergence conditions and numerical comparison of global optimization methods based on dimensionality reduction schemes // Applied Mathematics and Computation. 2018. V. 318. P. 270–280.
Дополнительные материалы отсутствуют.
Инструменты
Доклады Российской академии наук. Математика, информатика, процессы управления