Теплофизика высоких температур, 2021, T. 59, № 3, стр. 401-410

Аналитические условия оптимальности в обратных задачах теплопроводности

А. Н. Дилигенская *, Э. Я. Рапопорт

Самарский государственный технический университет
Самара, Россия

* E-mail: adiligenskaya@mail.ru

Поступила в редакцию 19.05.2020
После доработки 20.07.2020
Принята к публикации 22.12.2020

Полный текст (PDF)

Аннотация

Рассматривается решение обратной задачи технологической физики как задачи оптимального управления объектом с распределенными параметрами на основе сформулированного в качестве необходимых условий оптимальности принципа максимума Понтрягина для бесконечномерного объекта. Обратная задача теплопроводности формулируется в равномерной метрике оценки погрешности описания функции состояния исследуемого объекта и приводится к задаче оптимального управления бесконечномерным объектом с интегральным функционалом качества и расширенным вектором состояния, для которого с помощью принципа максимума Понтрягина устанавливается характер оптимального управляющего воздействия. Метод принципа максимума с учетом соотношений, обеспечивающих принадлежность решения заданному компактному множеству, позволяет получить параметрическое представление идентифицируемых сосредоточенных или пространственно распределенных характеристик.

ВВЕДЕНИЕ

Широкий круг технологических процессов в различных производственных сферах – в теплотехнике, металлургии, электроэнергетике и других – описывается дифференциальными уравнениями в частных производных, и синтез алгоритмов или систем управления этими объектами зачастую сводится к решению задач оптимального управления системами с распределенными параметрами. При решении таких задач применяются методы теории оптимального управления системами с распределенными параметрами, а также могут использоваться основные результаты теории оптимального управления системами с сосредоточенными параметрами при учете специфических особенностей объектов с распределенными параметрами (ОРП) [16].

Существенные результаты в разработке методов решения задач оптимального управления системами с сосредоточенными параметрами и ОРП получены на основе необходимых условий оптимальности. В качестве таких условий в большом числе случаев рассматриваются различные формы принципов максимума [16], базовым среди которых является принцип максимума Понтрягина (ПМП) [7]. Например, такой подход считается основным при решении задач программного управления и позволяет определить структуру параметризуемых алгоритмов оптимального управления с точностью до некоторого вектора $\Delta = ({{\Delta }_{i}}),$ $i = \overline {1,N} $ параметров ${{\Delta }_{i}}$ [1, 8, 9]. Обычно в типовых ситуациях поиска оптимальных управляющих воздействий широкого круга ОРП искомые управления принимают вид релейных (кусочно-постоянных) функций времени или пространственных координат, где в роли параметров ${{\Delta }_{i}}$ выступают длительности по соответствующему аргументу их отдельных интервалов постоянства [1, 811]. Последующий поиск числа $N$ параметров оптимального управления и их конкретных значений ${{\Delta }_{i}}$, удовлетворяющих заданным требованиям к качеству рассматриваемого процесса, обычно исчерпывает решение соответствующей задачи оптимального управления ОРП [1, 811].

Использование ПМП не ограничивается только синтезом программного управления, производимого на основе решения прямых задач, но также может быть распространено на широкий круг актуальных задач интерпретации данных физических экспериментов (наблюдений), возникающих при идентификации и диагностике неизвестных характеристик исследуемых технологических процессов и относящихся к классу обратных задач математической физики. Вследствие физической нереализуемости обратных задач [12] необходимо исследовать проблему устойчивости их решения [13].

Данная статья на примере обратных задач теплопроводности (ОЗТ) показывает конструктивный подход к решению обратных задач математической физики, в рамках которого использование принципа максимума Понтрягина позволяет установить структуру физически реализуемых идентифицируемых характеристик процесса на соответствующих компактных множествах. На примере пространственно одномерной математической модели ОРП, заданной линейным дифференциальным уравнением в частных производных параболического типа, показано применение ПМП, что позволяет получить структуру идентифицируемой сосредоточенной или пространственно распределенной характеристики ОЗТ.

ПОСТАНОВКА ЗАДАЧИ

Рассматривается нестационарный процесс теплопроводности для объекта с внутренним тепловыделением, описываемый уравнением теплопроводности в относительных единицах (времени $\varphi $ и пространственной координаты $x$), относительно температурного поля $\theta (x,\varphi )$

(1)
$\begin{gathered} \frac{{\partial \theta (x,\varphi )}}{{\partial \varphi }} = \frac{{{{\partial }^{2}}\theta (x,\varphi )}}{{\partial {{x}^{2}}}} + F(x)u(\varphi {\text{)}};\,\,\,\,0 < x < 1; \\ 0 < \varphi \leqslant {{\varphi }_{{{\text{end}}}}} \\ \end{gathered} $
при нулевых начальных условиях
(2)
$\theta \left( {x,{\text{ }}0} \right) = 0,\,\,\,x \in \left[ {0,{\text{ }}1} \right]$
и граничных условиях второго рода
(3)
$\frac{{\partial \theta (1,\varphi )}}{{\partial x}} = q(\varphi );\,\,\,\,\frac{{\partial \theta (0,\varphi )}}{{\partial x}} = 0,\,\,\,\,\varphi \in \left( {0,\varphi {\text{*}}} \right].$
Здесь $F(x)$ – закон пространственного распределения внутренних источников тепла, $u(\varphi )$ – суммарная объемная плотность мощности тепловыделения, $q(\varphi )$ – плотность граничного теплового потока.

При решении обратных задач задается дополнительная информация в виде данных физического эксперимента о значениях температуры $\theta * = \theta {\text{*}}(x*,\varphi ),$ полученных на интервале идентификации $\varphi \in [0,\varphi *]$ в некоторой фиксированной точке $x{\text{*}}.$

Сформулированные в экстремальной постановке обратные задачи математической физики могут рассматриваться как задачи оптимального управления. В рамках рассматриваемой математической модели требуется отыскать управляющие воздействия, обеспечивающие достижение минимальных значений заданного функционала качества, в роли которого фигурирует заданная в требуемой метрике невязка между экспериментальными данными $\theta {\text{*}}(\varphi )$ и аналитическим решением $\theta (x*,\varphi )$ исходной краевой задачи [1416]. В роли таких воздействий могут фигурировать $u(\varphi ),\,q(\varphi )$ или $F(x)$ в (1), (3), где для простоты всюду далее рассматриваются варианты использования в таком качестве только одной из величин при заданных значениях остальных.

Для решения поставленной задачи может применяться подход, основанный на параметрической оптимизации идентифицируемых характеристик на компактных множествах их определения в равномерной метрике оценивания температурной невязки между экспериментальным и расчетным температурным состояниями [1416].

ИДЕНТИФИКАЦИЯ МОЩНОСТИ ВНУТРЕННЕГО ТЕПЛОВЫДЕЛЕНИЯ

Рассматривается ОЗТ, заданная соответствующей уравнению (1) бесконечной системой обыкновенных дифференциальных уравнений (ОДУ) первого порядка

(4)
$\begin{gathered} \frac{{d{{{\bar {\theta }}}_{m}}({{\mu }_{m}},\varphi )}}{{d\varphi }} = - \mu _{m}^{2}{{{\bar {\theta }}}_{m}}({{\mu }_{m}},\varphi ) + {{{\bar {F}}}_{m}}({{\mu }_{m}})u(\varphi ) + {{\left( { - 1} \right)}^{m}}q(\varphi ); \\ m = 0,1,2,..,\,\,\,\,\varphi \in \left( {0,\varphi {\text{*}}} \right] \\ \end{gathered} $
при нулевых начальных условиях
(5)
${{\bar {\theta }}_{m}}({{\mu }_{m}},0) = 0,\,\,\,\,m = 0,1,2,..$
и граничных условиях (3). В данном случае следует считать известной зависимость $q(\varphi ),$ характеризующую уровень тепловых потерь на границе $x = 1.$

Здесь $\mu _{m}^{2} = {{\pi }^{2}}{{m}^{2}}$ – собственные числа краевой задачи, ${{\bar {\theta }}_{m}}({{\mu }_{m}},\varphi )$ – коэффициенты разложения в бесконечный сходящийся в среднем ряд по собственным функциям $\cos {{\mu }_{m}}x$ (ряд Фурье) [17] температурного поля

(6)
$\theta (x,{{\varphi }}) = {{\bar {\theta }}_{0}}({{\mu }_{0}},\varphi ) + 2\sum\limits_{m = 1}^\infty {{{{\bar {\theta }}}_{m}}({{\mu }_{m}},\varphi )} \cos {{\mu }_{m}}x,$
${{\bar {F}}_{m}}({{\mu }_{m}})$ – коэффициенты разложения в соответствующий ряд функции $F(x).$

На базе математической модели (3)–(6) формулируется обратная задача, в которой на основе экспериментальных данных $\theta {\text{*}}(\varphi )$ подлежит идентификации функция $u(\varphi )$ при известных остальных составляющих математической модели процесса.

ОЗТ формулируется как задача оптимального управления объектом (3)–(6) с минимаксным критерием оптимальности [1416]

(7)
${{I}_{0}}(u) = \mathop {\max }\limits_{{{\varphi }} \in (0,{{\varphi }}*)} \left| {\theta (x*{\text{,}}\varphi ) - \theta {\text{*}}(\varphi )} \right| \to \mathop {\min }\limits_{u({{\varphi }})} .$

В данной задаче по $\theta {\text{*}}(\varphi )$ требуется восстановить $u(\varphi ),$ минимизирующую величину функционала (7).

Для обеспечения требования устойчивости решений и условий физической реализуемости определяемых характеристик $u(\varphi )$ реальных технологических процессов производится сужение исходного множества $V{\text{:}}\,\,u(\varphi ) \in V$ до класса физически реализуемых функций, непрерывных вместе с некоторым конечным числом своих производных.

Рассмотрим далее базовый случай, обеспечивающий поиск решений в классе непрерывных и непрерывно-дифференцируемых функций, который реализуется в ситуации, когда за управляющее воздействие вместо функции $u(\varphi )$ принимается ее вторая производная подчиненная ограничению на максимально допустимое значение ${{w}_{{\max }}}{\text{:}}$

(8)
$\left| {\frac{{{{d}^{2}}u}}{{d{{\varphi }^{2}}}}} \right| = \left| {w(\varphi )} \right| \leqslant \left| {{{w}_{{\max }}}} \right|,\,\,\,\,\varphi \in \left( {0,\varphi {\text{*}}} \right).$

В этом случае искомая величина $u(\varphi )$ и условно введенное управляющее воздействие $w(\varphi )$ связаны следующими соотношениями:

(9)
$\frac{{du(\varphi )}}{{d\varphi }} = {v},\,\,\,\,\frac{{d{v}}}{{d\varphi }} = w;\,\,\,\,u(0) = {{u}_{0}};\,\,\,\,{v}(0) = u{\kern 1pt} '(0) = {{{v}}_{0}}.$

Теперь задача оптимального управления (7) формулируется относительно условного управляющего воздействия $w(\varphi )$ в следующем виде:

(10)
${{I}_{1}}(u) = \mathop {\max }\limits_{{{\varphi }} \in (0,{{\varphi }}*)} \left| {\theta (x*{\text{,}}\varphi ) - \theta {\text{*}}(\varphi )} \right| \to \mathop {\min }\limits_{w({{\varphi }})} ,$
а также дополняется уравнениями (9) и условием (8), что в совокупности обеспечивает поиск $u(\varphi )$ в классе функций, непрерывных вместе со своими первыми производными, и тем самым удовлетворяет решению исходной задачи. Сложность заключается в том, что задача (10) является специальной задачей нелинейного программирования с негладкой функцией максимума, точных методов решения которой на настоящий момент не существует.

В данной статье предлагается способ решения задачи, основанный на рассмотренном в [18, 19] приеме для конечномерных объектов. Применяемый способ состоит в переходе от полученной минимаксной задачи оптимального управления (10) к стандартной вариационной задаче с интегральным критерием оптимальности

(11)
${{I}_{2}}(w,\alpha ) = \frac{1}{{\varphi {\text{*}}}}\int\limits_0^{{{\varphi }}*} {\alpha d\varphi } = \alpha \to \mathop {\min }\limits_{w,{{\alpha }}} $
и дополнительным фазовым ограничением
(12)
$\left| {\theta (x*,\varphi ) - \theta {\text{*}}(\varphi )} \right| - \alpha \leqslant 0,\,\,\,\,\varphi \in \left( {0,\varphi {\text{*}}} \right),$
что обеспечивается введением независящего от аргумента $\varphi $ вспомогательного параметра $\alpha = {\text{const}}{\text{.}}$ Тогда оптимальное программное управление содержит участки, где фазовое ограничение (12) принимает форму строгого неравенства $\left| {\theta (x*,\varphi ) - \theta {\text{*}}(\varphi )} \right| < \alpha ,$ и отдельные интервалы движения по ограничению, где достигается равенство $\left| {\theta (x*,\varphi ) - \theta {\text{*}}(\varphi )} \right| = \alpha .$ Известно, что если фазовые ограничения (12) не нарушаются и траектория, соответствующая искомому оптимальному управлению $u{\text{*}}(\varphi ),$ не включает участков конечной длительности движения по ограничению $\left| {\theta (x*,\varphi ) - \theta {\text{*}}(\varphi )} \right| = \alpha ,$ то свое минимальное значение функционал (11) принимает при управлении $\tilde {u}{\text{*}}(\varphi ),$ рассчитываемом без учета (12). При этом строгие равенства в (12) могут достигаться только в конечном числе фиксированных точек отражения траекторий от допустимой границы, в которых сопряженные переменные претерпевают разрывы первого рода [20]. Тогда в предположении (которое будет подтверждено далее), что ограничение (12) нигде на интервале идентификации не нарушается, рассмотрим процедуру поиска оптимального управления $u{\text{*}}(\varphi ),$ базирующегося на применении ПМП в форме без учета данного ограничения. В соответствии с [4, 21] в этом случае ПМП может быть применен без каких-либо ограничений, и на его основе в большом числе практических случаев возможно в явной форме установить характер оптимальных сосредоточенных управлений.

Для нахождения $w{\text{*}}(\varphi )$ воспользуемся процедурой принципа максимума Понтрягина, которая здесь формулируется для задачи со множеством допустимых управляющих воздействий (8). Сформируем вектор фазовых переменных ${\mathbf{z}} = \left( {\bar {\theta },u(\varphi ),{v}(\varphi )} \right),$ содержащий временные моды температуры $\bar {\theta } = \left( {{{{\bar {\theta }}}_{m}}({{\mu }_{m}},\varphi )} \right),$ $m = 0,1,2...$ и непрерывно дифференцируемые, согласно (9), переменные $u(\varphi ),{v}(\varphi ).$

Введем вектор сопряженных функций ${\mathbf{\psi }} = \left( {{{\psi }_{1}}(\varphi ),{{\psi }_{2}}(\varphi ),...,{{\psi }_{{v}}}(\varphi ),{{\psi }_{w}}(\varphi )} \right)$ и для объекта (3)–(6) составим функцию Понтрягина $H(\bar {\theta },u,{v},w,\psi ,\varphi ),$ которая примет вид [9]

(13)
$\begin{gathered} H(\bar {\theta },u,{v},w,\psi ,\varphi ) = - \alpha + \sum\limits_{m = 0}^\infty {{{\psi }_{m}}(\varphi )} \times \\ \times \,\,\left( { - \mu _{m}^{2}{{{\bar {\theta }}}_{m}}({{\mu }_{m}},\varphi ) + {{{\bar {F}}}_{m}}({{\mu }_{m}})u(\varphi ) + {{{\left( { - 1} \right)}}^{m}}q(\varphi )} \right) + \\ + \,\,{{\psi }_{{v}}}(\varphi ){v}(\varphi ) + {{\psi }_{w}}(\varphi )w(\varphi ). \\ \end{gathered} $

На основе линейной зависимости $H$ от фазовых переменных система сопряженных функций ${{\psi }_{m}}(\varphi ) = 0,1,2...$ записывается в виде линейной системы дифференциальных уравнений

(14)
$\frac{{d{{\psi }_{m}}}}{{d\varphi }} = - \frac{{\partial H}}{{\partial {{{\bar {\theta }}}_{m}}({{\mu }_{m}},\varphi )}} = \mu _{m}^{2}{{\psi }_{m}},\,\,\,\,m = 0,1,2...$
и дополнительных соотношений для переменных ${{\psi }_{{v}}}(\varphi ),{{\psi }_{w}}(\varphi )$
(15)
$\frac{{d{{\psi }_{{v}}}}}{{d\varphi }} = - \frac{{\partial H}}{{\partial u}},\,\,\,\,\frac{{d{{\psi }_{w}}}}{{d\varphi }} = - \frac{{\partial H}}{{\partial {v}}},$
откуда с учетом соотношения (13) на основе (14) и (15) получаются выражения

(16)
$\begin{gathered} \frac{{d{{\psi }_{w}}}}{{d\varphi }} = - \frac{{\partial H}}{{\partial {v}}} = - {{\psi }_{v}}(\varphi ), \\ \frac{{d{{\psi }_{{v}}}}}{{d\varphi }} = - \frac{{\partial H}}{{\partial u}} = - \sum\limits_{m = 0}^\infty {{{{\bar {F}}}_{m}}({{\mu }_{m}})} {{\psi }_{m}}(\varphi ). \\ \end{gathered} $

Согласно (14), находятся сопряженные переменные в виде экспоненциальных функций времени

${{\psi }_{m}}(\varphi ) = {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}},\,\,\,\,m = 0,1,2...,$
что приводит к соотношениям

(17)
$\begin{gathered} \frac{{d{{\psi }_{{v}}}}}{{d\varphi }} = - \sum\limits_{m = 0}^\infty {{{{\bar {F}}}_{m}}({{\mu }_{m}})} {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}} \Rightarrow {{\psi }_{{v}}}(\varphi ) = \\ = - \sum\limits_{m = 0}^\infty {\frac{{{{{\bar {F}}}_{m}}({{\mu }_{m}})}}{{\mu _{m}^{2}}}} {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}} + {{D}_{{v}}}. \\ \end{gathered} $

Отсюда с учетом (16) может быть получено выражение для ${{\psi }_{w}}(\varphi )$

(18)
$\begin{gathered} \frac{{d{{\psi }_{w}}}}{{d\varphi }} = - {{\psi }_{{v}}}(\varphi ) = \,\sum\limits_{m = 0}^\infty {\frac{{{{{\bar {F}}}_{m}}({{\mu }_{m}})}}{{\mu _{m}^{2}}}} {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}} - {{D}_{{v}}} \Rightarrow \\ \Rightarrow {{\psi }_{w}}(\varphi ) = \sum\limits_{m = 0}^\infty {\frac{{{{{\bar {F}}}_{m}}({{\mu }_{m}})}}{{\mu _{m}^{4}}}} {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}} + {{D}_{w}} - {{D}_{{v}}}\varphi . \\ \end{gathered} $

Подставив (17) и (18) в (13), получим выражение для функции Понтрягина $H$ относительно искомого управляющего воздействия $w(\varphi )$

(19)
$\begin{gathered} H(w) = - \alpha + \sum\limits_{m = 0}^\infty {{{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}}} \times \\ \times \,\,\left( { - \mu _{m}^{2}{{{\bar {\theta }}}_{m}}({{\mu }_{m}},\varphi ) + {{{\bar {F}}}_{m}}({{\mu }_{m}})u(\varphi ) + {{{\left( { - 1} \right)}}^{m}}q(\varphi )} \right) + \\ + \,\,{v}(\varphi )\left( {\sum\limits_{m = 0}^\infty {\frac{{{{{\bar {F}}}_{m}}({{\mu }_{m}})}}{{\mu _{m}^{2}}}} {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}} + {{D}_{{v}}}} \right) + \\ + \,\,w(\varphi )\left( {\sum\limits_{m = 0}^\infty {\frac{{{{{\bar {F}}}_{m}}({{\mu }_{m}})}}{{\mu _{m}^{4}}}} {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}} + {{D}_{w}} - {{D}_{{v}}}\varphi } \right). \\ \end{gathered} $

Вследствие равномерной сходимости бесконечного ряда $\sum\nolimits_{m = 0}^\infty {\frac{{{{{\bar {F}}}_{m}}({{\mu }_{m}})}}{{\mu _{m}^{4}}}} {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}}$ на интервале идентификации [1, 8] возможно из условий достижения максимума функции $H(w) = H(\bar {\theta },u,{v},w,\psi ,\varphi )$ (19) на оптимальном управлении получить выражение для оптимального условного управляющего воздействия $w{\text{*}}$ в виде кусочно-постоянной функции времени

$w{\text{*}}(\varphi ) = \beta \left| {{{w}_{{\max }}}} \right|{\text{sign}}{{\psi }_{w}}(\varphi ),\,\,\,\,\beta = \pm 1,$
принимающей конкретный вид
$w{\text{*}}(\varphi ) = \beta \left| {{{w}_{{\max }}}} \right|{\text{sign}}\sum\limits_{m = 0}^\infty {{{D}_{m}}} {{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}},\,\,\,\,\beta = \pm 1.$
Здесь $\sum\nolimits_{m = 0}^\infty {{{D}_{m}}} {{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}} \ne 0$ на любом интервале $\left( {{{\varphi }_{1}},{{\varphi }_{2}}} \right) \in \left[ {0,\varphi {\text{*}}} \right],$ ${{\varphi }_{2}} > {{\varphi }_{1}}.$ В таком случае для рассматриваемого линейного ОРП (4) ПМП является необходимым и достаточным условием оптимальности и тем самым позволяет установить структуру оптимального условного управляющего воздействия $w{\text{*}}(\varphi )$ с точностью до длительностей $\Delta = ({{\Delta }_{i}}),$ $i = \overline {1,N} $ интервалов постоянства $w{\text{*}}$ на заданном интервале идентификации в форме релейной функции времени

(20)
$\begin{gathered} w{\text{*}}(\varphi ) = \beta {{( - 1)}^{{j + 1}}}{{w}_{{\max }}};\,\,\,\,\sum\limits_{k = 0}^{j - 1} {{{\Delta }_{k}}} < \varphi < \sum\limits_{k = 0}^j {{{\Delta }_{k}}} ; \\ j = \overline {1,N} ;\,\,\,\,\beta = \pm 1;\,\,\,\,{{\Delta }_{0}} = 0;\,\,\,\,\sum\limits_{k = 0}^N {{{\Delta }_{k}}} = {{\varphi }^{0}}. \\ \end{gathered} $

Отсюда на основании уравнений (9) осуществляется переход к искомой характеристике $u{\text{*}}(\varphi ),$ принимающей форму кусочно-параболической функции времени

(21)
$u{\text{*}}(\varphi ) = \left\{ {\begin{array}{*{20}{c}} {{{\gamma }_{1}} + {{\gamma }_{2}}\varphi + \frac{{\beta {{w}_{{\max }}}}}{2}{{\varphi }^{2}},\,\,\,\,\beta = \pm 1,\,\,\,\,\varphi \in \left[ {0,{{{\tilde {\Delta }}}_{1}}} \right],\,\,\,\,N \geqslant 1;} \\ {{{\gamma }_{1}} + {{\gamma }_{2}}\varphi + \frac{{\beta {{w}_{{\max }}}}}{2}{{\varphi }^{2}} + \beta {{w}_{{\max }}}{{{\sum\limits_{k = 2}^j {{{{( - 1)}}^{{k + 1}}}\left( {\varphi - \sum\limits_{s = 1}^{k - 1} {{{{\tilde {\Delta }}}_{s}}} } \right)} }}^{2}},\,\,\,\,{{\beta }_{i}} = \pm 1,\,\,\,\,\sum\limits_{s = 1}^{j - 1} {{{{\tilde {\Delta }}}_{s}}} \leqslant \varphi \leqslant \sum\limits_{s = 1}^j {{{{\tilde {\Delta }}}_{s}}} ,\,\,\,\,j = \overline {2,N} ,\,\,\,\,N \geqslant 2.} \end{array}} \right.$

Количество $N$ интервалов постоянства $w{\text{*}}(\varphi )$ зависит как от числа нулей функции (18), так и от числа точек отражения в силу условий скачка для сопряженных переменных.

Таким образом, принцип максимума Понтрягина позволяет осуществить параметризацию идентифицируемой характеристики в исходной некорректно поставленной обратной задаче математической физики. В случае, когда за условное управление принимается вторая производная искомой величины, решение задачи принадлежит классу кусочно-параболических функций, что отражено на рис. 1. Здесь для случая $N = 4$ изображены условное управление $w(\varphi ),$ имеющее характер кусочно-постоянной (релейной) функции, вспомогательная функция ${v}(\varphi ) = u{\kern 1pt} '(\varphi ),$ полученная на основе (9) и принадлежащая множеству непрерывных функций, и идентифицируемая величина $u(\varphi ),$ относящаяся к классу функций, непрерывных вместе со своей производной. Результаты получены при следующих исходных данных: $F(x) = \frac{{{\text{ch}}\left( {\sqrt 2 \xi x} \right) - {\text{cos}}\left( {\sqrt 2 \xi x} \right)}}{{{\text{sh}}\left( {\sqrt 2 \xi } \right) - {\text{sin}}\left( {\sqrt 2 \xi } \right)}}\sqrt 2 \xi ,$ $q(\varphi ) = 0,$ значениях параметров $\xi = 4,$ $x* = 0.9,$ где идентифицируемая характеристика задана экспоненциальной зависимостью ${{u}_{0}}(\varphi ) = 1 - {{{\text{e}}}^{{ - {{\beta \varphi }}}}},$ $\beta = 5.$

Рис. 1.

Характер оптимального управляющего воздействия $u(\varphi ),$ $u{\kern 1pt} '(\varphi ),$ $w(\varphi ).$

В дальнейшем на основе полученного параметрического описания идентифицируемой характеристики (21) задача (4)–(6), (3) сводится к нелинейной задаче математического программирования, которая может быть решена с помощью альтернансного метода [10], использующего свойства чебышевского альтернанса температурных невязок $\theta (x*,\varphi ) - \theta {\text{*}}(\varphi )$ на интервале идентификации с выбором числа $N$ в (20), (21) в зависимости от допустимой величины ${{I}_{1}}$ в (10). Указанные свойства подтверждают сделанное ранее предположение о соблюдении дополнительно введенных фазовых ограничений (12), так как строгие равенства $\left| {\theta (x*,\varphi ) - \theta {\text{*}}(\varphi )} \right| = \alpha $ выполняются только в отдельных точках альтернанса на промежутке $\varphi \in [0,\varphi *],$ одновременно являющихся точками отражения от заданной границы. На рис. 2 для случая $N = 4$ при тех же исходных данных продемонстрирована ошибка $\varepsilon = \left| {\theta (x*,\varphi ) - \theta {\text{*}}(\varphi )} \right|$ равномерного приближения к экспериментальной температурной зависимости, характеризующаяся наличием семи точек достижения знакочередующихся предельно допустимых значений.

Рис. 2.

Конфигурация температурной невязки при оптимальном решении $u(\varphi ) = u{\text{*}}(\varphi ).$

Таким образом, предложенный подход заключается в точной редукции исходной некорректно поставленной ОЗТ к специальной задаче параметрической оптимизации (10) идентифицируемой характеристики. Полученная задача соответствует условно-корректной постановке, что достигается за счет вводимого ограничения на класс искомых величин, и для ее решения не требуется применения традиционных численных регуляризирующих процедур. В обобщенном смысле под регуляризирующим параметром можно понимать число $N$ интервалов постоянства условного управления $w(\varphi ),$ по отношению к которому формулируется принцип максимума Понтрягина, и тем самым задающее число искомых параметров параметризованной формы идентифицируемой величины $u(\varphi ).$ Методика решения ОЗТ сводится к последовательному решению задач для возрастающего числа $N$, увеличение которого позволяет строить приближенные решения, сходящиеся к точному при $N \to \infty $ [22]. Значения ${{I}_{2}}(w,\alpha ) = \alpha $ с ростом $N$ образуют монотонно убывающий ряд, стремящийся к нулю при $N \to \infty $ (рис. 3). При этом сохраняется корректная постановка задачи отыскания на компактном множестве непрерывных вместе со своей первой производной искомых функций (21) для любой конечной величины $N$ и, следовательно, обеспечивается сходимость величины $u{\text{*}}(\varphi )$ в (21) к идентифицируемому воздействию при $N \to \infty .$

Рис. 3.

Погрешность приближения температурного распределения при $N$ → ∞.

Рис. 4.

Конфигурация ошибки равномерного температурного приближения в граничной ОЗТ при: 1N = 3, 2 – 4.

Таким образом, последовательное решение серии задач с возрастающим числом $N$ вплоть до некоторого $N = {{N}^{0}}$ позволяет получить любую требуемую точность аппроксимации экспериментального температурного распределения. На практике итерационный процесс заканчивается при достижении заданной точности, или когда значения $I_{2}^{{(k)}}(w,\alpha )$ и $I_{2}^{{(k + 1)}}(w,\alpha )$ на $k$-м и ($k + 1$)-м шаге отличаются друг от друга на менее чем наперед заданное число, что означает приближение к предельно допустимому, обусловленному численной реализацией или иными причинами значению.

Предложенный подход позволяет получить искомое решение с любой требуемой точностью без использования регуляризирующих алгоритмов, что составляет основное отличие от известных численных методов.

ИДЕНТИФИКАЦИЯ ВНЕШНЕГО ТЕПЛОВОГО ПОТОКА

Рассмотрим применение ПМП при использовании той же самой математической модели процесса (4)–(6), (3) в случае, когда идентифицируемой величиной является граничное воздействие $q(\varphi ),$ рассматриваемое в качестве внешнего источника энергии на поверхности $x = 1$ в условиях $u(\varphi ) = 0$ либо в роли потока тепловых потерь при заданной мощности нагрева $u(\varphi ).$ В данном случае осуществляется, аналогично (9), переход к условному управляющему воздействию $w{\text{(}}\varphi {\text{)}} = {v}{\text{'(}}\varphi {\text{)}} = q{\text{''(}}\varphi {\text{),}}$ ${v}{\text{(}}\varphi {\text{)}} = q{\text{'(}}\varphi {\text{),}}$ подчиненному ограничению (8).

Аналогично первому случаю можно считать, что ограничение (12) не нарушается нигде на рассматриваемом временном интервале идентификации. Это обусловливает правомерность применения ПМП для поиска оптимального управляющего воздействия без учета фазовых ограничений. Формируется вектор фазовых переменных ${\mathbf{z}} = \left( {\bar {\theta },q(\varphi ),{v}(\varphi )} \right)$ и записывается функция Понтрягина $H(\bar {\theta },q,{v},w,\psi ,\varphi ),$ формально сохраняющая прежний вид (13), с той разницей, что дополнительной функцией, входящей в вектор фазовых координат, здесь является не $u(\varphi ),$ а $q(\varphi )$ со своими первой и второй производными.

Система сопряженных функций содержит уравнения (14) для температурных мод, выражения (15) для переменных ${{\psi }_{{v}}}(\varphi ),{{\psi }_{w}}(\varphi ),$ которые в данном случае принимают вид

$\begin{gathered} \frac{{d{{\psi }_{w}}}}{{d\varphi }} = - \frac{{\partial H}}{{\partial {v}}} = - {{\psi }_{{v}}}(\varphi ), \\ \frac{{d{{\psi }_{{v}}}}}{{d\varphi }} = - \frac{{\partial H}}{{\partial q}} = - \sum\limits_{m = 0}^\infty {{{{\left( { - 1} \right)}}^{m}}} {{\psi }_{m}}(\varphi ). \\ \end{gathered} $

Тогда функция Понтрягина вместо (19) записывается в форме

$\begin{gathered} H(w) = - \alpha + \sum\limits_{m = 0}^\infty {{{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}}} \times \\ \times \,\,\left( { - \mu _{m}^{2}{{{\bar {\theta }}}_{m}}({{\mu }_{m}},\varphi ) + {{{\bar {F}}}_{m}}({{\mu }_{m}})\upsilon (\varphi ) + {{{\left( { - 1} \right)}}^{m}}q(\varphi )} \right) + \\ + \,\,{v}(\varphi )\left( {\sum\limits_{m = 0}^\infty {\frac{{{{{\left( { - 1} \right)}}^{m}}}}{{\mu _{m}^{2}}}} {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}} + {{D}_{{v}}}} \right) + \\ + \,\,w(\varphi )\left( {\sum\limits_{m = 0}^\infty {\frac{{{{{\left( { - 1} \right)}}^{m}}}}{{\mu _{m}^{4}}}} {{\psi }_{m}}(0){{{\text{e}}}^{{{{\mu }}_{m}^{2}{{\varphi }}}}} + {{D}_{w}} - {{D}_{{v}}}\varphi } \right). \\ \end{gathered} $

Отсюда аналогично предыдущему случаю определяется релейный характер $w{\text{(}}\varphi {\text{)}}$ вида (20), вследствие чего идентифицируемая величина $q(\varphi )$ принимает форму кусочно-параболической зависимости. Получаемая в дальнейшем задача математического программирования также может быть решена стандартными численными методами [10], которые, как и в предыдущем случае, подтверждают выполнение фазовых ограничений (12).

Результаты решения граничной ОЗТ по единой методологии, изложенной в предыдущем разделе, при $u(\varphi ) = 0,$ искомой величине ${{q}_{0}}(\varphi ) = 1 - {{e}^{{ - {{\gamma \varphi }}}}}$ и значениях параметров $\gamma = 3.2,$ $x* = 0.9$ для случаев $N = 3,4$ представлены на рис. 4 и подтверждают изложенные выше общие закономерности.

ИДЕНТИФИКАЦИЯ ПРОСТРАНСТВЕННОГО РАСПРЕДЕЛЕНИЯ ИСТОЧНИКА ВНУТРЕННЕГО ТЕПЛОВЫДЕЛЕНИЯ

Рассмотрим ОЗТ по идентификации закона $F(x)$ пространственного распределения внутренних источников тепла, сформулированную на основе уравнения теплопроводности (1)–(3), записанного в изображениях Лапласа по временной переменной относительно изображения $\tilde {\theta }(x,p),$ где $p$ – параметр Лапласа:

$\frac{{{{d}^{2}}\tilde {\theta }(x,p)}}{{d{{x}^{2}}}} - p\tilde {\theta }(x,p) + F(x)\tilde {u}(p{\text{)}},\,\,\,\,0 < x < 1,$
при соответствующих граничных условиях
(23)
$\frac{{d\tilde {\theta }(1,p)}}{{dx}} = \tilde {q}(p),\,\,\,\,\frac{{d\tilde {\theta }(0,p)}}{{dx}} = 0$
с известными функциями $\tilde {u}(p)$ и $\tilde {q}(p).$

Исходная ОЗТ по идентификации $F(x)$ формулируется как задача поиска пространственно распределенного управления $F(x)$ с минимаксным критерием оптимальности [14, 16]:

(24)
${{I}_{0}}(u) = \mathop {\max }\limits_{{{\varphi }} \in (0,{{\varphi }}*)} \left| {\theta (x*{\text{,}}\varphi ) - \theta {\text{*}}(\varphi )} \right| \to \mathop {\min }\limits_{F(x)} .$

Аналогично задачам идентификации $u(\varphi )$ и $q(\varphi )$ вводится условное управляющее воздействие

(25)
$\begin{gathered} \frac{{dF(x)}}{{dx}} = {v}(x),\,\,\,\,\frac{{d{v}(x)}}{{dx}} = w(x),\,\,\,\,u(0) = {{u}_{0}}, \\ {v}(0) = u{\kern 1pt} '(0) = {{{v}}_{0}}, \\ \end{gathered} $
подчиненное ограничению
$\left| {\frac{{{{d}^{2}}F}}{{d{{x}^{2}}}}} \right| = \left| {w(x)} \right| \leqslant \left| {{{w}_{{\max }}}} \right|,\,\,\,\,x \in \left[ {0,1} \right],$
и осуществляется переход от (24) к задаче поиска оптимального управления $w(x)$

(26)
${{I}_{3}}(F) = \mathop {\max }\limits_{{{\varphi }} \in (0,{{\varphi }}*)} \left| {\theta (x*{\text{,}}\varphi ) - \theta {\text{*}}(\varphi )} \right| \to \mathop {\min }\limits_{w(x)} .$

Для применения ПМП вместо ОДУ второго порядка (22) используется модель в виде системы уравнений в нормальной форме

(27)
$\begin{gathered} \frac{{d\tilde {\theta }(x,p)}}{{dx}} = {{{\tilde {\theta }}}_{1}}(x,p), \\ \frac{{d{{{\tilde {\theta }}}_{1}}(x,p)}}{{dx}} = p\tilde {\theta }(x,p) - F(x)\tilde {u}(p{\text{)}} \\ \end{gathered} $
с граничными условиями (23) и уравнениями перехода (25) и осуществляется, подобно (11), (12), переход к задаче с интегральным критерием качества по пространственной переменной
(28)
${{I}_{3}}(w,\alpha ) = \int\limits_0^1 {\alpha dx} = \alpha \to \mathop {\min }\limits_{w,{{\alpha }}} $
и дополнительным фазовым ограничением

(29)
$\left| {\tilde {\theta }(x,p) - \tilde {\theta }{\text{*}}(p)} \right| - \alpha \leqslant 0.$

Формируется вектор фазовых переменных ${\mathbf{z}} = \left( {\tilde {\theta },{{{\tilde {\theta }}}_{1}},F(x),{v}(x)} \right),$ и рассматривается задача (с подвижными концами траектории на фазовой плоскости $\tilde {\theta },{{\tilde {\theta }}_{1}}$) оптимального управления по интегральному критерию качества (28) объектом (27) с граничными условиями (23). Аналогично поиску сосредоточенного управления сначала полагается, что строгие равенства в ограничении (29) могут достигаться только в отдельных точках отражения траектории $\tilde {\theta }(x,p)$ от допустимой границы в (29), число которых априори неизвестно в условиях возникновения скачков в поведении сопряженных переменных. При этом оптимальное управление не содержит участков движения по ограничению. Для этого случая составляется функция Понтрягина, принимающая вид

(30)
$\begin{gathered} H(\tilde {\theta },{{{\tilde {\theta }}}_{1}},F(x),{v}(x),w(x),\phi (x)) = \\ = - \alpha + {{\phi }_{1}}(x){{{\tilde {\theta }}}_{1}} + \\ + \,\,{{\phi }_{2}}(x)\left( {p\tilde {\theta }(x,p) - F(x)\tilde {u}(p{\text{)}}} \right) + \\ + \,\,{{\phi }_{3}}(x){v}(x) + {{\phi }_{4}}(x)w(x). \\ \end{gathered} $
Здесь $\phi = \left( {{{\phi }_{1}}(x),{{\phi }_{2}}(x),{{\phi }_{3}}(x),{{\phi }_{4}}(x)} \right)$ – вектор сопряженных переменных, которые на интервалах своей непрерывности задаются решениями системы уравнений

(31)
$\begin{gathered} \frac{{d{{\phi }_{1}}}}{{dx}} = - \frac{{\partial H}}{{\partial \widetilde \theta }},\,\,\,\,\frac{{d{{\phi }_{2}}}}{{dx}} = - \frac{{\partial H}}{{\partial {{{\tilde {\theta }}}_{1}}}};\,\,\,\,\frac{{d{{\phi }_{3}}}}{{dx}} = - \frac{{\partial H}}{{\partial F}}, \\ \frac{{d{{\phi }_{4}}}}{{dx}} = - \frac{{\partial H}}{{\partial {v}}}. \\ \end{gathered} $

В соответствии с (30), (31) приходим к соотношениям

$\begin{gathered} \frac{{d{{\phi }_{1}}}}{{dx}} = - p{{\phi }_{2}},\,\,\,\,\frac{{d{{\phi }_{2}}}}{{dx}} = - {{\phi }_{1}},\,\,\,\,\frac{{d{{\phi }_{3}}}}{{dx}} = \tilde {u}(p{\text{)}}{{\phi }_{2}}, \\ \frac{{d{{\phi }_{4}}}}{{dx}} = - {{\phi }_{3}}, \\ \end{gathered} $
которые приводят к уравнению второго порядка для сопряженной переменной ${{\phi }_{2}}(x)$

$\frac{{{{d}^{2}}{{\phi }_{2}}}}{{d{{x}^{2}}}} - p{{\phi }_{2}} = 0.$

Отсюда определяется общее решение системы (31) для ${{\phi }_{2}}(x)$ в следующем виде:

(33)
${{\phi }_{2}}(x) = {{C}_{1}}{{{\text{e}}}^{{\sqrt p x}}} + {{C}_{2}}{{{\text{e}}}^{{ - \sqrt p x}}}.$

На основе (33) с учетом (32) можно получить выражения для остальных сопряженных переменных

(34)
$\begin{gathered} {{\phi }_{1}}(x) = - {{C}_{1}}\sqrt p {{{\text{e}}}^{{\sqrt p x}}} + {{D}_{{11}}} - {{C}_{2}}\sqrt p {{{\text{e}}}^{{ - \sqrt p x}}} + {{D}_{{12}}}, \\ {{\phi }_{3}}(x) = \tilde {u}(p{\text{)}}{{C}_{1}}\frac{1}{{\sqrt p }}{{{\text{e}}}^{{\sqrt p x}}} + {{D}_{{31}}} + \tilde {u}(p{\text{)}}{{C}_{2}}\frac{1}{{\sqrt p }}{{{\text{e}}}^{{ - \sqrt p x}}} + {{D}_{{32}}}, \\ {{\phi }_{4}}(x) = - \tilde {u}(p{\text{)}}{{C}_{1}}\frac{1}{p}{{{\text{e}}}^{{\sqrt p x}}} + {{D}_{{41}}}x + {{D}_{{42}}} - \\ - \,\,\tilde {u}(p{\text{)}}{{C}_{2}}\frac{1}{p}{{{\text{e}}}^{{ - \sqrt p x}}} + {{D}_{{43}}}x + {{D}_{{44}}}. \\ \end{gathered} $

Таким образом, функция Понтрягина принимает конкретный вид

$\begin{gathered} H(\tilde {\theta },{{{\tilde {\theta }}}_{1}},F(x),{v}(x),w(x),\phi (x)) = - \alpha - \\ - \,\,\left( {{{C}_{1}}\sqrt p {{{\text{e}}}^{{\sqrt p x}}} + {{C}_{2}}\sqrt p {{{\text{e}}}^{{ - \sqrt p x}}}} \right){{{\tilde {\theta }}}_{1}} + \left( {{{C}_{1}}{{{\text{e}}}^{{\sqrt p x}}} + {{C}_{2}}{{{\text{e}}}^{{ - \sqrt p x}}}} \right) \times \\ \times \,\,\left( {p\tilde {\theta }(x,p) - F(x)\tilde {u}(p{\text{)}}} \right) + \left( {\tilde {u}(p{\text{)}}{{C}_{1}}\frac{1}{{\sqrt p }}{{{\text{e}}}^{{\sqrt p x}}} + } \right. \\ \left. { + \,\,\tilde {u}(p{\text{)}}{{C}_{2}}\frac{1}{{\sqrt p }}{{{\text{e}}}^{{ - \sqrt p x}}}} \right){v}(x) - \left( {\tilde {u}(p{\text{)}}{{C}_{1}}\frac{1}{p}{{{\text{e}}}^{{\sqrt p x}}} + } \right. \\ \left. { + \,\,\tilde {u}(p{\text{)}}{{C}_{2}}\frac{1}{p}{{{\text{e}}}^{{ - \sqrt p x}}}} \right)w(x). \\ \end{gathered} $

Тогда условие достижения максимума функции $H$ на оптимальном управлении $w{\text{*}}(x)$ приводит подобно (12) к кусочно-постоянному характеру функции пространственной координаты, принимающей предельно допустимые значения:

$\begin{gathered} w{\text{*}}(x) = \beta \left| {{{w}_{{\max }}}} \right|{\text{sign}}{{\phi }_{4}}(x) = \beta \left| {{{w}_{{\max }}}} \right|{\text{sign}} \times \\ \times \,\,\left( { - \tilde {u}(p{\text{)}}{{C}_{1}}\frac{1}{p}{{{\text{e}}}^{{\sqrt p x}}} - \tilde {u}(p{\text{)}}{{C}_{2}}\frac{1}{p}{{{\text{e}}}^{{ - \sqrt p x}}}} \right),\,\,\,\,\beta = \pm 1. \\ \end{gathered} $

Отсюда $w{\text{*}}(x)$ определяется в параметризованной форме

$\begin{gathered} w{\text{*}}(x) = \beta {{( - 1)}^{{j + 1}}}{{w}_{{\max }}},\,\,\,\,\sum\limits_{k = 0}^{j - 1} {{{\Delta }_{k}}} < x < \sum\limits_{k = 0}^j {{{\Delta }_{k}}} , \\ j = \overline {1,N} ,\,\,\,\,\beta = \pm 1,\,\,\,\,{{\Delta }_{0}} = 0,\,\,\,\,\sum\limits_{k = 0}^N {{{\Delta }_{k}}} = 1, \\ \end{gathered} $
с точностью до числа $N \geqslant 0$ и значений координат $\Delta _{i}^{{(N)}},$ $i = \overline {0,N} $ точек переключения на отрезке $x \in \left[ {0,1} \right].$

Здесь количество интервалов постоянства искомой функции $w{\text{*}}(x)$ в общем случае не определяется порядком модели (27) исследуемого ОРП, равным двум, а зависит от числа скачков сопряженных переменных (числа точек отражения траектории $\tilde {\theta }(x,p)$ от границы) и от числа нулей функции (34) на каждом из участков постоянства $w{\text{*}}(x).$

Идентифицируемая в ОЗТ (24) величина $F{\text{*}}(x),$ аналогично (21), принимает параметризованную форму кусочно-параболической функции пространственной координаты при сохранении прежнего вида (21) с заменой $\varphi $ на x.

Аналогично случаю поиска сосредоточенных характеристик параметрическое представление пространственно распределенных воздействий приводит к задаче математического программирования, для решения которой используется альтернансный метод. Свойства чебышевского альтернанса невязок $\theta (x*,\varphi ) - \theta {\text{*}}(\varphi )$ на интервале идентификации соответствуют тому, что строгие равенства $\left| {\tilde {\theta }(x,p) - \tilde {\theta }{\text{*}}(p)} \right| = \alpha $ в (29) выполняются только в отдельных точках альтернанса, совпадающих с точками отражения от заданной границы. Это свидетельствует о том, что предположение о соблюдении фазовых ограничений (29) не нарушается.

Практика решения задач по идентификации пространственно распределенных характеристик по общей методологии параметрической оптимизации показывает, что в этом случае при учете специфических особенностей сохраняются базовые свойства: кусочно-непрерывный характер оптимального условного управления $w{\text{*}}(x),$ альтернансный характер температурных невязок и сходимость функционала оптимизации (26) к нулю при $N \to \infty .$

Результаты решения ОЗТ по идентификации закона пространственного распределения теплоисточников при использовании той же математической модели прямой задачи, что и при определении мощности внутреннего тепловыделения, с исходными данными $u(\varphi ) = 1 - {{{\text{e}}}^{{ - {{\beta \varphi }}}}},$ $q(\varphi ) = 0,$ $\beta = 5,$ $x* = 0.9,$ где в рассматриваемом случае идентифицируемой характеристикой является

${{F}_{0}}(x) = \frac{{{\text{ch}}\left( {\sqrt 2 \xi x} \right) - {\text{cos}}\left( {\sqrt 2 \xi x} \right)}}{{{\text{sh}}\left( {\sqrt 2 \xi } \right) - {\text{sin}}\left( {\sqrt 2 \xi } \right)}}\sqrt 2 \xi ,$
$\xi = 4$ для $N = 4,$ представлены на рис. 5. Конфигурация температурной невязки, обусловленная числом точек альтернанса, равным семи, сохраняется, изменяется лишь их расположение на интервале идентификации.

Рис. 5.

Погрешность равномерного температурного приближения на всем интервале идентификации (а) и на начальном участке (б) при $N = 4.$

ЗАКЛЮЧЕНИЕ

Данная статья иллюстрирует возможность использования принципа максимума Понтрягина для решения обратных задач технологической физики и идентификации основных сосредоточенных и пространственно распределенных характеристик процесса теплопроводности. Обратная задача формулируется в экстремальной постановке с минимаксным критерием оптимальности и рассматривается как задача оптимального управления. Применение ПМП в качестве необходимых и достаточных условий оптимальности позволяет осуществить процедуру параметризации искомых в обратных задачах математической физики величин на компактном множестве непрерывных вместе со своей производной функций.

Дальнейшее решение специальных задач математического программирования, использующих полученное параметрическое представление идентифицируемых величин, исчерпывает решение исходных ОЗТ. Выбором числа $N$ интервалов постоянства условного управления $w{\text{*}}(\varphi )$ или $w{\text{*}}(x)$ возможно достигать требуемую точность идентификации искомой характеристики вплоть до $N \to \infty ,$ при котором в пределе длительности интервалов постоянства стремятся к нулю, что позволяет получить точное значение зависящих от времени или пространственной координаты определяемых величин.

Изложенный подход был применен, исследован и апробирован на решении широкого класса обратных задач технологической теплофизики: внутренних, граничных, ретроспективных и коэффициентных по идентификации соответствующих сосредоточенных или пространственно распределенных характеристик для объектов прямоугольной или цилиндрической формы при различных краевых условиях. На все рассмотренные случаи распространяются изложенные результаты при учете конкретного вида математической модели и идентифицируемой характеристики.

Работа выполнена при финансовой поддержке Минобрнауки РФ в рамках проектной части государственного задания № 0778-2020-0005.

Список литературы

  1. Бутковский А.Г. Теория оптимального управления системами с распределенными параметрами. М.: Наука, 1965. 225 с.

  2. Бутковский А.Г. Методы управления системами с распределенными параметрами. М.: Наука, 1975. 568 с.

  3. Бутковский А.Г., Малый С.А., Андреев Ю.Н. Оптимальное управление нагревом металла. М.: Металлургия, 1972. 440 с.

  4. Егоров Ю.В. Необходимые условия оптимальности управления в банаховых пространствах // Матем. сб. 1964. Т. 64(106). № 1. С. 79.

  5. Панасюк В.И., Ковалевский В.Б., Политыко Э.Д. Оптимальное управление в технических системах. Минск: Наука и техника, 1990. 272 с.

  6. Фельдбаум А.А., Бутковский А.Г. Методы теории автоматического управления. М.: Наука; Физматлит, 1971. 744 с.

  7. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1983. 392 с.

  8. Рапопорт Э.Я. Оптимизация процессов индукционного нагрева металла. М.: Металлургия, 1993. 279 с.

  9. Рапопорт Э.Я. Оптимальное управление системами с распределенными параметрами. М.: Высш. школа, 2009. 677 с.

  10. Рапопорт Э.Я. Альтернансный метод в прикладных задачах оптимизации. М.: Наука, 2000. 336 с.

  11. Рапопорт Э.Я., Плешивцева Ю.Э. Оптимальное управление температурными режимами индукционного нагрева. М.: Наука, 2012. 309 с.

  12. Алифанов О.М. Идентификация процессов теплообмена летательных аппаратов. М.: Машиностроение, 1979. 216 с.

  13. Тихонов А.Н. Об устойчивости обратных задач // Докл. АН СССР. 1943. Т. 39. № 5. С. 195.

  14. Дилигенская А.Н., Рапопорт Э.Я. Аналитические методы параметрической оптимизации в обратных задачах теплопроводности с внутренним тепловыделением // ИФЖ. 2014. Т. 87. № 5. С. 1082.

  15. Дилигенская А.Н., Рапопорт Э.Я. Метод минимаксной оптимизации в коэффициентной обратной задаче теплопроводности // ИФЖ. 2016. Т. 89. № 4. С. 1007.

  16. Дилигенская А.Н. Решение ретроспективной обратной задачи теплопроводности на основе параметрической оптимизации // ТВТ. 2018. Т. 56. № 3. С. 399.

  17. Рапопорт Э.Я. Структурное моделирование объектов и систем управления с распределенными параметрами. М.: Высш. школа, 2003. 299 с.

  18. Первозванский А.А. Курс теории автоматического управления. СПб.: Лань, 2015. 624 с.

  19. Цирлин А.М., Балакирев В.С., Дудников Е.Г. Вариационные методы оптимизации управляемых объектов. М.: Энергия, 1976. 448 с.

  20. Иванов В.А., Фалдин Н.В. Теория оптимальных систем автоматического управления. М.: Наука, 1981. 336 с.

  21. Егоров Ю.В. Оптимальное управление системами с распределенными параметрами. В кн.: Математика на службе инженера. Основы теории оптимального управления. М.: Знание, 1973. С. 187.

  22. Рапопорт Э.Я., Плешивцева Ю.Э. Специальные методы оптимизации в обратных задачах теплопроводности // Изв. РАН. Энергетика. 2002. № 5. С. 144.

Дополнительные материалы отсутствуют.