Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, T. 512, № 1, стр. 18-26
ОПТИМИЗАЦИЯ КОЛЕБАНИЙ МЕХАНИЧЕСКИХ СИСТЕМ С ТРЕНИЕМ
1 Институт прикладной математики им. М.В. Келдыша Российской академии наук
Москва, Россия
* E-mail: golubev@keldysh.ru
Поступила в редакцию 02.02.2023
После доработки 20.04.2023
Принята к публикации 05.05.2023
- EDN: PKNCIY
- DOI: 10.31857/S2686954323600052
Аннотация
Предложен обобщенный метод поиска оптимального управления амплитудой одномерных колебаний в окрестности положения равновесия для склерономной многомерной механической системы с трением. Колебательная степень свободы системы не поддается непосредственному управлению. На ее движение влияют другие, непосредственно управляемые степени свободы. В число непосредственно управляемых могут входить как позиционные, так и циклические координаты. Метод не использует сопряженных переменных в смысле принципа максимума Л.С. Понтрягина и не увеличивает размерность исходной системы дифференциальных уравнений движения. На примере конкретной колебательной механической модели с сухим и вязким трением продемонстрирована эффективность применения предложенного метода.
1. ПОСТАНОВКА ПРОБЛЕМЫ
В связи с развитием мобильных робототехнических устройств значительное внимание исследователей уделяется разработке теории механических систем с дефицитом управления [1–4]. Для синтеза управления такими системами, как правило, применяется принцип максимума Л.С. Понтрягина [5, 6], разработанный для весьма общего класса динамических систем. Вместе с тем системы с одной, не снабженной приводом, степенью свободы встречаются повсеместно и чаще всего, когда имеется необходимость опираться при движении на окружающие предметы. Здесь привлекательным представляется оптимальное использование маятниковых элементов движений, возникающих из-за воздействия естественных сил, таких как, например, сила тяжести. Для подобных систем возможно применение более простых по сравнению принципом максимума методов, основанных на вычислении первой вариации функционала [7–9]. В работах [10, 11] даны уточненные формулировки и упрощенные доказательства результатов, полученных в [8, 9] для консервативных систем. Ниже изучаются неконсервативные системы с одной дефицитной степенью свободы, и доказывается, что представленные в [10, 11] методы работают и в этом случае.
Рассматривается склерономная голономная механическая система с кинетической энергией
(1.1)
$\frac{d}{{dt}}\left( {\frac{{\partial T}}{{\partial {{{\dot {q}}}_{i}}}}} \right) - \frac{{\partial T}}{{\partial {{q}_{i}}}} = {{Q}_{i}},\quad i = \overline {1,n} ,$(1.2)
$\begin{gathered} {{Q}_{1}} = {{Q}_{x}} = F(x,{{q}_{2}}, \cdots {{q}_{n}}) + \\ \, + R(\dot {x},{{{\dot {q}}}_{2}}, \cdots ,{{{\dot {q}}}_{n}},x,{{q}_{2}}, \cdots ,{{q}_{n}}), \\ \end{gathered} $Пусть первыми в наборе $({{q}_{2}},...,{{q}_{n}})$ идут $s - 1$ координат, от которых обобщенная сила F зависит явно. Остальные $(n - s)$ координат не входят явно в выражение для $F$. Все координаты переобозначим: ${{u}_{j}} = {{q}_{{j + 1}}}$, $j = \overline {1,s - 1} $ и ${{w}_{k}} = {{q}_{{s + k}}}$, k = = $\overline {1,n - s} $, причем ${\mathbf{u}} = ({{u}_{1}},...,{{u}_{{s - 1}}}) \in {{R}^{{s - 1}}}$ – вектор координат, непосредственно влияющих на значение $F$, ${\mathbf{w}} = ({{w}_{1}},...,{{w}_{{n - s}}}) \in {{R}^{{n - s}}}$ – вектор координат, от которых $F$ явно не зависит, так что, $\partial F{\text{/}}\partial {{w}_{k}} = 0,$ $k = \overline {1,n - s} $. В число w-координат могут входить, например, циклические координаты. Кинетическая энергия примет вид
Следуя работам [8–11], в системе (1.1) выделим уравнение для координаты $x$:
(1.3)
$\begin{gathered} \frac{d}{{dt}}\left( {{{a}_{{11}}}\dot {x} + \sum\limits_{j = 1}^{s - 1} {{{a}_{{1,j + 1}}}{{{\dot {u}}}_{j}}} + \sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}{{{\dot {w}}}_{k}}} } \right) - \frac{{\partial T}}{{\partial x}} = \\ \, = F(x,{\mathbf{u}}) + R(\dot {x},{\mathbf{\dot {u}}},{\mathbf{\dot {w}}},x,{\mathbf{u}},{\mathbf{w}}). \\ \end{gathered} $Примем координату $x$ в качестве независимой переменной на участке ее монотонного возрастания: $\dot {x} > 0$ и обозначим ${\mathbf{y}} = ({\mathbf{u}},{\mathbf{u}}{\kern 1pt} ',{\mathbf{w}},{\mathbf{w}}{\kern 1pt} ')$, где ${\mathbf{u}}{\kern 1pt} ' = d{\mathbf{u}}{\text{/}}dx$, ${\mathbf{w}}{\kern 1pt} ' = d{\mathbf{w}}{\text{/}}dx$, вектор управляющих координат и их производных по координате $x$. Тогда $t = t(x)$, а уравнение (1.3) преобразуется к виду
(1.4)
$\dot {x}\frac{d}{{dx}}\left[ {f(x,{\mathbf{y}})\dot {x}} \right] - p(t{\kern 1pt} ',x,\dot {x},{\mathbf{y}}){{\dot {x}}^{2}} = F(x,{\mathbf{u}}),$(1.5)
$\begin{gathered} \begin{array}{*{20}{c}} {\left| {u_{j}^{m} \leqslant {{u}_{j}}(x) \leqslant u_{j}^{M}} \right|,} \\ {\left| {\dot {u}_{j}^{m} \leqslant {{{\dot {u}}}_{j}}(x) \leqslant \dot {u}_{j}^{M}} \right|,} \end{array}\quad \begin{array}{*{20}{c}} {\left| {w_{k}^{m} \leqslant {{w}_{k}}(x) \leqslant w_{k}^{M}} \right|,} \\ {\left| {\dot {w}_{k}^{m} \leqslant {{{\dot {w}}}_{k}}(x) \leqslant \dot {w}_{k}^{M}} \right|,} \end{array} \\ j = \overline {1,s - 1} ,\quad k = \overline {1,n - s} . \\ \end{gathered} $Эти вектор-функции будем рассматривать как функции управления системой. Тогда обобщенные силы ${{Q}_{2}},...,{{Q}_{n}}$ вычисляются в соответствии с уравнениями (1.1) таким образом, чтобы указанные вектор-функции ${\mathbf{u}}(x)$, ${\mathbf{w}}(x)$ реализовались. Предположим, что это сделано, так что ограничения (1.5) удовлетворяются, и можно написать уравнение
(1.6)
$\begin{gathered} \int\limits_{{{x}_{0}}}^x {\lambda \left\{ {\mathop {F(x,{\mathbf{u}}) + p(t{\kern 1pt} ',x,\dot {x},{\mathbf{y}}){{{\dot {x}}}^{2}}}\limits_{} } \right. - } \\ \, - \left. {\dot {x}\frac{d}{{dx}}\left[ {f(x,{\mathbf{y}})\dot {x}} \right]} \right\}dx = 0, \\ \end{gathered} $(1.7)
$\begin{gathered} \lambda = f(x,{\mathbf{y}})\exp \left( { - \int\limits_{{{x}_{0}}}^x {\frac{{2p(t{\kern 1pt} ',x,\dot {x},{\mathbf{y}})}}{{f(x,{\mathbf{y}})}}dx} } \right), \\ f(x,{\mathbf{y}}) \ne 0. \\ \end{gathered} $Тогда равенство (1.6) можно преобразовать к виду
(1.8)
$\begin{gathered} \int\limits_{{{x}_{0}}}^x {\lambda F(x,{\mathbf{u}})dx} = \\ \, = \frac{1}{2}\left. {\left[ {f{\kern 1pt} {\text{*}}(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}})\lambda {\kern 1pt} {\text{*}}(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}})} \right]} \right|_{{{{x}_{0}}}}^{x}, \\ \end{gathered} $(1.9)
$\begin{gathered} f{\kern 1pt} {\text{*}}(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{\dot {w}}}) = \\ \, = {{a}_{{11}}}\dot {x} + \sum\limits_{j = 1}^{s - 1} {{{a}_{{1,j + 1}}}{{{\dot {u}}}_{j}}} + \sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}{{{\dot {w}}}_{k}}} , \\ \lambda {\kern 1pt} {\text{*}}(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}}) = \\ \, = f{\kern 1pt} {\text{*}}(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}})\exp \left( { - \int\limits_{{{x}_{0}}}^x {\frac{{2p(t{\kern 1pt} ',x,{\mathbf{y}})}}{{f(x,{\mathbf{y}})}}dx} } \right). \\ \end{gathered} $В том случае, когда $\dot {x} = \dot {x}(x)$ обращается в нуль, интеграл в левой части равенства (1.8) становится несобственным из-за того, что при $\dot {x} = 0$ значения $t{\kern 1pt} ' = 1{\text{/}}\dot {x}$, ${\mathbf{u}}{\kern 1pt} ' = {\mathbf{\dot {u}}}{\text{/}}\dot {x}$ и ${\mathbf{w}}{\kern 1pt} ' = {\mathbf{\dot {w}}}{\text{/}}\dot {x}$ могут стать бесконечно большими. Однако та же формула (1.8) показывает, что этот интеграл существует и принимает конечное значение. Заметим, что переменные $f{\kern 1pt} *$ и $\lambda {\kern 1pt} *$ не содержат отмеченной особенности.
Предположим, что силовая функция
(1.10)
$U(x,{\mathbf{u}}( \cdot )) = \int\limits_{{{x}_{0}}}^x {F(\tau ,{\mathbf{u}}(\tau ))} d\tau $Требуется найти кусочно-непрерывные управления ${\mathbf{u}}(x)$, ${\mathbf{w}}(x)$, при которых достигается максимум (минимум) функционала J.
В работах [8, 9] с помощью замены $\xi = - x$ показано, что участок, где $\dot {x} < 0$ (монотонное убывание координаты $x$) вполне аналогичен участку монотонного возрастания этой координаты с той лишь разницей, что вместо максимума (минимума) функционала $J$ надо искать его минимум (максимум).
2. ОПТИМАЛЬНОЕ РАСКАЧИВАНИЕ (УСПОКОЕНИЕ) КОЛЕБАНИЙ
Справедливы следующие теоремы (их формулировки, по существу, совпадают с формулировками работы [11]). Для удобства применения их в рассмотренном ниже примере приведем здесь эти формулировки.
Теорема 1. (Принцип наилучшего раскачивания). Предположим, что движение системы описывается уравнением (1.3) и существуют две точки ${{x}_{0}}$ и ${{x}_{1}}$, причем ${{x}_{0}} < {{x}_{1}}$ и ${{\dot {x}}_{0}} = {{\dot {x}}_{1}} = 0$. Тогда
I. Необходимыми условиями оптимальности управлений ${\mathbf{u}} = {{{\mathbf{u}}}_{M}}(\tau )$, ${{{\mathbf{\dot {w}}}}_{M}}({{x}_{1}})$, которые, будучи стесненными ограничениями (1.5), обеспечивают максимум величины ${{x}_{1}}$, служат уравнения
(2.1)
$\begin{array}{*{20}{c}} {{{{\mathbf{u}}}_{M}}(x) = \arg \mathop {\max }\limits_{\mathbf{u}} \left[ {\chi (x,{{{\mathbf{y}}}_{M}})F(x,{\mathbf{u}})} \right],} \\ {{{{{\mathbf{\dot {w}}}}}_{M}}({{x}_{1}}) = \arg \mathop {\min }\limits_{{\mathbf{\dot {w}}}} \left[ {\sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}({{x}_{1}},{{{\mathbf{u}}}_{M}},{{{\mathbf{w}}}_{M}}){{{\dot {w}}}_{k}}} } \right],} \end{array}$II. Необходимыми условиями оптимальности управлений ${\mathbf{u}} = {{{\mathbf{u}}}_{m}}(x)$, ${{{\mathbf{\dot {w}}}}_{m}}({{x}_{0}})$, которые, будучи стесненными ограничениями (1.5), при фиксированном значении ${{x}_{1}}$ обеспечивают минимум величины ${{x}_{0}}$, служат уравнения
(2.2)
$\begin{array}{*{20}{c}} {{{{\mathbf{u}}}_{m}}(x) = \arg \mathop {\min }\limits_{\mathbf{u}} \left[ {\chi (x,{{{\mathbf{y}}}_{m}})F(x,{\mathbf{u}})} \right],} \\ {{{{{\mathbf{\dot {w}}}}}_{m}}({{x}_{0}}) = \arg \mathop {\max }\limits_{{\mathbf{\dot {w}}}} \left[ {\sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}({{x}_{0}},{{{\mathbf{u}}}_{m}},{{{\mathbf{w}}}_{m}}){{{\dot {w}}}_{k}}} } \right],} \end{array}$Теорема 2. (Принцип оптимального успокоения колебаний). Предположим, что движение системы описывается уравнениями (1.3) и имеются две точки x0 и x1, такие, что ${{x}_{0}} < {{x}_{1}}$ ${{\dot {x}}_{0}} = {{\dot {x}}_{1}} = 0$. Тогда
I. Необходимое условие оптимальности управлений ${\mathbf{u}} = {{{\mathbf{u}}}_{m}}(\tau )$, ${{{\mathbf{\dot {w}}}}_{m}}({{x}_{1}})$, которые, будучи стесненными ограничениями (1.5), при фиксированном значении x0 обеспечивают минимум величины ${{x}_{1}}$, выражается равенствами
(2.3)
$\begin{array}{*{20}{c}} {{{{\mathbf{u}}}_{m}}(x) = \arg \mathop {\min }\limits_{\mathbf{u}} \left[ {\chi (x,{{{\mathbf{y}}}_{m}})F(x,{\mathbf{u}})} \right],} \\ {{{{{\mathbf{\dot {w}}}}}_{m}}({{x}_{1}}) = \arg \mathop {\max }\limits_{{\mathbf{\dot {w}}}} \left[ {\sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}({{x}_{1}},{{{\mathbf{u}}}_{m}},{{{\mathbf{w}}}_{m}}){{{\dot {w}}}_{k}}} } \right],} \end{array}$II. Необходимые условия оптимальности управлений ${\mathbf{u}} = {{{\mathbf{u}}}_{M}}(x)$, ${{{\mathbf{\dot {w}}}}_{M}}({{x}_{0}})$, которые, будучи стесненными ограничениями (1.5), при фиксированном значении ${{x}_{1}}$ обеспечивают максимум величины ${{x}_{0}}$, выражаются уравнениями
(2.4)
$\begin{array}{*{20}{c}} {{{{\mathbf{u}}}_{M}}(x) = \arg \mathop {\max }\limits_{\mathbf{u}} \left[ {\chi (x,{{{\mathbf{y}}}_{M}})F(x,{\mathbf{u}})} \right],} \\ {{{{{\mathbf{\dot {w}}}}}_{M}}({{x}_{0}}) = \arg \mathop {\min }\limits_{{\mathbf{\dot {w}}}} \left[ {\sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}({{x}_{0}},{{{\mathbf{u}}}_{M}},{{{\mathbf{w}}}_{M}}){{{\dot {w}}}_{k}}} } \right]{\text{,}}} \end{array}$Доказательства приведенных теорем дословно совпадают с соответствующими доказательствами, приведенными в работе [11], поскольку функция $f$ от трения явно не зависит, а влияние трения сказывается лишь на функции $p$, которая в формуле (1.7) входит в выражение для экспоненты и поэтому на процесс оптимизации не влияет.
Следствие. Правило (синтез) выбора оптимального управления раскачиванием не зависит от наличия трения в системе. От трения зависит лишь результат применения этого правила в каждом конкретном случае.
Доказательство. Поиск оптимального управления осуществляется в соответствии с формулами (2.1)−(2.4), в которые информация о трении явным образом не входит.
Замечание 1. Трение влияет на зависимость функций управления от времени.
Замечание 2. Приведенные теоремы справедливы в предположении, что функция $f \ne 0$. По существу, она представляет собой коэффициент при старшей производной в уравнении (1.4). Обращение ее в нуль свидетельствует о том, что при выбранном законе управления для заданных параметров системы происходит вырождение. Часто вырождение происходит потому, что динамические параметры управляющих частей системы превосходят динамические характеристики управляемой ее части. Тогда соответствующей настройкой параметров системы будет возможно устранить указанную неприятность. При невозможности настройки параметров вырождение также можно исключить переходом к классу кусочно-постоянных функций, разбивая процесс интегрирования на отрезки с сохранением непрерывности фазовых координат. На каждом таком отрезке производные от управляющих функций будут равны нулю, и будет выполнено $f = {{a}_{{11}}} > 0$. Таким образом, можно будет построить последовательность кусочно постоянных функций, дающую приближенное представление об оптимальном решении.
3. ПРИМЕР. МАЯТНИК С ТОЧКОЙ ПОДВЕСА НА ПЕРЕВЕРНУТОЙ ЦИКЛОИДЕ
Твердое тело, имеющее массу m и центральный момент инерции ${{I}_{b}}$, движется плоскопараллельно c сухим и вязким трением в вертикальной плоскости так, что его центр масс скользит по перевернутой циклоиде (брахистохроне). Тело вращается, отслеживая касательную к траектории центра масс. К этому телу в его центре масс подвешен стержень, имеющий массу $M$ и центральный момент инерции ${{I}_{r}}$. Относительно тела стержень способен совершать колебания в той же плоскости. Требуется, управляя движением стержня, заставить тело $m$ двигаться по циклоиде с возрастающей амплитудой колебаний в окрестности нижней точки циклоиды. Обозначим $l$ расстояние от центра масс $С$ стержня до точки подвеса. Пусть ${\mathbf{\nu }}$ − внешняя нормаль к циклоиде в точке подвеса стержня, а $\psi $ − угол между вектором ${\mathbf{\nu }}$ и стержнем. Угол $\psi $ примем в качестве управления с целью раскачивания системы (рис. 1).
Для описания движения введем абсолютную право-ориентированную декартову систему координат $O\xi \eta \zeta $. Ось $O\eta $ направим вертикально вверх. Ось $O\xi $ расположим в плоскости движения. Тогда ось $O\zeta $ будет перпендикулярна указанной плоскости. Уравнение перевернутой циклоиды представим в виде
Таким образом, вектор ${\mathbf{\nu }}$ образует с отрицательным направлением оси $O\eta $ угол φ/2.
Система уравнений Лагранжа записывается следующим образом:
(3.1)
$\begin{array}{*{20}{c}} {\frac{d}{{dt}}({{A}_{\psi }}\dot {\varphi } + {{B}_{\psi }}\dot {\psi }) + {{C}_{\psi }} = - Mlg\sin \left( {\frac{\varphi }{2} + \psi } \right) + {{Q}_{\psi }},} \\ \begin{gathered} \frac{d}{{dt}}({{A}_{\varphi }}\dot {\varphi } + {{B}_{\varphi }}\dot {\psi }) + {{C}_{\varphi }} = \\ \, = - \,(m + M)ga\sin \varphi - \frac{{Mgl}}{2}\sin \left( {\frac{\varphi }{2} + \psi } \right) + R, \\ \end{gathered} \end{array}$(3.2)
$\left\{ \begin{gathered} {{A}_{\varphi }} = 4(m + M){{a}^{2}}{{\cos }^{2}}\left( {\frac{\varphi }{2}} \right) + \hfill \\ \, + 2Mla\cos \left( {\frac{\varphi }{2}} \right)\cos \psi + \frac{{M{{l}^{2}} + {{I}_{r}}}}{2} + \frac{{{{I}_{b}}}}{4}, \hfill \\ {{B}_{\varphi }} = 2Mla\cos \left( {\frac{\varphi }{2}} \right)\cos \psi + M{{l}^{2}} + {{I}_{r}}, \hfill \\ {{C}_{\varphi }} = \left[ {\mathop {(m + M){{a}^{2}}{{{\dot {\varphi }}}^{2}}\sin \varphi + }\limits_{_{{}}} } \right. \hfill \\ \left. {\, + Mla\dot {\varphi }\left( {\frac{{\dot {\varphi }}}{2} + \dot {\psi }} \right)\cos \psi \sin \left( {\frac{\varphi }{2}} \right)} \right], \hfill \\ \end{gathered} \right.$Следует отметить, что коэффициенты (3.2) при ${{I}_{b}} = 0$ отличаются от соответствующих неправильных коэффициентов, полученных в статье [11], а также в связанной с ней переводной версией журнала «Computer and Systems science international» из-за неточности, допущенной при выводе уравнений движения. В настоящей работе эта погрешность исправлена. Ошибка ни на что не повлияла, так как цель примера в упомянутых работах состояла в лишь том, чтобы продемонстрировать технику применения теорем в общем случае сколько-нибудь сложной системы дифференциальных уравнений.
Из уравнений (3.1) видно, что при ${{Q}_{\psi }} = 0$ и отсутствии трения система имеет положения равновесия, когда
В допустимых пределах $ - \pi \leqslant \varphi \leqslant \pi $ условиям (3.3) соответствуют значения $\varphi = 0$ и $\varphi = \pm \pi $. Очевидно, что при $\varphi = 0$ достигается нижнее устойчивое положение равновесия (нулевое положение равновесия), а при $\varphi = \pm \pi $ достигаются два верхних неустойчивых положения равновесия по краям циклоиды. Первое условие (3.3) означает, что в положениях равновесия стержень должен быть направлен вертикально вниз.
Перейдем к анализу оптимальных законов раскачивания маятника. В уравнениях (3.1) в качестве управляющей координаты выбирается угол $\psi $. Для простоты анализа не будем накладывать никаких ограничений на величину и скорость изменения угла $\psi $. В соответствии с уравнением (1.4) получим $f = {{A}_{\varphi }} + {{B}_{\varphi }}\psi {\kern 1pt} '$, где $\psi {\kern 1pt} '$ − производная по $\varphi $. Знак множителя $\lambda $, вычисляемого по формуле (1.7), совпадает со знаком функции $f$. Правая часть второго уравнения (3.1) зависит от угла $\psi $. Оптимизируемая по величине $\psi $ функция в формулировке теорем 1 и 2 принимает вид
(3.4)
$\begin{gathered} \chi (x,{\mathbf{y}})F(x,{\mathbf{u}}) = \Phi = \\ \, = - \chi \left[ {(m + M)ga\sin \varphi + \frac{{Mgl}}{2}\sin \left( {\frac{\varphi }{2} + \psi } \right)} \right]. \\ \end{gathered} $Экстремальные значения функции $\Phi $ достигаются при
Следовательно, для указанных экстремалей будем иметь
(3.5)
$\begin{gathered} f = {{A}_{\varphi }} - \frac{{{{B}_{\varphi }}}}{2} = \\ \, = Mal\left[ {2b\cos \left( {\frac{\varphi }{2}} \right) \pm \sin \frac{\varphi }{2}} \right]\cos \left( {\frac{\varphi }{2}} \right) + \frac{{{{I}_{b}}}}{4}, \\ b = \frac{{2(M + m)a}}{{Ml}}. \\ \end{gathered} $Учтем, что
Если принять
то коэффициент $\chi > 0$. Воспользовавшись рекомендацией замечания 2, будем в дальнейшем считать условие (3.6) выполненным.Применим утверждение I теоремы 1. Пусть ${{\varphi }_{0}} < 0$ есть левая граница отклонения по углу $\varphi $, а ${{\varphi }_{1}} > 0$ − соответственно правая граница, и пусть в начальный момент $\varphi = {{\varphi }_{0}}$. Из формулы (2.1) видим, что наилучший способ достичь максимума положительного полуколебания состоит в применении правила
Геометрический смысл полученного закона управления состоит в том, что стержень должен быть перпендикулярен к вертикальной оси и составлять с горизонтальной осью развернутый угол, обеспечивая максимальное значение силового момента.
Применим утверждение II теоремы 1. Пусть теперь в начальный момент $\varphi = {{\varphi }_{1}} > 0$. Тогда, напротив, требуется минимизировать значение ${{\varphi }_{0}}$ отрицательного полуразмаха. Из (2.2) заключаем, что наилучший режим для достижения минимума отклонения отрицательного полуразмаха состоит в применении формулы
Геометрический смысл закона управления (3.8) состоит в том, что стержень должен быть перпендикулярным к вертикальной оси и сонаправленным с горизонтальной осью, обеспечивая минимальное значение силового момента.
В итоге получается синтез управления для оптимального раскачивания маятника, а именно: после достижения максимального положительного отклонения маятника следует применять формулу (3.8); после достижения минимального отрицательного отклонения следует применять формулу (3.7), и так далее. Таким образом, при достижении экстремальных отклонений маятника стержень должен мгновенно поворачиваться на развернутый угол. Естественно, что в реальности такой скачок по координате невозможен, и его следует рассматривать как предел, когда время переходного процесса стремится к нулю.
Из теоремы 2 выводится синтез управления для оптимального успокоения колебаний маятника, а именно: после достижения максимального положительного отклонения маятника следует применять формулу (3.7); после достижения минимального отрицательного отклонения следует применять формулу (3.8), и так далее.
После того, как зависимость $\psi (\varphi )$ установлена, второе уравнение системы (3.1) становится замкнутым, и его можно решать различными известными методами [12]. После определения функции $\varphi (t)$ становится возможным из первого уравнения (3.1) найти обобщенную силу ${{Q}_{\psi }}$, обеспечивающую требуемое изменение угла $\psi $.
Если $\dot {\varphi } \ne 0$, то для законов управления (3.7), (3.8) сила трения может быть представлена формулой
(3.9)
$\begin{gathered} R = - 2a(M + m) \times \\ \, \times [(a{{{\dot {\varphi }}}^{2}} + g){{f}_{r}}\operatorname{sgn} \dot {\varphi } + 2a{{k}_{r}}\dot {\varphi }]{{\cos }^{2}}\frac{\varphi }{2}, \\ \end{gathered} $Наличие сухого трения осложняет картину положений равновесия. Если управления нет, то в окрестности точки $\varphi = 0$ возникает множество положений равновесия (зона застоя) из-за действия силы трения покоя. Тогда условия равновесия в окрестности $\varphi = 0$ принимают вид
4. РЕЗУЛЬТАТЫ ВЫЧИСЛЕНИЙ
Уравнения (3.1) с учетом формулы (3.9) и раскачивающих законов управления (3.7) и (3.8) можно представить в виде:
(4.1)
$\begin{gathered} \ddot {\varphi }A - {{{\dot {\varphi }}}^{2}}B = \\ \, = \left\{ {\begin{array}{*{20}{c}} \begin{gathered} \frac{g}{{2a}}(1 - b\sin \varphi ) - \hfill \\ \, - \frac{b}{2}(1 + \cos \varphi )\left[ {{{f}_{r}}\left( {{{{\dot {\varphi }}}^{2}} + \frac{g}{a}} \right) + 2{{k}_{r}}\dot {\varphi }} \right],\quad \dot {\varphi } > 0, \hfill \\ \end{gathered} \\ \begin{gathered} - \frac{g}{{2a}}(1 + b\sin \varphi ) + \hfill \\ \, + \frac{b}{2}(1 + \cos \varphi )\left[ {{{f}_{r}}\left( {{{{\dot {\varphi }}}^{2}} + \frac{g}{a}} \right) - 2{{k}_{r}}\dot {\varphi }} \right],\quad \dot {\varphi } < 0, \hfill \\ \end{gathered} \end{array}} \right. \\ \end{gathered} $Когда оказывается, что $\dot {\varphi } = 0$, то это означает, что достигнуто максимальное значение отклонения тела $m$ от нулевого положения равновесия, и в этот момент в формулах (4.1) происходит альтернативное переключение знаков. В начальный момент ${{t}_{0}}$ времени задается $\dot {\varphi } = \varphi = 0$, а управление выбирается так, как если бы $\dot {\varphi }({{t}_{0}} - 0) < 0$.
Учет трения покоя выполняется по формуле
(4.2)
$\begin{gathered} \ddot {\varphi } = 0\quad {\text{при}} \\ \left\{ {\begin{array}{*{20}{c}} {\dot {\varphi } = 0,\quad \varphi > {\text{0,}}\quad \left| {1 + b\sin \varphi } \right| < b{{f}_{r}}(1 + \cos \varphi ),} \\ {\dot {\varphi } = 0,\quad \varphi \leqslant {\text{0,}}\quad \left| {1 - b\sin \varphi } \right| < b{{f}_{r}}(1 + \cos \varphi ),} \end{array}} \right. \\ \end{gathered} $Представим центральный момент инерции тела в виде ${{I}_{b}} = m{{\rho }^{2}}$, где $\rho $ − радиус инерции тела. Дополнительно введем безразмерные параметры системы:
(4.3)
$\begin{gathered} M = \mu m,\quad l = \sigma a,\quad \rho = \varepsilon a, \\ b = \frac{{2(\mu + 1)}}{{\mu \sigma }},\quad \frac{{{{I}_{b}}}}{{Mal}} = \frac{{{{\varepsilon }^{2}}}}{{\mu \sigma }}. \\ \end{gathered} $На рис. 2 показан фазовый портрет системы для следующего набора независимых параметров: $m = 1$ кг, $a = 1$ м, $\mu = 1$, $\sigma = 0,25$, $\varepsilon = \sqrt {0.5} $, ${{f}_{r}} = 0$, ${{k}_{r}} = 0$. На всех фазовых портретах, представленных ниже, по горизонтальной оси откладываются значения параметра $\varphi $, а по вертикальной оси значения скорости $\dot {\varphi }$. Пунктиром выделены оси, проходящие через начало координат, а также положения равновесия при отклоненном стержне от вертикали, соответствующие значениям φ1 = = $ - {{\varphi }_{3}} = \arcsin (1{\text{/}}b)$ ≈ 0.0625. Видно, что описанный в п. 3 алгоритм раскачивания системы успешно справляется с задачей увеличения амплитуды колебаний вплоть до достижения предельно возможных значений угла $\varphi $.
На рис. 3 представлен фазовый портрет системы, для которого по сравнению с параметрами, принятыми для рис. 2, изменен только коэффициент вязкого трения: ${{k}_{r}} = 0,1$. Видим, что даже сравнительно небольшое вязкое трение препятствует неограниченному увеличению амплитуды, уменьшая приращения амплитуды на каждом следующем цикле управления.
При выполнении расчетов, связанных с оценкой влияния сухого трения, необходимо учитывать трение покоя. В соответствии с формулами (4.2) движение тела $m$ из нулевого положения равновесия может начаться вследствие качания стержня лишь тогда, когда выполнено соотношение $2b{{f}_{r}} < 1$. Если взять параметры, принятые выше для оценки влияния вязкого трения: $m = 1$ кг, $a = 1$ м, $\mu = 1$, $\sigma = 0.25$, $\varepsilon = \sqrt {0.5} $, то получим ограничение $\sigma > 8{{f}_{r}}$. Таким образом, при $\sigma = 0.25$ должно быть ${{f}_{r}} < 0.03125$. На рис. 4 показан фазовый портрет системы для значений ${{f}_{r}} = 0.025$, ${{k}_{r}} = 0$. Остальные параметры соответствуют ранее рассмотренным вариантам. При сравнении с рис. 2, 3 видно, что наличие сухого трения приводит к тому, что амплитуда колебаний увеличивается медленнее, и приращения амплитуды не уменьшаются от цикла к циклу управления, указывая на отсутствие предельно большой конечной амплитуды. Следовательно, в кинематически допустимых пределах маятник с таким трением можно раскачать до любой заданной амплитуды. Однако процесс раскачивания будет замедленным. Ускорить процесс раскачивания под действием влияния сухого трения можно, увеличивая длину стержня.
Если трение отсутствует, то в силу консервативности системы прекращение управления влечет сохранение амплитуды колебаний. В присутствии трения такой способ сохранения амплитуды невозможен. Вместе с тем трение можно использовать для полупассивного поддержания амплитуды колебаний в некотором диапазоне значений. На рис. 5 изображена диаграмма Пуанкаре системы, соответствующая параметрам $\sigma = 0.25$, ${{f}_{r}} = 0.025$, ${{k}_{r}} = 0$. На ней по горизонтальной и по вертикальной осям откладываются соответственно предыдущие и последующие значения амплитуды. Логика поддержания заданной амплитуды, равной 0.5, состояла в том, что при превышении значения 0.5 модуля амплитуды в моменты достижения значений скорости $\dot {\varphi } = 0$ оптимальное увеличение амплитуды прекращалось, стержень приводился в вертикальное положение вдоль отрицательного направления оси $O\eta $ $(\psi + \varphi {\text{/}}2 = 0)$, и в таком положении оставался до того момента, когда амплитуда становилась меньше значения 0.5. После этого снова возобновлялся оптимальный разгон маятника. На рисунке видно, что сначала происходит монотонное увеличение амплитуды, а затем включается описанная выше логика поддержания амплитуды в районе значения 0.5. Участки диаграммы, расположенные ниже биссектрисы координатного угла, соответствуют торможению, а участки диаграммы, расположенные выше − разгону. Диапазон получающихся амплитуд приблизительно составляет $0.1$. Регулировка ширины реализуемого диапазона значений амплитуды может быть обеспечена посредством изменения длины стержня.
5. ЗАКЛЮЧЕНИЕ
В работе предложены лаконичные необходимые условия оптимального управления колебаниями для голономных механических систем с сухим и вязким трением и с дефицитом управления по одной степени свободы. Применение алгоритмов управления, получаемых из необходимых условий оптимальности (2.1)–(2.4), предполагает учет информации о достижении экстремальных значений оптимизируемой координаты и информации о направлении соответствующего полуколебания. Условия оптимальности (2.1)–(2.4) не содержат сопряженных переменных в смысле принципа максимума Л.С. Понтрягина [5]. Это облегчает применение указанных условий для рассмотренного класса задач. Показано, что наличие трения не влияет на правило выбора оптимального управления. Трение влияет лишь на результат применения этого правила в каждом конкретном случае. Дополнительным преимуществом предложенного метода служит то, что закон оптимального управления получается непосредственно в виде зависимости от оптимизируемой координаты. Используя предложенные условия оптимальности, можно получить аналитические решения для некоторых новых нетривиальных модельных задач. Эти условия упрощают решение соответствующих задач в многомерном пространстве управляющих функций по сравнению с известными методами. Они эффективны как для задач раскачивания, так и для задач успокоения колебаний. Рассмотренный в работе пример иллюстрирует особенности применения предложенного метода в системах с трением и демонстрирует технику учета трения покоя в колебательных системах. Отмечено, что линейное по скорости вязкое трение ограничивает достижимые значения амплитуды, а сухое Кулоновское трение такой особенностью не обладает, но замедляет развитие процесса, а при значительном коэффициенте трения препятствует возникновению требуемых колебаний. Предложен метод, использующий трение для поддержания амплитуды колебаний в окрестности ее заданного значения.
Список литературы
Фантони И., Лозано Р. Нелинейное управление механическими системами с дефицитом управляющих воздействий. Перевод с франц. Ижевск: К-Динамика, 2012. 312 с. ISBN 978-5-906268-01-3.
Tad McGeer. Passive Dynamic Walking. International Journal of Robotics Research. April, 1990. V. 9. № 2. P. 62–82, April, 1990.
Формальский А.М. Управление движением неустойчивых объектов. М.: ФИЗМАТЛИТ, 2012. 232 с. ISBN 978-5-9221-1460-8.
Климина Л.А., Формальский А.М. Об оптимальном раскачивании качелей стоящим на них человеком // Известия РАН. Теория и системы управления. 2022. № 6. С. 85–94. ISSN: 0002-3388. https://doi.org/10.31857/S0002338822060117
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1976. 393 с.
Черноусько Ф.Л., Акуленко Л.Д., Соколов Б.Н. Управление колебаниями. М.: Наука. Главная редакция физико-математической литературы, 1980. 384 с.
Охоцимский Д.Е., Энеев Т.М. Некоторые вариационные задачи, связанные с запуском искусственного спутника Земли. М.: Гос. Изд-во технико-теор. лит-ры. (Успехи физических наук. Т. 63. Вып. 1а). 1957. С. 5–32.
Голубев Ю.Ф. Метод оптимального управления колебаниями механических систем // Препринты ИПМ им. М.В. Келдыша. 2021. № 33. 37 с. https://doi.org/10.20948/prepr-2021-33, https://library.keldysh.ru/preprint.asp?id=2021-33
Golubev Yu.F. Optimal Control for Nonlinear Oscillations of Natural Mechanical Systems. // Lobachevskii J. Math. 2021. V. 42. № 11. P. 2596–2607. ISSN: 1995-0802https://doi.org/10.1134/S199508022111010X
Голубев Ю.Ф. Оптимизация колебаний механических систем // Доклады Российской академии наук. Математика, информатика, процессы управления. 2022. Т. 502. С. 52–57. ISSN (PRINT): 2686-9543. https://doi.org/10.31857/S2686954322010040
Голубев Ю.Ф. Управление амплитудой колебаний механических систем // Известия РАН. Теория и системы управления. 2022. № 4. С. 22–30. ISSN: 0002-3388. https://doi.org/10.31857/S0002338822040084
Степанов В.В. Курс дифференциальных уравнений. Изд. 11, испр., обновл. М.: URSS. 2016. 512 с. ISBN 978-5-382-01622-1
Дополнительные материалы отсутствуют.
Инструменты
Доклады Российской академии наук. Математика, информатика, процессы управления