Автоматика и телемеханика, № 4, 2021
Линейные системы
© 2021 г. А.И. ГЛУЩЕНКО, канд. техн. наук (a.glushchenko@sf-misis.ru),
В.А. ПЕТРОВ, канд. техн. наук (petrov.va@misis.ru),
К.А. ЛАСТОЧКИН (lastconst@yandex.ru)
(Старооскольский технологический институт
им. А.А. Угарова (филиал) ФГАОУ ВО
¾Национальный исследовательский технологический университет ¾МИСиС¿,
Старый Оскол)
АДАПТИВНАЯ СИСТЕМА УПРАВЛЕНИЯ С ПЕРЕМЕННЫМ
КОЭФФИЦИЕНТОМ УСИЛЕНИЯ ЗАКОНА НАСТРОЙКИ
НА ОСНОВЕ РЕКУРСИВНОГО МЕТОДА
НАИМЕНЬШИХ КВАДРАТОВ1
Целью работы является синтез адаптивной системы управления с пере-
менным коэффициентом усиления контура адаптации для компенсации
параметрической неопределенности объекта управления. Такая система
в отличие от существующих одновременно 1) включает в себя алгоритм
автоматического вычисления коэффициента усиления закона настройки
параметров регулятора, который работает пропорционально текущей ве-
личине регрессора, позволяя получить регулируемую верхнюю оценку
скорости сходимости рассогласований по выходу объекта и параметрам
регулятора к нулю (при выполнении условия постоянного возбуждения
регрессора), 2) не требует знания знака или значения элементов матрицы
коэффициентов усиления объекта управления. Для синтеза такой систе-
мы управления использовались второй метод Ляпунова и рекурсивный
метод наименьших квадратов. Для нее были доказаны свойства устой-
чивости, ограниченности значений упомянутых выше рассогласований и
получены оценки скорости их сходимости к нулю. Демонстрация эффек-
тивности предлагаемого подхода была проведена путем математического
моделирования на примере объекта управления, соответствующего поста-
новке задачи исследования.
Ключевые слова: беспоисковое прямое адаптивное управление, эталонная
модель, постоянное возбуждение регрессора, второй метод Ляпунова, ко-
эффициент усиления закона настройки, рекурсивный метод наименьших
квадратов, оценка устойчивости.
DOI: 10.31857/S0005231021040036
1. Введение
Основной целью функционирования адаптивных систем управления с эта-
лонной моделью является поддержание требуемого качества регулирования
1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных
исследований (проект № 18-47-310003 р а).
77
в условиях наличия существенной параметрической неопределенности объек-
та управления путем настройки параметров его регулятора. На сегодняшний
день существует два классических подхода для построения подобных систем
управления: непрямое и прямое адаптивное управление [1, 2]. В данной работе
рассматривается исключительно проблематика прямого адаптивного управ-
ления по полному вектору координат состояния.
Алгоритм настройки параметров регулятора в схемах прямого адаптив-
ного управления обычно получают с помощью метода оптимизации первого
порядка градиентного спуска (и его вариаций), а также второго метода
Ляпунова [1, 3, 4]. Сегодня нерешенными проблемами большинства законов
настройки остаются, во-первых, требование наличия постоянного возбужде-
ния регрессора для экспоненциальной сходимости к нулю параметрической
ошибки между настраиваемыми и идеальными параметрами регулятора, а
во-вторых, наличие в законе адаптации экспериментально подбираемого па-
раметра коэффициента усиления процесса адаптации [4, 5]. С основными
путями решения первой проблемы можно ознакомиться в [6]. В данной же
работе остановимся на рассмотрении и решении второй проблемы.
Само наличие в законе настройки экспериментально подбираемого пара-
метра вызывает сложности, поскольку эксперименты по его выбору на ре-
альном объекте не всегда возможно произвести, а коэффициент усиления,
подобранный на математической модели, чаще всего не подходит для реаль-
ного объекта.
Чтобы проанализировать другие проблемы, возникающие при использо-
вании постоянного значения коэффициента усиления, отдельно рассмотрим
ситуации наличия и отсутствия постоянного возбуждения регрессора.
В случае отсутствия постоянного возбуждения известно [1], что использо-
вание больших значений коэффициента усиления контура адаптации на ре-
альном объекте может многократно усиливать высокочастотные паразитные
составляющие в его динамике и шумы измерений, что является недопусти-
мым с точки зрения робастной устойчивости [7, 8]. В литературе выделяют
три типа неустойчивости адаптивных систем управления, которые вызыва-
ются высоким коэффициентом усиления закона настройки и наличием в объ-
екте паразитной высокочастотной динамики: неустойчивость из-за быстрой
адаптации, высокочастотная неустойчивость и неустойчивость вследствие по-
лученных в результате адаптации больших значений коэффициентов регу-
лятора [1, 7-9]. Все эти эффекты приводят к необходимости компромиссно-
го выбора коэффициента усиления: его значения должны быть достаточно
большими для удовлетворительного качества процесса адаптации, но недо-
статочно большими для усиления паразитной динамики объекта.
Кроме того, адаптивная система даже с правильно выбранным коэффици-
ентом усиления и в условиях отсутствия паразитной динамики обеспечива-
ет желаемое быстродействие алгоритма настройки и соответственно требуе-
мое качество управления только для ограниченного числа значений задания
для рассматриваемого объекта управления. Это происходит вследствие того,
что адаптивная система управления даже с линейным объектом и линейной
эталонной моделью образует нелинейный замкнутый контур регулирования,
78
принцип суперпозиции для которого, как известно, не соблюдается [10]. Для
решения этой проблемы и обеспечения требуемого быстродействия для наи-
более широкого диапазона заданий на систему в [11, 12] был предложен ме-
тод масштабирования коэффициента усиления. Подход, использующий сход-
ную идею, можно найти в [13]. Эти методики позволяют масштабировать
подобранную экспериментально оптимальную скорость к различным устав-
кам. Недостатком такого метода является необходимость экспериментально-
го, ручного подбора начального значения коэффициента усиления, обеспе-
чивающего требуемую скорость сходимости процесса адаптации, и фактора
масштабирования. Таким образом, основными недостатками использования
постоянного значения коэффициента усиления закона настройки при отсут-
ствии постоянного возбуждения является возможность усиления высокоча-
стотной динамики при слишком большом его значении, а также обеспече-
ние требуемого быстродействия закона настройки коэффициентов регулято-
ра только для ограниченного числа заданий.
В случае наличия постоянного возбуждения, кроме описанных недостат-
ков, связанных с использованием больших значений коэффициента усиления,
возникает еще одна проблема. В [6, 7, 14] было доказано существование опти-
мального значения коэффициента усиления для текущего регрессора в случае
наличия постоянного возбуждения и проиллюстрировано, что с его увеличе-
нием выше оптимального скорость сходимости процесса адаптации не ускоря-
ется, а замедляется. С одной стороны, это означает, что скорость сходимости
настраиваемых параметров к идеальным значениям не может быть сделана
произвольно большой, а с другой стороны, что для каждого нового значе-
ния регрессора существует свое новое оптимальное значение коэффициента
усиления процесса адаптации.
Из проведенного анализа следует, что использование экспериментально
выбираемого постоянного коэффициента усиления адаптации и в ситуации
наличия, и в ситуации отсутствия постоянного возбуждения приводит к се-
рьезным проблемам, которые существенно уменьшают вероятность успеха
практической реализации адаптивных систем управления.
Таким образом, задача разработки метода настройки коэффициента уси-
ления контура адаптации является актуальной для теории адаптивных си-
стем и особенно актуальной для практики их применения.
Поэтому в данном исследовании предлагается разработать контур адап-
тации, включающий алгоритм расчета коэффициента усиления и, следова-
тельно, свободный от описанных недостатков, связанных с его эксперимен-
тальным выбором. В качестве основы для разработки такого контура пред-
лагается использовать рекурсивный метод наименьших квадратов с коэф-
фициентом экспоненциального забывания [1, 8]. Достоинствами этого метода
являются, собственно, наличие закона настройки коэффициента усиления и
экспоненциальная сходимость параметрической ошибки к нулю с регулируе-
мой скоростью сходимости при выполнении условия постоянного возбужде-
ния [1]. Данный подход широко известен в теории идентификации, однако
эффективных его применений в схемах прямого адаптивного управления об-
наружить не удалось.
79
В данной работе при разработке контура адаптации параметров регуля-
тора с переменной скоростью настройки ограничимся рассмотрением случая
выполнения условия постоянного возбуждения регрессора.
2. Постановка задачи
Рассматривается задача адаптивного управления классом линейных объ-
ектов, которые в пространстве координат состояния могут быть записаны в
фробениусовой форме:
(2.1)
x = Ax + Bu,
где x ∈ Rn
вектор координат состояния объекта, u ∈ R
управляю-
щее воздействие, A ∈ Rn×n фробениусова матрица состояний системы, и
B = [0,0,... ,b] ∈ Rn×1
матрица коэффициентов усиления. Значения эле-
ментов A и B неизвестны, но составляют управляемую пару (A, B). Доступ-
ными для прямого измерения считаются вектор координат состояния x и
вектор его первых производных x. На практике получить оценку производ-
ной вектора координат состояния представляется возможным, в частности,
используя методы, описанные в [15, 16]. Эталонная модель, определяющая
требуемое качество управления объектом с неизвестными параметрами (2.1),
также выбирается в фробениусовой форме:
(2.2)
xref = Arefxref + Bref
r,
где xref ∈ Rn вектор координат состояния эталонной модели, r ∈ R огра-
ниченный сигнал задания, Bref = [0, 0, . . . , bref ] ∈ Rn×1. Матрица состояний
эталонной модели Aref ∈ Rn×n является гурвицевой и записана в фробениу-
совой форме.
Уравнение в отклонениях между уравнениями объекта управления (2.1) и
уравнениями эталонной модели (2.2) может быть найдено в виде
(2.3)
ėref = Areferef + Bu - (Aref - A) x - Bref
r.
Поскольку и объект управления, и его эталонная модель записаны в форме
фробениуса, то условие адаптируемости [4] естественным образом выполня-
ется:
(2.4)
rank {B, Bref } = rank {B, A - Aref
} = 1.
Утверждение. Если выполняется условие адаптируемости (2.4), то
выполняются и равенства:
[
]
Z
n-1,n
BB =
;
0
0
1
(2.5)
BB(Aref - A) = Aref - A; BBBref = Bref,
где Zn-1,n нулевая матрица. Справедливость утверждения может быть
проверена, например, непосредственной подстановкой в формулы (2.5) лю-
бых матриц, соответствующих постановке задачи.
80
Выполнение условия (2.4) и равенств (2.5) позволяет переписать уравнение
(2.3) в виде
[
]
(2.6)
ėref = Areferef + B u - B (Aref - A) x - BBrefr ,
где B псевдообратная по отношению к B матрица.
Тогда закон управления, доставляющий объекту управления (2.1) же-
лаемое качество управления, может быть определен из уравнения в откло-
нениях (2.6):
u = B [(Aref - A)x + Brefr] = krkxx + krr,
(2.7)
krkx = B (Aref - A); kr = BBref,
где kx ∈ R1×n и kr ∈ R идеальные коэффициенты закона управления.
В случае известных, например номинальных, значений элементов матриц
A и B по формулам (2.7) может быть рассчитан идеальный регулятор для
объекта (2.1).
Для случая неизвестных (квазистационарных) параметров матриц A и B
введем закон управления с текущими параметрами
(2.8)
u=krkxx+kr
r.
Из определения коэффициентов kx и kr в выражении (2.7) можно получить
аналитические выражения для вычисления матрицы B и разницы (Aref -A):
(2.9)
Aref - A = Brefkx; B = k-1rBref.
С учетом выражений (2.9) при подстановке закона управления (2.8) в урав-
нение в отклонениях (2.6) получаем запись
[
]
ėref = Areferef + B
krkxx +krr - (Aref - A) x - Bref r =
[
]
=Areferef +k-1rBref
krkxx +krr -Brefkxx-
(
)
−Brefr+ Brefkxx-Brefkxx =
(2.10)
[(
)
(
)
(
)]
=Areferef +Bref
kx - kx x +kxx kr1kr - I
+r k-1rkr-I
=
[
(
)(
)]
=Areferef +Bref
kxx + kr1kr - I
kxx + r
=
[
(
)]
=Areferef +Bref
kxx -kr1kr
kxx + r
Здесьkx =kx - kx,k-1r =k-1r - k-1r. В уравнении (2.10) введем понятие
функции обобщенной параметрической ошибки ε:
ε=BrefθTω,
(2.11)
[
(
) ]T
[
]
k-1
ω= xT -kr
kxx + r
;
θT =
= θTT.
kx
r
81
Здесь
θT ∈ Rn+1 настраиваемые параметры, через которые возмож-
но вычислить (обращая оценкуk-1r) текущие параметры регулятора (2.8),
θT ∈ Rn+1 идеальные параметры, через которые возможно вычислить (об-
ращая k-1r) параметры идеального регулятора (2.7),θT ∈ Rn+1 разница
междуθT и θT. Тогда уравнение (2.10) с учетом (2.11) может быть переписа-
но в следующем виде:
(2.12)
ėref = Areferef + Bref θT
ω.
На основе уравнения (2.12) возможно получить закон адаптации регуля-
тора (2.8). Поскольку отθ можно перейти к текущимkx,kr параметрам
регулятора (2.8), то под законом его адаптации будем понимать закон на-
стройкиθ. Впервые параметризация (2.12) была предложена в [17] с целью
построения закона адаптации, не требующего знания матрицы коэффициен-
тов усиления B объекта управления.
Для системы (2.12) необходимо построить закон настройки коэффициен-
товθ, который не требует экспериментального, ручного подбора коэффициен-
та усиления закона адаптации и обеспечивает экспоненциальную сходимость
[
]T
θT
ошибки ξ = eTref
к нулю при выполнении условия постоянного воз-
буждения для регрессора ω.
Определение. Для ограниченного сигнала ω выполняется условие по-
стоянного возбуждения, если ∀t ≥ 0 ∃T > 0 и α > 0 такие, что верно
неравенство
(2.13)
ω (τ)ωT
(τ)dτ ≥ αI,
t
где I
единичная матрица, а α степень возбуждения.
3. Идентификатор идеальных параметров регулятора с переменным
коэффициентом усиления контура адаптации
Для достижения поставленной цели сначала построим закон оценкиθ,
обеспечивающий экспоненциальную сходимость к нулю из всего вектора ξ
только ошибкиθT и не требующий ручного подбора коэффициента усиле-
ния.
Для этого введем понятие желаемого поведения уравнения в отклонениях
(2.12), которое зададим дифференциальным уравнением
(3.1)
ėd = Areferef .
Обобщенная параметрическая ошибка (2.11) тогда может быть вычислена
через рассогласование между уравнением в отклонениях (2.12) и его желае-
мым поведением (3.1):
(
)
(
)
(3.2)
ε= ėref - ėd =BrefθTω=Bref
θT - θT ω = Bref
θTω - y ,
где y идеальное значение параметрического возмущения на систему (2.12).
82
Из уравнения (3.2) следует справедливость записи
(
)
(3.3)
B†refε =θTω =
θT - θT ω =θTω-y.
На этом этапе, следуя процедуре рекурсивного метода наименьших квад-
ратов, чтобы построить контур идентификацииθ(t) идеальных параметров θ
в момент времени t, введем в рассмотрение измерения y(τ) и ω(τ) для 0 ≤
≤ τ < t. С учетом нового времени перепишем уравнение (3.3):
(3.4)
B†refε =θT
(t)ω (τ) - y (τ) .
В этом случае целевой критерий минимизации выражения (3.4) согласно
рекурсивному методу наименьших квадратов с экспоненциальным забывани-
ем записывается в интегральном виде
t
( )
(
)T
1
θ
(3.5)
Q
=
e-λ(t-τ) B†refε
B†ref
εdτ,
2
0
где λ коэффициент экспоненциального забывания.
Условием минимума целевого критерия (3.5) является равенство нулю его
градиента по настраиваемым параметрам:
t
( )
[
]
(3.6)
ˆθT QT
θ
= e-λ(t-τ)ω (τ) ωT (τ) θ(t) - yT (τ)
dτ = 0.
0
В выражении (3.6), пользуясь свойством суммы интегралов, раскроем
скобки и перенесем слагаемое, содержащее идеальное значение параметри-
ческого возмущения, в правую часть равенства
t
t
(3.7)
e-λ(t-τ)ω (τ) ωT (τ)θ(t) dτ = e-λ(t-τ)ω (τ) yT
(τ) dτ.
0
0
Из (3.7) по методу наименьших квадратов может быть получена оценкаθ
идеальных параметров регулятора θ:
t
-1
t
(3.8)
θ(t) =  e-λ(t-τ)ω (τ)ωT (τ)dτ
e-λ(t-τ)ω (τ) yT
(τ) dτ.
0
0
|
{z
}
Γ(t)
Здесь Γ(t) матрица коэффициентов усиления закона настройки пара-
метров аппроксимирующей линейной регрессии.
83
Закон изменения во времени матрицы Γ-1(t) может быть найден с помо-
щью теоремы о производной интеграла по его верхнему пределу:
t
-1
= ω(t)ωT(t) - λ e-λ(t-τ)ω(τ)ωT(τ)dτ =
(3.9)
dt
0
= ω(t)ωT(t) - λΓ-1(t).
На этом этапе введем вспомогательное равенство
dI
d
[
]
dΓ (t)
-1 (t)
(3.10)
=
Γ (t) Γ-1 (t)
=
Γ-1 (t) +
Γ(t) = 0.
dt
dt
dt
dt
С учетом выражения (3.10) и введенных ранее определений матриц Γ(t) и
Γ-1(t) может быть получен закон изменения во времени матрицы Γ(t):
dΓ (t)
-1 (t)
(3.11)
= -Γ(t)
Γ (t) = λΓ (t) - Γ (t) ω (t) ωT
(t) Γ (t) .
dt
dt
Формулу оценки параметров идеального закона управления (2.7) с учетом
выражения (3.11) найдем, дифференцируя по времени оценку (3.8):
t
dθ(t)
dΓ (t)
=
e-λ(t-τ)ω (τ) yT (τ) dτ +
dt
dt
0
t
(3.12)
+ Γ(t)
d 
e-λ(t-τ)ω (τ)yT (τ)dτ =
dt
0
(
)
=
λ - Γ(t)ω (t)ωT (t)
θ(t) - λθ(t) + Γ(t) ω (t)yT (t) =
[
]
= Γ(t)ω (t) yT (t) - ωT (t) θ(t)
С учетом (3.4) уравнение (3.12) может быть приведено к виду
(
)T
dθ(t)
(3.13)
= -Γ(t)ω (t) B†refε
dt
Таким образом, контур идентификации идеальных параметров регулятора
(2.7) описывается законом изменения во времени матрицы коэффициентов
усиления (3.11) и непосредственно законом оценки (3.13):
(
)T
ˆ
θ = -Γω B
ε
,
ref
(3.14)
Γ=λΓ-ΓωωTΓ.
Свойства контура оценки (3.14) сформулируем в виде следующей теоремы.
84
Теорема 1. Контуром оценки (3.14) для ошибки θ обеспечиваются сле-
дующие свойства:
1) ошибкаθ является ограниченной величинойθ ∈ L2 ∩ L;
2) если выполняется условие постоянного возбуждения (2.13) и первая
производная регрессора ограничена ω ∈ L, то обеспечивается экспоненци-
альная сходимость ошибкиθ к нулю со скоростью быстрее, чем κ (ее зна-
чение определено в Приложении).
Доказательство теоремы 1 приведено в Приложении.
4. Синтез адаптивного управления с переменным коэффициентом
усиления в контуре настройки
В работе ранее была доказана сходимость к нулю параметрической ошиб-
киθ, а значит, идентифицирующие свойства контура оценки (3.14) идеаль-
ных параметров регулятора. Но сходимость к нулю всего вектора ξ, а значит,
устойчивость замкнутого контура регулирования (2.12) при использовании
полученных оценок коэффициентов рассмотрена не была. Поэтому примем
формулы (3.14) в качестве базовых и проведем их модификацию с целью
обеспечения сходимости к нулю не только параметрической ошибкиθ, но и
ошибки слежения eref . Результаты выполненной модификации представим в
виде теоремы 2.
Теорема 2. Пусть контур адаптации для замкнутого контура управ-
ления (2.12) описывается выражениями:
[
]T
ˆ
θ = -Γω B
ε+BTrefPeref
,
ref
(4.1)
Γ=λΓ-2ΓωωTΓ,
где P - матрица, полученная путем решения уравнения Ляпунова
ATrefP + PAref = -Q,
Q - экспериментально подбираемая матрица.
Тогда:
1) ошибка ξ является ограниченной величиной ξ ∈ L2 ∩ L;
2) если выполняется условие (2.13), то обеспечивается экспоненциальная
сходимость ошибки ξ к нулю со скоростью быстрее, чем ηmin;
3) если выполняется условие (2.13), то максимальная скорость сходимо-
сти ηmax ошибки ξ к нулю может быть сделана произвольно большой путем
увеличения коэффициента λ.
Доказательство теоремы 2, значения ηmin и ηmax приведены в Приложении.
5. Пример
Демонстрация эффективности предлагаемого подхода была проведена пу-
тем математического моделирования замкнутой системы (2.12) при адапта-
ции параметров закона управления (2.8) по формулам (4.1). Моделирование
85
||G||
2,5
2,0
1,5
1,0
0,5
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9 t, c
Рис. 1. Значение нормы матрицы коэффициентов усиления процесса адаптации.
~
||q||
||x||
1,6
2,5
1,4
2,0
1,2
1,0
1,5
0,8
0,6
1,0
0,4
0,5
0,2
0
0
0
0,2
0,4
0,6
0,8
t, c
0
0,5
1,0
1,5
t, c
Рис. 2. Переходные процессы по нормам параметрической ошибки
θ и ошибки ξ.
проводилось в Matlab/Simulink на основе численного интегрирования мето-
дом Эйлера. Во всех экспериментах использовался постоянный шаг дискре-
тизации τs = 10-6 секунды. Объект управления в экспериментах описывался
уравнением
[
]
[
]
0
1
0
x=
x+
u.
4
2
2
Эталонная модель для него была выбрана в соответствии с уравнением
[
]
[
]
0
1
0
xref =
xref +
r.
−8 -4
8
Согласно результатам, представленным, например, в [7], для обеспечения
условия постоянного возбуждения для объекта второго порядка необходимо
использовать в качестве задающего воздействия гармонического сигнала не
менее чем с двумя частотами. Поэтому в экспериментах условие постоянного
возбуждения (2.13) регрессора ω выполнялось путем использования в каче-
стве задания r гармонического сигнала
r = 125sin(t) + 250sin(125t) + 500sin(250t).
86
~
||q||
||x||
7
7
l1
l1
6
6
l2
l2
l3
l3
5
5
4
4
3
3
2
2
1
1
0
0
0
0,1
0,2
0,3
0,4
t, c
0
0,1
0,2
0,3
0,4
t, c
Рис. 3. Переходные процессы по нормам параметрической ошибки
θи ошиб-
ки ξ при различных λ.
Всего было проведено два эксперимента. В первом эксперименте (см. рис. 1
и рис. 2) начальное значение матрицы Γ(0), начальные значения коэффици-
ентов закона управления (2.8), а также значение коэффициента забывания λ
были выбраны в соответствии со следующими значениями
[
]
Γ (0) = 0,1I;
θT (0) =
0
0
1
;
λ = 25.
Из результатов моделирования (рис. 1 и рис. 2) следует, что предложен-
ный контур адаптации (4.1) обеспечивает экспоненциальную сходимость па-
раметрической ошибкиθ и ошибки ξ к нулю, при этом в процессе адаптации
используется переменное значение коэффициента усиления контура адапта-
ции.
Во втором эксперименте в контуре адаптации использовались различные
значения коэффициента забывания λ:
λ1 = 25; λ2 = 100; λ3 = 1000.
Но начальное значение матрицы Γ(0) и начальные значения коэффици-
ентов закона управления (2.8) совпадали со значениями, используемыми в
первом эксперименте.
Из результатов моделирования (рис. 3) следует, что с увеличением значе-
ния коэффициента забывания скорость сходимости параметрической ошибки
и ошибки ξ также увеличивается. Данный факт подтверждает результаты,
полученные в процессе доказательства теоремы 2.
Из рис. 3 также видно, что при λ → ∞ возникают существенные колеба-
ния; и это подтверждает выводы, сделанные в замечании к теореме 2. Для
устранения данного недостатка в дальнейших исследованиях планируется мо-
дификация разработанного контура адаптации (4.1) путем применения мето-
дов расширения и фильтрации регрессора [6] с целью минимизации значе-
ния T (максимизации допустимого значения λ).
87
6. Заключение
В работе была предложена адаптивная система управления, которая при
выполнении условия постоянного возбуждения не требует экспериментально-
го, ручного подбора матрицы коэффициентов усиления процесса адаптации
и при этом обеспечивает экспоненциальную сходимость ошибки слежения и
параметрической ошибки к нулю с регулируемой верхней оценкой скорости
сходимости.
В отличие от классической градиентной схемы, у которой существует пре-
дельная для текущего регрессора скорость сходимости [6, 13, 14], в разрабо-
танной схеме согласно доказательствам теоремы 2, проведенному анализу и
результатам экспериментов верхняя оценка скорости сходимости может быть
сделана произвольно большой путем увеличения фактора забывания λ.
В дальнейших исследованиях планируется модификация разработанного
контура адаптации с целью ослабления использованных допущений (выпол-
нение условия постоянного возбуждения, доступность первой производной
вектора координат состояния) и улучшения его свойств (устранения колеба-
ний при больших λ и обеспечения монотонной экспоненциальной сходимости).
ПРИЛОЖЕНИЕ
Доказательство теоремы 1. Для доказательства теоремы подста-
вим в уравнение (3.13) выражение (3.3). Тогда при условии θ = const имеем
уравнение
˜
θ
(Π.1)
θ = -ΓωωT
Кандидата в функции Ляпунова выберем в виде квадратичной формы
V =θTΓ-1 θ,
(Π.2)
(
)
λmin
Γ-1
θ
2 ≤ V ≤ λmax -1)θ2
,
где λmin(.), λmax(.)
минимальное и максимальное собственные числа мат-
рицы.
Производная квадратичной формы (Π.2) в силу действия уравнения (Π.1)
и уравнений (3.9) и (3.13) имеет вид
V
= 2θT Γ-1 ˙θ + θT Γ-1 θ =
[
]
[
]
= -2θTΓ-1 ΓωωTθ + θT
ωωT - λΓ-1
θ=
=-θTωωTθ- λθTΓ-1 θ =
(Π.3)
(
)(
)T
=- B†refε B†refε
-λθTΓ-1θ ≤
≤-B
2∥ε∥2 - λλmin-1)θ2
ref
88
Производная (Π.3) положительно определенной квадратичной формы
(Π.2) является отрицательной полуопределенной функцией, поэтому пара-
метрическая ошибка естьθ ∈ L и обобщенная ошибка есть ε ∈ L, а урав-
нение (Π.2) является функцией Ляпунова для системы (Π.1). Вместе с этим
функция Ляпунова (Π.2) имеет конечный предел при t → ∞:
(
)
(
)
V
θ(t → ∞) =V
θ(t0) +
Vdt =
t0
(
)
[(
)(
)T
(
)]
=V
θ(t0) -
B†refε B†refε
θTΓ-1 θ dt ⇒
t0
[
2
B
dt =
ref
t0
(
)
(
)
=V
θ(t0) -V
θ(t → ∞) < ∞,
а тогда θ ∈ L2 ∩ L, и ω ∈ L (как результат того, что ε ∈ L2 ∩ L).
Таким образом, первая часть теоремы 1 доказана. Для доказательства вто-
рой части теоремы 1 найдем вторую производную функции Ляпунова (Π.2):
(
)(
)T
(
)
V = -2 B†ref ε B†refε
− λ 2θTΓ-1 ˙θ+ θT Γ-1θ =
(
)(
)T
(
[
]
)
[
]
(Π.4)
= -2 B†ref ε B†refε
− λ 2θT -ωωTθ + θT
ωωT - λΓ-1
θ
=
(
)(
)T
(
)
[
]
θ
= -2 B†ref ε B†refε
+λ 2θTωωTθ-θT
ωωT - λΓ-1
По выражению (Π.4) об ограниченности второй производной функции
˜
ˆ
(Π.2) сделать вывод довольно трудно, поэтому с учетом
θ=
θ найдем произ-
водную обобщенной параметрической ошибки (3.2):
[
]
[
]
˜
(Π.5)
ε=Bref
θTω+θTω =Bref
-ΓωωTθω +θT ω .
С учетом выражения (Π.5) для вычисления перепишем уравнение (Π.4):
[
](
)T
(
)
[
]
θ
V = -2 -ΓωωTθω + θT ˙ω B†refε
+λ 2θTωωTθ-θT
ωωT - λΓ-1
По доказанному имеемθ ∈ L2 ∩ L, ε ∈ L2 ∩ L и ω ∈ L, а по форму-
лировке теоремы 1
ω∈L.Тогда чтобы заключить, чт
V ∈L, остается
доказать L ограниченность матриц Γ и Γ-1. Для этого получим решение
дифференциального уравнения (3.9):
t
Γ-1 (t) = Γ-1 (0) e-λt + e-λ(t-τ)ω (τ)ωT (τ)dτ.
0
89
В случае выполнения условия постоянного возбуждения (2.13) нетрудно
показать, что ∀t ≥ T величина Γ-1 ограничена снизу выражением
t
Γ-1 (t) ≥ e-λ(t-τ)ω (τ)ωT (τ)dτ =
0
(Π.6)
t
= e-λ(t-τ)ω (τ) ωT (τ) dτ + e-λ(t-τ)ω (τ)ωT (τ)dτ.
t-T
0
Теперь по теореме о среднем получим оценки снизу для каждого из двух
интегралов в правой части выражения (Π.6). Для этого перепишем условие
постоянного возбуждения (2.13) в эквивалентном виде
t
(Π.7)
ω (τ)ωT
(τ)dτ ≥ αI.
t-T
Тогда с учетом выражения (Π.7) оценка снизу для первого интеграла имеет
вид
t
t
(Π.8)
e-λ(t-τ)ω (τ) ωT (τ) dτ ≥ e-λT
ω (τ)ωT (τ)dτ ≥ e-λT
αI.
t-T
t-T
Аналогично получим оценку снизу для второго интеграла:
(Π.9)
e-λ(t-τ)ω (τ)ωT (τ)dτ ≥ e-λT
ω (τ) ωT
(τ) dτ ≥ 0.
0
0
Складывая (Π.8) и (Π.9), получаем оценку снизу для всей матрицы Γ-1:
(Π.10)
Γ-1 (t) ≥ e-λT
αI.
Теперь получим оценку снизу для матрицы Γ-1 ∀t ≤ T :
(
)
(Π.11)
Γ-1 (t) ≥ Γ-1 (0) e-λT ≥ λmin
Γ-1 (0)
e-λT
I.
Тогда с учетом оценок (Π.10) и (Π.11), нижняя граница матрицы Γ-1 ∀t ≥
≥ 0 имеет вид
{
(
)
}
(Π.12)
Γ-1 (t) ≥ min
λmin
Γ-1 (0)
e-λT
I.
Так как ω ∈ L по доказанному, то для выражения ωωT выполняется
неравенство
(
)
(
)
(Π.13)
λmin
ωωT
≤ ωωT ≤ λmax
ωωT
90
C учетом неравенства (Π.13) получим верхнюю оценку для матрицы Γ-1
t
(
)
Γ-1 (t) ≤ Γ-1 (0) + λmax
ωωT e-λ(t-τ)dτI ≤
(Π.14)
0
(
)
(
)
λmax
ωωT
≤λmax
Γ-1 (0)
I+
I.
λ
Объединяя выражения (Π.12) и (Π.14), получим неравенства для Γ и Γ-1:
{
}
(
)
min λmin
Γ-1 (0)
,α e-λTI ≤ Γ-1 (t) ≤
(
)
T
(
)
λmax
ωω
≤λmax
Γ-1 (0)
I+
I,
λ
(Π.15)
(
(
))-1
(
)
λmax
ωωT
λmax
Γ-1 (0)
+
I ≤ Γ(t) ≤
λ
{
}
(
)
≤ max λ-1min
Γ-1 (0)
-1 eλT I.
Из выражений (Π.15) ясно следует Γ ∈ L, Γ-1 ∈ L, а значит,
V ∈L.
Тогда производная (Π.3) функции Ляпунова (Π.2) равномерно непрерывна и
по лемме Барбалата
V
→ 0. Соответственно достигается сходимостьθ → 0
при t → ∞.
Чтобы определить оценку скорости сходимости ошибкиθ к нулю, получим
с учетом неравенства (Π.13) верхнюю оценку производной (Π.3):
(
)
(Π.16)
V
= -θTωωTθ- λθTΓ-1 θ ≤ -λmin
ωωT
θ
2 - λλmin -1)θ2.
Для дальнейшего определения минимальной скорости сходимости перей-
дем от полученной оценки матрицы Γ-1 снизу и сверху (Π.15) к выражению
для оценки снизу и сверху еe нормы
[
]
{
(
)
}
Γ-1
≥
n + 1 min
λmin
Γ-1 (0)
e-λT
,
|
{z
}
λmin-1)
[
(
)]
(Π.17)
(
)
λmax
ωωT
≤
Γ-1
n+1 λmax
Γ-1 (0)
+
λ
|
{z
}
λmax-1)
С учетом выражения (Π.17) перепишем верхнюю оценку (Π.16)
[
]
(
)
{
(
)
}
V
≤ -λmin
ωωT
θ2 - λ√n + 1
min
λmin
Γ-1 (0)
e-λT
θ2
[
(
)
]]
-λT
λλmin
ωωT
2
√n+1[min{λmin-1(0)),α}e
≤-
λmax-1)θ
2
√n + 1 [λλmax-1 (0)) + λmax (ωωT)]
≤ -κV.
91
Решим полученное дифференциальное неравенство, подставив при этом в
левую часть решения нижнюю оценку функции Ляпунова:
(Π.18)
θ
 ≤ λ-1min -1)e-κ·t
V (0).
Из выражения (Π.18) следует, что ошибкаθ экспоненциально сходится к
нулю со скоростью быстрее, чем κ, что и требовалось доказать во второй
части теоремы 1.
Доказательство теоремы 2. Кандидат в функции Ляпунова для
исследования устойчивости замкнутой системы (2.12) может быть выбран в
виде суммы двух квадратичных форм:
V = ξTHξ = eTrefPeref + θTΓ-1θ,
{
}
(Π.19)
H = blockdiag
P Γ-1
,
λmin (H)∥ξ∥2 ≤ V ≤ λmax (H)∥ξ∥2.
Производная квадратичной формы (Π.19) в силу действия уравнения в
отклонениях (2.12) и уравнений контура адаптации (4.1), а также при учете,
˜
ˆ
что
θ=
θ и уравнения (3.3), принимает вид
V
= ėTrefPeref +eTrefref +2θTΓ-
θ+θTΓ-1θ=
[
]
=eTref
ATrefP + PAref
eref + 2eTrefPBref θTω -
[
]T
(Π.20)
-2θTω B†refε + BTrefPeref
TΓ-1θ=
[
]
= -eTrefQeref - 2θTωωTθ+ θT
2ωωT - λΓ-1
θ=
(
)
2
= -eTrefQeref - λθTΓ-1θ ≤ -λmin (Q) ∥eref2 - λλmin
Γ-1
θ
Производная (Π.20) положительно определенной квадратичной формы
(Π.19) является отрицательной полуопределенной функцией, поэтому ошиб-
ка есть ξ ∈ L, а уравнение (Π.19) является функцией Ляпунова для систе-
мы (2.12). Вместе с этим функция Ляпунова (Π.19) имеет конечный предел
при t → ∞:
(
)
V
θ(t → ∞)
=
(
)
(
)
[
(
)]
=V
θ(t0) +
Vdt = V
θ(t0) -
eTref Qeref + λ
θTΓ-1 θ dt ⇒
t0
t0
[
]
(
)
2
λmin (Q) ∥eref2 + λλmin
Γ-1
θ
dt =
t0
(
)
(
)
=V
θ(t0) -V
θ(t → ∞) < ∞,
а тогда ξ ∈ L2 ∩ L и ω ∈ L (как результат того, что eref ∈ L2 ∩ L).
92
Таким образом, первая часть теоремы 2 доказана. Для доказательства
второй части теоремы 2 определим при учете уравнения (3.3) вторую произ-
водную функции Ляпунова (Π.19):
(
)
θT Γ-1 θ+2θTΓ-1˙θ
V = -ėTrefQeref - eTrefref - λ
=
[
]
[
]T
= -2eTref Q Areferef + Bref θTω
+ 2λθTω B†ref ε + BTref P eref
-
(
)
[
]
[
]
−λ
θT
2ωωT - λΓ-1
θ
= -2eTref Q Areferef + Bref θTω +
(
)
+ 2λθTωeTref P Bref + λ2
θTΓ-1 θ
По доказанномуθ ∈ L2 ∩ L, eref ∈ L2 ∩ L и ω ∈ L при выполнении
условия постоянного возбуждения имеем Γ ∈ L, Γ-1 ∈ L (доказательство
аналогично проведенному (Π.6)-(Π.15) при доказательстве теоремы 1), а зна-
чит,
V ∈ L. В этом случае производная (Π.20) функции Ляпунова (Π.19)
равномерно непрерывна и по лемме БарбалатаV → 0, соответственно дости-
гается сходимость ξ → 0 при t → ∞.
Чтобы определить оценку скорости сходимости ошибки ξ к нулю, перепи-
шем верхнюю оценку производной (Π.20):
(
)
-1
λmin (Q)
λλmin
Γ
(
)
V
(Π.21)
≤-
λmax (P) ∥eref2 -
λmax
Γ-1
θ
2.
λmax (P)
λmax-1)
Для дальнейшего определения минимальной скорости сходимости, поль-
зуясь результатами, полученными при доказательстве теоремы 1, запишем
оценку снизу и сверху нормы Γ-1 для закона настройки Γ в контуре адапта-
ции (4.1):
[
]
{
(
)
}
≥
Γ-1
n + 1 min
λmin
Γ-1 (0)
, 2α
e-λT
,
|
{z
}
λmin-1)
[
(
)]
(Π.22)
(
)
max
ωωT
Γ-1≤
n+1 λmax
Γ-1 (0)
+
λ
|
{z
}
λmax-1)
С учетом (Π.22) перепишем верхнюю оценку производной (Π.21)
λmin (Q)
V
≤-
λmax (P)∥eref2 -
λmax (P)
{
(
)
}
λ2min
λ
Γ-1 (0)
, 2α
e-λT
(
)
min
-
λmax
Γ-1
θ
2 ≤ -ηminV,
(Π.23)
λλmax-1 (0)) + 2λmax (ωωT)
{
{
(
)
}
}
-λT
λmin (Q)
λ2min
λmin
Γ-1 (0)
, 2α
e
ηmin = min
;
λmax (P)
λλmax-1 (0)) + 2λmax (ωωT)
93
Решим полученное дифференциальное неравенство, подставив при этом в
левую часть решения нижнюю оценку функции Ляпунова:
(Π.24)
∥ξ∥ ≤ λ-1min (H) emin·t
V (0).
Из мажоранты (Π.24) следует, что ошибка ξ экспоненциально сходится к
нулю со скоростью быстрее, чем ηmin, что и требовалось доказать во второй
части теоремы 2.
Для доказательства третьей части теоремы 2 запишем нижнюю оценку
производной (Π.20):
(
)
λmax (Q)
V
≥-
λmax (P) ∥eref2 - λλmax
Γ-1
θ
2 ≥ -ηmaxV,
λmax (P)
(Π.25)
}
max (Q)
ηmax = max
λmax
(P)
Решим дифференциальное неравенство (Π.25), подставив при этом в левую
часть решения верхнюю оценку функции Ляпунова:
(Π.26)
∥ξ∥ ≥ λmax (H) emax·t
V (0).
Из определения ηmax в (Π.25) и миноранты (Π.26) следует, что при увеличе-
нии коэффициента λ возможно сделать максимальную скорость сходимости
ошибки ξ произвольно большой, что и требовалось доказать в третьей части
теоремы 2.
Замечание. При λ → ∞ максимальная скорость сходимости ηmax → ∞,
но минимальная скорость сходимости ηmin → 0 (поскольку λT → ∞ в (Π.23),
это ведет к существенному увеличению расстояния между мажорантой (Π.24)
и минорантой (Π.26), что, в свою очередь, ведет к колебаниям по ξ. Поэто-
му на практике нецелесообразно использование значений λ, превышающих
λmax = T-1.
СПИСОК ЛИТЕРАТУРЫ
1. Ioannou P., Sun J. Robust Adaptive Control. N.Y.: Dover, 2013.
2. Narendra K.S., Valavani L.S. Direct and indirect model reference adaptive control //
Automatica. 1979. V. 15. No. 6. P. 653-664.
3. Hang C., Parks P.C. Comparative studies of model reference adaptive control sys-
tems // IEEE Trans. Automat. Control. 1973. V. 18. No. 5. P. 419-428.
4. Фрадков А.Л. Адаптивное управление в сложных системах: беспоисковые мето-
ды. М.: Наука, 1990.
5. Wise K.A., Lavretsky E., Hovakimyan N. Adaptive control of flight: theory, applica-
tions, and open problems // Proc. 2006 Amer. Control Conf. 2006. P. 1-6.
6. Ortega R., Nikiforov V., Gerasimov D. On modified parameter estimators for identi-
fication and adaptive control. A unified framework and some new schemes // Annual
Reviews in Control. 2020. P. 1-16.
94
7. Narendra K.S., Annaswamy A.M. Stable adaptive systems. N.J.: Prentice Hall, 1989.
8. Sastry S., Bodson M. Adaptive Control - Stability, Convergence, and Robustness.
N.J.: Prentice Hall, 1989.
9. Ioannou P., Kokotovic P. Instability analysis and improvement of robustness of adap-
tive control // Automatica. 1984. V. 20. No. 5. P. 583-594.
10. Khalil H.K., Grizzle J. W. Nonlinear systems. N.J.: Prentice-Hall, 2002.
11. Schatz S.P., Yucelen T., Gruenwal B., Holzapfe F. Application of a novel scalability
notion in adaptive control to various adaptive control frameworks // AIAA Guidance,
Navigation, and Control Conf. 2015. P. 1-17.
12. Jaramillo J., Yucelen T., Wilcher K. Scalability In Model Reference Adaptive Con-
trol // AIAA Scitech 2020 Forum. 2020. P. 1-13.
13. Glushchenko A., Petrov V., Lastochkin K. Development of Balancing Robot Control
System on the Basis of the Second Lyapunov Method with Setpoint-Adaptive Step
Size // Proc. 21th Int. Conf. Complex Systems: Control and Modeling Problems
(CSCMP). 2019. P. 1-6.
14. Narendra K.S., Annaswamy A.M. Persistent excitation in adaptive systems // Int.
J. Control. 1987. V. 45. No. 1. P. 127-160.
15. Kumar K.A., Bhasin S. Data driven MRAC with parameter convergence // IEEE
Conf. Control Applications (CCA). 2015. P. 1662-1667.
16. Chowdhary G., Muhlegg M., Johnson E. Exponential parameter and tracking error
convergence guarantees for adaptive controllers without persistency of excitation //
Int. J. Control. 2014. Vol. 87. No. 8. P. 1583-1603.
17. Narendra K.S., Kudva P. Stable adaptive schemes for system identification and
control-Part I // IEEE Trans. Systems, Man, and Cybernetics. 1974. Vol.
6.
P. 542-551.
Статья представлена к публикации членом редколлегии М.В. Хлебниковым.
Поступила в редакцию 23.07.2020
После доработки 09.10.2020
Принята к публикации 08.12.2020
95