ОБ УПРАВЛЕНИИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Мир собирается объявить бесполётную зону в нашей Vselennoy! | Президенту Путину о создании Института Истории Русского Народа. |Нас посетило 40 млн. человек | Чем занимались русские 4000 лет назад? | Кому давать гранты или сколько в России молодых ученых?

Статьи Соросовского Образовательного журнала в текстовом формате

ОБ УПРАВЛЕНИИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ (БРУСИН В.А. , 1996), МАТЕМАТИКА

Цель статьи - дать представление об актуальной научной проблеме, методе ее решения, используя простой пример - задачу стабилизации обращенного маятника, находящегося под действием параметрически неопределенного возмущения. Используемый математический аппарат опирается только на элементарные сведения из области дифференциальных уравнений.

ОБ УПРАВЛЕНИИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

В. А. БРУСИН

Нижегородская государственная

архитектурно- строительная академия

ВВЕДЕНИЕ

Цель настоящей статьи - дать представление об актуальной научной проблеме, относящейся к той области математических наук, которую в настоящее время принято называть теорией управления.

Начало использования математических методов в задачах автоматического регулирования связано с именами Д.К. Максвелла и И.А. Вышнеградского. Математический аппарат для будущей теории управления создавали такие математики, как А. Пуанкаре и А.М. Ляпунов. Теория управления создавалась несколькими поколениями ученых. Основополагающие вклады в теорию в середине нашего столетия были сделаны А.А. Андроновым и его учениками (в первую очередь Н.Н. Баутиным, Ю.И. Неймарком из Горьковской школы А.А. Андронова), А.И. Лурье; М.А. Айзерманом, Я.З. Цыпкиным, имевшими связь со школой А.А. Андронова, Б.Н. Петровым и его школой и рядом других ученых. На новый математический уровень эта теория поднялась в конце 50-х - начале 60-х годов благодаря трудам Л.С. Понтрягина, Р. Калмана и Р. Беллмана. Значительный вклад в развитие теории управления в последнее время был сделан Н.Н. Красовским, С.В. Емельяновым, Ф.Л. Черноусько и В.А. Якубовичем.

В настоящее время число проблем теории управления значительно выросло: в той же мере, в какой расширилась сфера использования ее результатов. Сместились и приоритеты в ее проблемах. Главным моментом в постановке задач современной теории управления становится отражение дефицита информации об управляемой системе, различных неопределенностей в ее математическом описании. Появились и новые разделы: теория адаптивного управления и в последнее время теория "робастного" управления (robust control).

Ниже рассматривается пример (имеющий и самостоятельный интерес) задачи управления в условиях неопределенности (адаптивного управления) и один из методов ее решения, использующий лишь элементарные сведения из математического анализа.

МАТЕМАТИЧЕСКИЙ МАЯТНИК КАК ОБЪЕКТ УПРАВЛЕНИЯ

Рассмотрим движение математического маятника [1, 2] под действием внешнего момента f (t), зависящего от времени t. Обозначим: m - масса маятника, l - длина стержня (предполагаемого абсолютно твердым и невесомым), соединяющего точечную массу с точкой подвеса О, x - угол между вертикалью и стержнем, отсчитываемый от вертикали против часовой стрелки, так, что в положении 1 величина x имеет положительное значение, а в положении 2 - отрицательное (рис. 1). Применение закона Ньютона приводит к уравнению движения маятника вида [1, 2]

где точка над x означает производную x по t, а - вторая производная x по t, выражающая мгновенное угловое ускорение маятника в момент t [3]; g - ускорение силы тяжести.

Если принять предположение о "малости" отклонений маятника относительно вертикали, при которых sin x приближенно можно заменить на x (здесь углы измеряются в радианах), то мы приходим к так называемой линейной модели [1] движения маятника

С точки зрения общей теории дифференциальных уравнений (ДУ) [3, 4] уравнение (2) будет относиться к классу линейных (в отличие от (1)) неоднородных ДУ второго порядка, в котором f (t) называется неоднородным членом.

В дальнейшем мы будем рассматривать "обращенный" математический маятник (рис. 2). В "обращенном" маятнике масса m располагается выше точки крепления стержня О, а угол x отсчитывается от верхнего вертикального положения массы по направлению часовой стрелки. (Так, в положении 1 значение x положительно, а в положении 2 отрицательно.) Уравнение движения обращенного маятника будет иметь вид, отличающийся от уравнения (1) знаком одного слагаемого:

Линейная модель обращенного маятника, описывающая его движение при малых отклонениях от вертикали, имеет вид

Мы будем иметь дело только с функциями f (x), непрерывными по t. В этом случае теория ДУ [3, 4] дает следующий результат. Если задать начальные условия

где t0 - фиксированное значение переменной t ; - произвольно выбранные числа (начальные данные), то решение x(t) приведенных выше дифференциальных уравнений при t > t0 будет однозначно определяться значениями f (t) при t > t0 . Учитывая физическую интерпретацию этих уравнений, то же самое можно сказать и так: если в некоторый момент времени t0 заданы положение маятника и его скорость, то дальнейшее его движение будет полностью определяться будущими значениями внешнего воздействия.

Этот очевидный с физической точки зрения факт позволяет отразить причинно-следственные отношения в рассматриваемых примерах в виде диаграммы воздействий, или структурной модели (рис. 3). На языке этих диаграмм функцию f (t) (причина) называют входным процессом системы (или просто входом), а функцию x(t) (следствие) - выходным процессом (или выходом). Начальные данные () на языке общей теории систем [5] называют состоянием системы в момент t = t0 . Состояние можно интерпретировать и как двумерный вектор z 0 с координатами или же как точку на плоскости с координатами . Понятие состояния системы можно определить как вектор z(t) с координатами .

ФОРМУЛИРОВКА ЗАДАЧИ УПРАВЛЕНИЯ

Поставим для обращенного маятника задачу стабилизации в верхнем положении. При этом возможны две принципиально разные формулировки этой задачи, которые мы условно назовем задачей П ("программа") и задачей Р ("регулятор").

Задача П. Требуется найти функцию f (t), непрерывную при t $ t0 , при которой для всех решений x(t) уравнения (3) (или (4)) будет справедливо соотношение (называемое целью управления) вида

Задачи управления, относящиеся к этому типу, называют обычно задачами программного управления [6, 7]. Функцию f (t), подлежащую определению в этих задачах, называют управлением.

Для формулировки задачи Р вначале требуется ввести понятие "измеряемый выход". Это набор величин, зависящих от t, связанных с текущим положением объекта управления (маятника в данном конкретном примере), которые предполагаются измеряемыми в каждый момент времени. В нашем примере это может быть величина x(t) (рис. 3) или пара (), или некоторая функция вектора состояния . В общем случае структурная модель объекта может быть такой, как представлено на рисунке 4. Отметим, что вектор y (t) может в частном случае "полного измерения" совпадать с текущим состоянием объекта z(t). В сложных объектах вектор y, как правило, имеет существенно меньшую размерность, чем вектор состояния z, размерность которого, как мы упоминали, определяется количеством начальных данных.

После этих вводных замечаний сформулируем задачу Р.

Задача Р. Требуется найти закон генерации значений f (t) (или алгоритм) в виде функции или оператора от текущих или предшествующих значений измеряемого выхода, условно, в виде соотношения

f (t) = F (y (t), t # t),

при котором выполнялась бы цель управления (6) для всех решений уравнения (3) (или (4)) при условии (7).

Задачи управления, относящиеся к данному типу, называют задачами о регуляторе. Регулятором с математической точки зрения является зависимость, связывающая "управление" f (t) с "измерениями" y (t). (Мы не касаемся здесь понятия регулятора как физического устройства, реализующего эту зависимость. Отметим только, что в настоящее время эту функцию чаще всего перекладывают на компьютеры.) Закон управления F, в свою очередь (как мы увидим ниже), может описываться системой из дифференциальных уравнений, в процессе решения которых определяется текущее значение управления.

Сегодня задача Р является основной задачей теории управления.

Используя язык диаграмм воздействий, структурную модель регулятора можно представить в таком виде (рис. 5). Объединяя диаграммы из рисунков 4 и 5, мы приходим к структурной модели системы объект управления-регулятор (ОУ-Р), изображенной на рисунке 6. Мы видим, что в результате получается замкнутая цепочка воздействий: воздействие от управления f (t) к измеряемому выходу y (t) через объект управления называют прямой связью, а от y (t) к f (t) через регулятор - обратной связью. Систему ОУ-Р, в нашем случае описываемую уравнениями (3), (7) (или (4), (7)), в теории управления называют замкнутой системой.

РЕШЕНИЕ ЗАДАЧИ Р ДЛЯ ЛИНЕЙНОЙ МОДЕЛИ ОБРАЩЕННОГО МАЯТНИКА

Самым простым решением задачи Р для линейной модели обращенного маятника является выбор зависимости F в виде линейной функции от координат измеряемого выхода. Такой регулятор называют линейным регулятором. Положим (то есть мы предполагаем, что в каждый момент измеряются положение маятника и его скорость). Тогда положим

где k1 , k2 - коэффициенты, или параметры, регулятора, подлежащие дальнейшему определению.

Подставляя равенство (8) в уравнение (4), мы приходим к дифференциальному уравнению замкнутой системы

В отличие от исходного уравнения (4) дифференциальное уравнение (9) является однородным [4]. Хорошо известно, как находить решения такого уравнения [4]. Но в данном случае вид решения нам не нужен. Решение задачи Р свелось к решению задачи о выборе коэффициентов k1 , k2 , при которых все решения дифференциального уравнения (9) будут удовлетворять условию (6). Из теории линейных дифференциальных уравнений [4] известно, что последняя задача эквивалентна задаче об устойчивости характеристического многочлена P(l) для уравнения (9)

P(l) = ml 2l2 + k2l + (k1 - mgl).

(Поясним: многочлен называют устойчивым, если все его корни как комплексные числа имеют отрицательную действительную часть [4].) Существует критерий Рауса-Гурвица, который решает задачу об устойчивости произвольного многочлена по его коэффициентам. Для многочленов второй степени он сводится к одному условию: чтобы все коэффициенты имели один и тот же знак - плюс или минус. В приложении к многочлену (10) с учетом физического смысла входящих в него величин это условие принимает вид

k2 > 0, k1 > mgl > 0.

Итак, для того чтобы регулятор (8) решал поставленную задачу стабилизации, необходимо и достаточно, чтобы его коэффициенты удовлетворяли неравенствам (11).

Зная решение задачи Р, мы обнаруживаем, что для выбора параметров регулятора мы должны иметь информацию о параметрах объекта управления, в данном случае о его массе и длине. Мы видим, что использовать один и тот же регулятор для различных маятников "вслепую" нельзя, можно оказаться в ситуации, когда второе неравенство не будет выполнено.

ПОСТАНОВКА ЗАДАЧИ О РЕГУЛЯТОРЕ

В УСЛОВИЯХ НЕПОЛНОЙ ИНФОРМАЦИИ

Чтобы сделать более явной возникающую новую проблему, рассмотрим задачу стабилизации линейной модели обращенного маятника в более общей постановке. Предположим, что внешнее воздействие f (t) на маятник складывается из двух частей: управления u(t), которое можно генерировать по различным законам, и возмущения h(t), не подвластного нашему влиянию,

f (t) = u(t) + h(t).

Предположим также, что возмущение может быть достаточно точно описано линейной комбинацией [4] некоторых n "базисных" функций hi(t) с коэффициентами ai , то есть

Цель управления по-прежнему будет состоять в выполнении асимптотического соотношения (6). Будем "конструировать" управление также из двух частей:

где - составляющая управления, которая стабилизирует маятник при отсутствии возмущения (для этого, как мы видели, нужно выполнение условия (11)), а Du(t) - составляющая, призванная "компенсировать" возмущение h(t). Подставляя равенства (14) в уравнение (4), мы убеждаемся, что для выполнения соотношения (6) необходимо и достаточно, чтобы имело место равенство

Таким образом, решать поставленную задачу будет регулятор, описываемый уравнениями (14), (15) при условии (11), причем для замкнутой системы по-прежнему будет справедливо дифференциальное уравнение (9).

К сожалению, такой "хороший" регулятор имеет один, но очень важный изъян: он требует точного знания коэффициентов разложения возмущения по выбранным нами базисным функциям. (Обычно это синусы и косинусы различных периодов.) Использовать такой регулятор в реальных условиях, не зная заранее этих коэффициентов и к тому же не зная параметров самого маятника, было бы рискованно.

Поэтому мы поставим более сложную задачу управления, которую условно назовем задачей АР (задача об адаптивном регуляторе).

Задача АР. Обозначим через g набор параметров, входящих в математическое описание объекта управления и действующих на него возмущений. Пусть известно множество G, к которому принадлежит данный набор g. Требуется найти закон генерации управления u(t), не зависящий от конкретных значений параметров, входящих в набор g, а использующий лишь соотношение g ? G,

u(t) = FG (y (t), t # t),

при котором выполнялась бы цель управления (6) для всех решений уравнения (4) при условиях (11), (12) и (16). Отличие задачи Р от задачи АР можно отразить на структурных моделях рисунков 7а и 7б (рисунок 7а относится к задаче Р, а 7б - к задаче АР).

Для рассматриваемого нами примера g представляет собой набор физических параметров маятника m, l и набор коэффициентов ai , i = 1, _, n, разложения (13). Можно также представить g как (n + 2)-мерный вектор (m, l; a1 , _, an). Множество G определим исходя исключительно из физических ограничений на параметры: m > 0, l > 0. Таким образом, требуется найти один регулятор для всех маятников и возмущений вида (13).

Как подойти к решению задачи и существует ли оно вообще? Первое, что приходит на ум (это и было исторически первым подходом к решению), - идентифицировать набор g, то есть получить с помощью соответствующего алгоритма достаточно точную его оценку . Имея такую оценку, мы можем воспользоваться регулятором задачи Р, заменив в нем истинные значения параметров на их оценки. Построенные таким путем регуляторы получили название адаптивных регуляторов непрямого действия. Однако для нашей задачи о стабилизации маятника этот путь, очевидно, неприемлем, ибо пока будет получена приемлемая по точности оценка , пройдет время (неизвестно какой длительности) и маятник "опрокинется".

Второй путь решения задачи АР наметился, когда этой проблемой занялись специалисты, владеющие математическими методами нелинейной теории устойчивости решений дифференциальных уравнений [4, 7, 8]. Оказалось, что можно создать закон управления, в котором и поиск оценок, и выработка управляющего сигнала шли бы параллельно и не были бы разделены во времени. Более того, оказалось, что в такого рода законе управления идентификации параметров может и не происходить, тогда как цель управления достигается. Мы не имеем возможности приводить все используемые при решении задачи АР математические методы. Остановимся на одном (и только в применении к нашему сравнительно простому примеру), в разработке которого принимал участие автор.

РЕШЕНИЕ ЗАДАЧИ АР ДЛЯ ЛИНЕЙНОЙ МОДЕЛИ ОБРАЩЕННОГО МАЯТНИКА

Начнем издалека. Рассмотрим систему из N + 1 дифференциального уравнения (N - некоторое натуральное число)

где fi(t) - заданные непрерывные функции, - набор решений этой системы, коэффициенты a, r, ri - произвольные положительные числа. Эта система обладает любопытными свойствами.

Теорема. При любых функциях fi для набора решений системы справедливы следующие соотношения:

а) функции равномерно ограничены при всех t > 0, то есть их абсолютные значения не могут превзойти некоторых констант:

б) площадь между графиком функции z 2(t), t $ 0, и осью абсцисс t конечна:

"Любопытность" перечисленных свойств состоит в том, что они справедливы при любом задании функций fi(t). Несложное доказательство этой теоремы, опирающееся на известные формулы математического анализа [3], приводится в приложении 1.

Теперь вернемся к уравнению, описывающему движение объекта управления в нашей задаче. Как следует из (4), (12), (13), оно имеет вид

Поставим целью свести это уравнение к виду, который имеет первое уравнение системы (17), подобрав соответствующим образом переменную z(t), а затем и управление u(t). В качестве величины z(t) примем

с произвольно выбранным положительным коэффициентом r. Это позволит понизить порядок уравнения (20) до единицы. Далее произвольно выберем положительное число b > 0 и положим a := ml 2 > 0. Тогда с помощью элементарных алгебраических преобразований с учетом всех этих обозначений уравнение (20) приводится к виду

Если ввести обозначения

li := ai , i = 1, _, n;

ln + 1 := (ar + b), ln + 2 := (mgl + br),

fi (t) := hi (t), i = 1, _, n;

то уравнение (22) примет вид

Теперь, когда мы знаем теорему, становится ясным и очевидным выбор закона управления. Полагаем

где переменные получаются путем интегрирования дифференциальных уравнений

(Начальные условия для интегрирования уравнений (27) могут быть взяты произвольными.)

Закон управления (26), (27) с учетом обозначений (21) и (24) и будет решать поставленную задачу. Действительно, если положить , то мы видим, что для z(t), будут справедливы уравнения (17) и, как следует из теоремы, соотношения (18), (19), в которых . Отсюда будет вытекать и соотношение (6). (Доказательство этого факта приведено в Приложении 2.)

Итак, мы видим, что зависимость F : y (t) u(t), осуществляемая полученным регулятором на основе уравнений (21), (24), (26), (27) (где ), не зависит от конкретных значений параметров маятника и коэффициентов, определяющих возмущение.

Обратим внимание еще на одно обстоятельство. Мы видели, что для полученного выше закона управления не существенно, какие значения имеют параметры маятника и коэффициенты, определяющие возмущение. Однако мы не вправе давать этим коэффициентам большие по модулю значения. Не следует забывать, что для обращенного маятника уравнение (4) является линейной моделью. При больших же возмущениях полученные на основе этой модели регуляторы не смогут удержать маятник в диапазоне тех углов, для которых приемлема такая модель. Вместе с тем используемый здесь метод может быть применен и к нелинейным моделям. Так, в работе [9] этим же методом была решена задача о стабилизации двухмассовой системы "обращенный маятник на управляемой тележке" в условиях неполной информации и без предположения о малости каких-либо величин.

ЗАКЛЮЧЕНИЕ

Мы не могли рассказать обо всех задачах и проблемах теории управления в условиях неопределенности, тем более что эти задачи постоянно обновляются. Вместе с новыми задачами развивается и математический аппарат этой теории. Мы полагаем, что рассмотренная задача позволит расширить и углубить представления учащихся о приложениях математического анализа, которые обычно приводятся в средней и высшей школах.

Содержание статьи иллюстрирует важное положение современной теории управления: оперативно управлять можно и не имея a priori точного математического описания динамики. Это положение дает возможность ставить и решать задачи управления движением тел и конструкций в средах, в которых волны и потоки вносят существенную неопределенность в математическое описание движения.

ПРИЛОЖЕНИЕ 1

Умножим обе части первого уравнения из (17) на z (t) и проинтегрируем их по t в пределах от t = 0 до t = T, где T > 0 - произвольно выбранное значение. Тогда получим равенство

Подставляя вместо произведения fi z его выражение из остальных равенств системы (17) и используя в полученных интегралах формулу Ньютона-Лейбница [3], приходим к соотношению

Из этого соотношения при стремлении значения T к бесконечности вытекают соотношения (18), (19).

ПРИЛОЖЕНИЕ 2

Посмотрим на соотношение (21) как на линейное неоднородное дифференциальное уравнение относительно x(t) с неоднородным членом z(t). Такого рода уравнения при r > 0 обладают следующими свойствами, вытекающими из представления решения по формуле Коши [4]: из равномерной ограниченности неоднородного члена следует равномерная ограниченность решений, а из условия (19) следует аналогичное соотношение для x(t). Таким образом, из (18), (19), с учетом неравенства , будет следовать

А из этих двух соотношений уже будет следовать [3, 9] существование нулевого предела для x(t), то есть (6).

ЛИТЕРАТУРА

1. Андронов А.А., Витт А.А., Хайкин С.Э. Теория колебаний. М.: Наука, 1981.

2. Бутенин Н.В., Лунц Я.Л., Меркин Д.Р. Курс теоретической механики. М.: Наука, 1971. Т. 2.

3. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления. М.: Наука, 1966.

4. Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1974.

5. Калман Р., Фалб П., Арбиб М. Очерки по математической теории систем. М.: Мир, 1971.

6. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969.

7. Красовский Н.Н. Теория управления движением. М.: Наука, 1968.

8. Попов В.М. Гиперустойчивость автоматических систем. М.: Наука, 1970.

9. Брусин В.А. Известия РАН. Техническая кибернетика. 1993. ╧ 3. С. 30.

* * *

Владимир Александрович Брусин, доктор физико-математических наук, профессор, зав. кафедрой высшей математики Нижегородской государственной архитектурно-строительной академии. Область научных интересов: математические проблемы теории устойчивости и теории управления. Автор около 180 научных работ и одного учебного пособия.