Метод динамического программирования
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Для получения уравнения Беллмана и формулировки теоремы, являющейся сущностью метода динамического программирования автором данной теории были выдвинуты следующие гипотезы.

Гипотеза 1.1. Какова бы ни была отличная от x1 точка x фазового пространства, существует оптимальный (в смысле быстродействия) процесс перехода из точки x в точку x1.

Время, в течение которого осуществляется оптимальный переход из точки x в точку x1, обозначим через Т(х). И пусть

w( x) = — T( x).

Гипотеза 1.2. Функция w( x) непрерывна и всюду, кроме точки x1, имеет непрерывные частные производные

 

 

На основе этих гипотез была сформулирована и доказана теорема 1.1.

Теорема 1.1. Если для управляемого объекта, описываемого уравнением , и предписанного конечного состояния x1 выполнены гипотезы 1 и 2, то имеют место соотношения (1.3) и (1.4) (оптимальность понимается в смысле быстродействия).

 

 для всех точек x ¹ x1 и u,

                                                           (1.3)

 

для любого оптимального процесса ( u( t), x( t)).                         (1.4)


 

Эта теорема и составляет сущность метода динамического программирования.

Метод динамического программирования (1.3), (1.4) содержит некоторую информацию об оптимальных процессах и потому может быть использован для их разыскания. Однако он имеет ряд неудобств. Во-первых, применение этого метода требует нахождения не только оптимальных управлений, но и функции w( x) так как эта функция входит в соотношения (1.3), (1.4). Во-вторых, уравнение Беллмана представляет собой уравнение в частных производных относительно функции w. Указанные обстоятельства сильно затрудняют возможность пользования методом динамического программирования для отыскания оптимальных процессов в конкретных примерах. Но самым главным недостатком этого метода является предположение о выполнении гипотез 1.1 и 1.2. Ведь оптимальные управления и функция w заранее неизвестны, так что гипотезы 1.1 и 1.2 содержат предположение о неизвестной функции, и проверить выполнение этих гипотез по уравнениям движения объекта невозможно.

Далее кратко излагается сущность принципа максимума, который является значительно более удобным средством для отыскания оптимальных процессов, чем метод динамического программирования.

 


Принцип максимума

Гипотеза 1.3. Функция w( x) имеет при x ¹ x1 вторые непрерывные производные , а функции  — первые непрерывные производные .

Теорема 1.2. Предположим, что для рассматриваемого управляемого объекта, описываемого уравнением


 

                                                                             (1.5)

 

И предписанного конечного состояния x1 выполнены гипотезы 1.1, 1.2 и 1.3. Пусть , — некоторый процесс, переводящий объект из начального состояния x0 в состояние x1. Введем в рассмотрение функцию H, зависящую от переменных  и некоторых вспомогательных переменных

 

........................................................................ (1.6)

 

С помощью этой функции H запишем следующую систему дифференциальных уравнений для вспомогательных переменных:

 

                                                       (1.7)

 

Тогда, если процесс  является оптимальным, то существует такое нетривиальное решение , системы (1.7), что для любого момента t, , выполнено условие максимума

 

                                          (1.8)

 

и условие

 


 

Эта теорема значительно удобнее для отыскания оптимальных процессов, чем метод динамического программирования. Однако в приведенной здесь форме принцип максимума страдает тем же недостатком, что и метод динамического программирования: он выведен в предположении дифференцируемости (и даже двукратной) функции w( x), а эта функция, как уже отмечалось, в действительности не является всюду дифференцируемой.

Однако принцип максимума доставляет достаточную информацию для решения поставленной задаче оптимального управления.

Благодаря работам Р.В. Гамкрелидзе, принцип максимума был доказан для линейных систем. Им были доказаны теоремы существования, единственности и теорема о числе переключений.

В данном случае функция Н принимает вид

 

                                                                          (1.9)

 

Выражение (1.7) в векторной форме записывается в виде

 

                                                                                 (1.10)

 

а соотношение (1.8) принимает в данном случае вид

 

                                                          (1.11)

 

Теорема 1.3 (теорема существования). Область управляемости является выпуклым открытым множеством фазового пространства Х; для любой точки х0, принадлежащей области управляемости, существует оптимальное управление, переводящее точку х0 в начало координат.

Примечание: Множество G называется открытым, если для каждой его точки можно найти шар с центром в этой точке, целиком принадлежащий множеству G, иначе говоря, множество G открыто, если к нему не причисляется ни одна точка его границы.

Областью управляемости объекта называется множество всех тех точек х0 фазового пространства X, из которых возможно при помощи какого-либо допустимого управления попасть в начало координат. Само начало координат тоже причисляется к области управляемости.

Теорема 1.4 (теорема о числе переключений). Для каждого нетривиального решения y(t) уравнения (1.10) соотношение (1.11) однозначно определяет допустимое управление u(t); при этом оказывается, что функция u(t) кусочно-постоянна и ее значениями являются лишь вершины многогранника U.

Таким образом, функция u( t) кусочно-постоянна, принимает значения в вершинах многогранника U и определена однозначно. Каждую точку разрыва оптимального управления называют точкой переключения.

В общем случае число переключений хотя и конечно, но может быть произвольным. Однако существует один важный для приложений случай, когда число переключений допускает точную оценку. Этот случай рассматривается в теореме принадлежащей А.А. Фельдбауму. В этой теореме говорится (упрощенно), что каждая из функций  кусочно-постоянна и имеет не более n—1 переключений (т.е. не более n интервалов постоянства), где n — порядок системы.

Таким образом, принцип максимума является наиболее удобным для решения задачи об оптимальном быстродействии.

 



Программное управление

 

Сегодня оборудование с программным управлением распространено весьма широко, начиная от компаний, входящих в TOP 500 Fortune в больших промышленных зонах, и заканчивая малыми предприятиями частного бизнеса. Действительно весьма трудно найти ту область машиностроения, где еще не используются уникальные возможности этого оборудования. Поэтому каждый специалист в области машиностроения должен хорошо представлять то, что дает производству применение этого весьма интеллектуального оборудования.

Программное управление технологическим оборудованием и процессами охватывает управление движением машин, механизмов, транспортных средств и изменением физических и химических параметров технологического процесса.

Программное управление — это управление режимом работы или состоянием объекта по заранее заданной программе. При автоматическом программном управлении технологическим оборудованием, соответствующая алгоритму программа записывается в память управляющего устройства с последующим автоматическим считыванием и преобразованием в управляющие сигналы.

Программное управление может быть реализовано на различных классах вычислительных машин, начиная от микроЭВМ и заканчивая мощными вычислительными системами. Каждый из этих классов накладывает на алгоритмы некоторые ограничения, которые необходимо учитывать при разработке алгоритмического обеспечения.

Разрабатываемый алгоритм ориентируется для использования в микроконтроллерах, что накладывает особые ограничения на полученный алгоритм.

Необходимо отметить, что микроконтроллеры выполняют операции для дискретного времени и дискретных величин. Вычисления осуществляются с конечной точностью и за конечное время.

Следует также учитывать тот факт, что микроконтроллеры не вычисляют точных значений интегралов и производных, но могут оценивать их значения в конечных разностях, т.е. с помощью численных методов.

Еще одним из важнейших условий, необходимым для успешной практической реализации, является необходимость учитывать отношение стоимости и мощности микроконтроллеров, которые будут использоваться в производстве.

Таким образом, после определения алгоритма оптимального управления для его реализации на реальном микроконтроллере необходимо выполнить оптимизацию по количеству операций, необходимых для проводимых вычислений, а также выполнить оценку точности вычислений. Оценка точности вычислений налагает ограничения на разрядность используемых микроконтроллеров, что в свою очередь сказывается на стоимости устройства в целом. Поэтому, изначально, алгоритм должен ориентироваться на элементарные операции сложения и вычитания, а также логические операции при переключении режимов.

При наличии сложных функциональных зависимостей, необходимо выполнить оценку их табулируемости для обеспечения высокого быстродействия работы алгоритма.

 

Дата: 2019-07-24, просмотров: 223.