Главная страница Случайная лекция Мы поможем в написании ваших работ! Порталы: БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика Мы поможем в написании ваших работ! |
Принцип оптимальности и уравнения Беллмана
Принцип оптимальности по Беллману означает: каково бы ни было состояние системы, полученное в результате какого-либо числа шагов, на ближайшем шаге нужно выбрать управление так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный. Принцип оптимальности утверждает, что для любого процесса без обратной связи оптимальное управление таково, что оно является оптимальным для любого подпроцесса по отношению к исходному состоянию этого подпроцесса. Поэтому решение на каждом шаге оказывается наилучшим с точки зрения управления в целом. Графически этот процесс выглядит следующим образом: - условно оптимальный выигрыш на n-м шаге или условный МАХ целевой функции
-n-й шаг fn-1(Sn-2,Xn-1)– значение целевой функции на n-1м шаге Рис. 23. Вид процесса без обратной связи
На этом рисунке: Sn-2 – состояние системы к началу n-1 шага, Xn-1 – управление на n-1 шаге, Xn*(Sn-1) – условное оптимальное управление на n-ом шаге. Рассмотрим n-ый шаг: Sn-1 – состояние системы к началу n-го шага, Sn=S^ - конечное состояние системы, Xn – управление на n-ом шаге, fn (Sn-1,Xn) – целевая функция (выигрыш) n-го шага. Согласно принципу оптимальности Xn нужно выбрать так, чтобы для любых состояний Sn-1 получить максимум целевой функции на этом шаге, тогда, (16) уравнение Беллмана для одномерной задачи оптимизации, т.е. Zn* и есть условный максимум целевой функции на n-ом шаге. Максимизация ведется по всем допустимым управлениям Xn. Решение Xn, при котором достигается Zn* (Sn-1), также зависит от Sn-1 и называется условным оптимальным управлением на n-ом шаге и обозначается через Xn*(Sn-1). Решив одномерную задачу локальной оптимизации по уравнению (*), можно найти для всех возможных состояний (Sn-1) две функции: Zn* (Sn-1) и Xn*(Sn-1) целевую и управления соответственно. Рассмотрим теперь двухшаговую задачу, для чего к n-му шагу присоединим n-1 шаг. Тогда по определению для любых состояний Sn-2, произвольных управлений Xn-1 и оптимальном управлении на n-ом шаге значение целевой функции на двух последних шагах равно: fn-1(Sn-2,Xn-1) + Zn*(Sn-1) (17) В соответствии с принципом оптимальности решение нужно выбирать так, чтобы оно вместе с оптимальным управлением на последнем n-ом шаге приводило бы к максимуму целевой функции на двух последних шагах. Нужно найти max выражения (1) по всем допустимым управлениям на (n-1) шаге. (18) Это и есть уравнение оптимальности для двухшагового управления. В общем виде уравнение Беллмана выглядит так: , (19) где - условный максимум целевой функции при оптимальном управлении на k-м шаге k=n-1, n-2,…, 2, 1 - условное оптимальное управление на k-м шаге Таким образом, в результате условной оптимизации получаются две последовательности: Zn* (Sn-1), Zn-2*(Sn-2),…, Z2*(S1), Z1*(S0) – условные максимумы целевой функции на последнем, на двух последних, на n шагах и Xn*(Sn-1), Xn-1*(Sn-2),…, X2*(S1), X1*(S0) – условные оптимальные управления на n-м, n-1-м,…, втором и первом шагах. Использование перечисленных методов математического программирования позволяет и оптимально отнестись к планированию деятельности организации.
Дата добавления: 2015-07-26; просмотров: 154; Нарушение авторских прав Мы поможем в написании ваших работ! |