Главная > Марковские процессы принятия решений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

1.6. Примеры

В этом разделе приводятся два численных примера и их решения с помощью итерационного алгоритма нахождения стратегий и алгоритма линейного программирования.

1. Описание примера дано во введении. Пусть где Тогда

где соответствует политике ускоренного ремонта, обычного ремонта. Решим задачу в предположении, что коэффициент переоценки

Сначала применим итерационный алгоритм. Выберем в качестве начальной политики процедуры определения весов имеем

Используя эти значения и процедуру улучшения решения, получим

откуда в качестве улучшенной получаем политику Применяя вновь процедуру определения весов, найдем

которые задают -оптимальную политику для

Теперь воспользуемся алгоритмом линейного программирования. При начальном распределении

получаем следующую задачу линейного программирования:

при ограничениях

для которой оптимальное решение имеет вид

а целевая функция равна при этом 910/73. Значение целевой функции совпадает с

2. Задача водителя такси (см. [63]). Рассмотрим задачу водителя такси, в район обслуживания которого включены три города Если водитель находится в городе то у него есть три возможности: 1) курсировать в надежде поймать пассажира; 2) поехать на ближайшую стоянку такси и ждать в очереди; 3) ждать вызова по радио.

Если водитель находится в городе С, то у него есть такие же три возможности, но в городе В последняя из них отсутствует, поскольку в этом городе нет радиообслуживания автомобилей. Для данного города и данной возможности задаются вероятности того, что следующий рейс будет совершен в каждый из городов и задан доход в денежных единицах, соответствующий каждому рейсу. Этот доход представляет собой заработок от рейса за вычетом всех произведенных расходов. Например, в случае альтернатив 1 и 2 стоимость курсирования или проезда до ближайшей стоянки должна быть учтена при вычислении доходов. Вероятности переходов и доходы зависят от действия водителя, поскольку различные действия приводят к различным возможностям найти пассажира.

Отождествим города с состояниями 1, 2 и 3 соответственно. Условия задачи сведем в табл. 1.2.

Таблица 1.2 (см. скан) Данные задачи водителя такси

Положим Пусть начальная политика имеет вид

полученный из условия максимизации при каждом

Вычисления, сделанные с помощью итерационного алгоритма, сведены в табл. 1.3.

Таблица 1.3 (см. скан) Решение задачи водителя такси итерационным алгоритмом,

Данную задачу можно решить также методом линейного программирования, однако это решение здесь не приводится.

1
Оглавление
email@scask.ru