Главная > Марковские процессы принятия решений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Глава 1. Марковские процессы принятия решений с переоценкой

1.1. Введение

Рассмотрим систему, у которой пространство состояний 5 содержит конечное число элементов. Пусть 5 совпадает с множеством целых чисел Каждому состоянию соответствует конечное множество решений (или альтернатив), элементы которого обозначим

Пространством политик К назовем прямое произведение множеств решений, т. е. Рассматривается задача принятия последовательных решений, состоящая в выборе решений при наблюдении текущих состояний в моменты

Если система находится в состоянии и принимается решение то 1) система получает доход ее состояние в следующий момент времени определяется вероятностным законом где вероятность того, что система из состояния при выборе решения попадает в состояние Предполагается, что доход ограничен при всех и Кроме того,

Рассмотрим процесс с переоценкой. Пусть коэффициент переоценки. Смысл его состоит в том, что единица дохода через время (например, дней) будет стоить единиц. Введение коэффициента переоценки с математической точки зрения ведет к ограниченности суммарного среднего дохода.

Зададим начальное распределение

где

Тогда система описывается неоднородной цепью Маркова с доходами. Будем искать стратегии, максимизирующие суммарный средний доход с учетом переоценки при конечном или бесконечном времени планирования, причем стратегия определяется, как последовательность решений, принимаемых в каждый момент времени во всех состояниях

В данной главе анализируются процессы принятия решений с переоценкой при бесконечном времени планирования, причем рассматривается задача максимизации (задача минимизации сводится к ней путем изменения знака у величин доходов).

1
Оглавление
email@scask.ru