| 
    | 
    
    | Re: Скупой платит дважды, тупой платит трижды, лох платит постоянно! – Или, снова о  Шкатулках   ID:31828   ответ на 31791 | Сб, 11 августа 2007 08:34 [#] |  |  
	|  |  
    | ДА!| Korovin писал сб, 11 августа 2007 02:12 |  | ...ТЫ САМ можеш предложить универсальную стратегию, которая в этом частном случае может дать лучшее МО??? | 
 
 I) ------------
 Сейчас уже всем стало понятным и очевидным, что если известны "профили" противников и они остаются неизменными, то появляется шанс усилить свою стратегию, чтобы показывать более-лучший результат.  О том, как определять и скрывать "профили" поговорим ниже.
 
 Примеры:
 1) Игрок знает "профиль" Учредителя (распределение частот парных сумм в шкатулках)
 а) "профиль" вида БР - "больше [выплаты] - реже [встречаются]"
 выплаты      2-4      4-8      8-16
 доли          11/16    4/16     1/16
 ---------------------------------------
 Здесь наилучшая стратегия: НИКОГДА не открывать вторую шкатулку, если выпадает от 4-х и выше.
 
 б) "профиль" вида БЧ - "больше - чаще"
 выплаты      2-4     4-8     8-16
 доли          1/16    4/16     1/16
 ---------------------------------------
 Здесь наилучшая стратегия: ВСЕГДА открывать вторую шкатулку, если выпадает от 8-и и ниже.
 
 2) Учередитель знает "профиль" Игрока (на каких уровнях он открывает вторую шкатулку)
 а) "профиль" вида БС - (больше [выплаты] - с[тоим], иначе - м[еняем])
 выплаты      2-4      4-8      8-16
 м м      м с       с с
 ---------------------------------------
 Здесь наилучшая стратегия Учередителя: сделать свой профиль вида БЧ. Тогда игрок будет явно не добирать за счёт "стэя"!
 
 б) "профиль" вида БМ - (больше [выплаты] - м[еняем], иначе - с[тоим])
 выплаты      2-4      4-8      8-16
 м с      с м       м с
 ------ концевые действия сделали осмысленными!
 Здесь наилучшая стратегия Учредителя: сделать свой профиль вида БР. Тогда игрок будет явно не добирать за счёт "обмена" на больших суммах!
 
 
 II) -----------------------
 Возникает естественный вопрос: а есть ли "профили" противников, когда безразлично - "открывать вторую шкатулку или нет?" (для Игрока) и "открывает ли вторую шкатулку игрок или нет?" (для Учредителя).
 Ответ утвердительный: ЕСТЬ.
 
 1) Запишем локальное МО для какой-нибудь суммы S_i.  P_k - вероятность выпадения k-ой суммы после выпадения i!!
 "k-1", "k+1" - индексы кратных сумм.
 стоим:        МО_с = S_i;
 меняем:     МО_м = (P_i-1)*(S_i-1) + (P_i+1)*(S_i+1) = (P_i-1)*S_i/2 + (P_i+1)*S_i*2.
 --------------------------------
 Сокращаем общий сомножитель и получаем:
 (P_i-1)/2 + (P_i+1)*2 = 1.
 Это индексное уравнение имеет очевидное решение:  P_i-1 = 2/3;   P_i+1 = 1/3. То есть, увеличение выигрыша во второй шкатулке (в 2 раза) должно встречаться в ДВА реже, чем уменьшение!!
 Пример:
 парные_суммы:        1-2         2-4   4-8   8-16   16-32   32-64   64-128
 доли:                   1/2+1/128    1/4   1/8   1/16    1/32      1/64     1/128
 P.S.  Наименьшую пару мы вынуждены задавать чуть чаще для соблюдения баланса!
 
 2) Аналогичная картина и для "профиля" Игрока (только не путать с методикой Коровина).
 Игрок ОБЯЗАН на любой первоначальной сумме в ТРЕТИ СЛУЧАЕВ ОТКРЫВАТЬ ВТОРУЮ ШКАТУЛКУ!! Иначе, Устроитель может видоизменить свой "профиль" так, что Игрок станет выигрывать меньше.
 
 
 III) -------------------
 Итак, мы нашли РАВНОВЕСНЫЕ/ОПТИМАЛЬНЫЕ СТРАТЕГИИ ПРОТИВНИКОВ. Т.е. в этой позе НИКТО (Игрок/Учредитель) не может улучшить свой результат. Если кто-то отступает от оптимальности - противник за счёт изменения своего "профиля" может показывать лучше результат, но если первый среагировал вовремя на этот манёвр, то Второй - вляпается!! Тут цель выбирает каждый под себя: "больше выиграть" или "меньше проиграть".
 Понятно, что МО для равновесных стратегий совпадает с результатом Грамазеки = 1.5*сумма_в_обеих_шкатулках.
 
 
 IV) -----------
 По большому счёту, решениЯ Грамазеки (всегда_стоять и всегда_менять) одновременно верны при равномерных парных выплатах. Грамотный Учредитель в состоянии чуть-чуть ухудшить его результат за счёт "сгущения" (снизу или сверху) парных_сумм. Оптимальной стратегией будет "шаг вперёд, два шага назад":  один раз из трёх открывать вторую шкатулку, два раза - стоять!!
 
 
 V)  ----------
 Поиск оптимальной стратегии против КОНКРЕТНОГО противника следующий
 1) Для Игрока:
 а) Разбиваем диапазон выплат на дискретные величины выплат (или интервалы).
 б) Отслеживаем пары локальных МО (для всех интервалов) только для тех испытаний, когда открывали вторую шкатулку - МО_с и МО_м (когда "стояли БЫ"! и когда меняли шкатулки).
 в) После накопления статистики мы можем скорректировать свою первоначальную стратегию (где-то чаще делать С вместо М и наоборот) с учётом "профиля" противника! При обязательном условии, что мы  "готовы и хуже сыграть, при хороших шансах больше выиграть"!
 1) Для Учредителя:
 Отслеживаются доли обмена шкатулок в зависимости от сумм в первой шкатулке.  Те суммы выплат, где С-М отличается от 2:1 позволяют улучшить "профиль"!
 
 
 VI)  ---------
 Халява со шкатулками может превратиться в полноценную игру, если
 1) Второй возвращает Первому полусумму в шкатулках;
 2) Они поочерёдно меняются местами.
 ----------------------------------------------------
 Здесь уже надо или обманывать противника с риском вляпаться самому, или играть по Нэшу, что и было изложено выше!
 |  |  |  |