| Сравнение 2-х методик расчета критических значений индекса   ID:45083 | 
Ср, 20 марта 2002 01:00 [#] [») | 
     
      | 
 
	
	
	| Бадди | 
	 | 
	
	
	    
	    
	    
	
	
	
	  (иконки IM)
	Форумы Покер.ру 
	
	 | 
 
  | 
 
    
        Привет, участникам форума! 
Ниже по форуму размещено послание мистера Joop. Видимо, поклонник одноименного (Wolfgang Joop) немецкого дизайнера. Дай Бог, чтобы у мистера Joop всегда были наличные на такие расчудесные одеяния. Ну да ладно. 
Мистер Joop подкинул идею о том, что можно рассчитывать индексы корректировок игровых решений не симуляцией, а прямым расчетом. В этом случае для каждого значения индекса мы точно задаем распределение карт. Исходя из этого распределения мы и рассчитываем стратегию для каждого индекса, попутно отмечая на каких значениях индекса происходят преломления стратегии. 
Мне кажется, что с теоретической точки зрения этот метод достаточно безгрешен. Да, в реальной игре при фиксированном  значении индекса распределения карт будут “скакать” раз от разу, не будут совпадать с тем распределением, из которого мы исходили при расчете игровой стратегии для данного значения индекса. Но в том, то и фокус, что “скакать” распределения будут вокруг того распределения, из которого мы исходили. Больше того, математическое ожидание всякой относительной частоты этого распределения, которая (относительная частота) встретится нам в реальной игре, будет совпадать с теоретической вероятностью, содержащейся в нашем “расчетном” распределении. Поясню на примере. 
Считаем карты по системе HiOpt2. Значение истинного индекса –11. Можно рассчитать, что вероятность появления двойки 8,75%. Предположим, что всякий раз, когда в игре счет опускается до –11, мы берем еще неразыгранные к этому моменту карты, считаем количество двоек и делим его на общее число несыгранных карт. Безусловно, наш результат только случайно может оказаться равен 8,75%. Но если мы будем проделывать такую процедуру достаточно долго, то из  теоремы Бернулли (относительная частота стремится по вероятности к теоретической вероятности) следует, что “в среднем” мы будем иметь все те же 8,75%. 
Идем дальше. Когда мы для фиксированной игровой ситуации (к примеру, 16 жестких очков против 10 у дилера) ищем значения индекса, при котором надо менять принимаемое игровое решение, то мы, по сути, ищем такое значение индекса, при котором “играть по-прежнему” перестает быть выгодно. До этого значения выгоднее всего было брать карту, а вот теперь лучше отказаться от дополнительной карты. С формальной точки зрения математики произошло следующее. До того как индекс принял это критическое значение, среди альтернатив (к примеру, stand и hit), доступных игроку, наивысшее математическое ожидание было у одной из альтернатив (к примеру, hit), а теперь наивысшее математическое ожидание у другой альтернативы (к примеру, stand). 
 Метод сопоставления каждому значению индекса фиксированного распределения, “озвученный” мистером Joop, позволяет сравнительно просто осуществить поиск критических значений индекса для разных игровых ситуаций. Происходить это будет в точности так, как описано выше.  
Будут ли совпадать результаты такого расчета с результатами, полученными симулированием? Мне кажется, что будут. Единственное отличие в том, что дисперсия всех “расчетных” математических ожиданий игровых альтернатив будет строго меньше дисперсий (выборочных дисперсий) "просимулированных” математических ожиданий тех же альтернатив. Причины понятны. Причем в реальной игре дисперсия математических ожиданий альтернатив, влияющая на “раскачку” траектории бюджета и, следовательно, на вероятность разорения, будет совпадать с дисперсией “просимулированных” математических ожиданий, а не с дисперсией “расчетных” математических ожиданий. 
Но это все с теоретической точки зрения. А что же на практике? Я изрядно заинтересовался соображениями, которые изложил мистер Joop, и на скорую руку сделал программу, реализующую  данные идеи по расчету критических значений индекса для корректировки игровых решений.  
С результатами можно ознакомиться в прикрепленном файле. Расчеты производил для системы HiOpt1. Диапазон изменения истинного индекса от –6 до +6.  Эти самые результаты расходятся (несмотря на все вышеизложенные мысли) с результатами Гарри Бальди, которые присутствуют ниже по форуму. Во всех случаях, где наблюдается расхождение, я вписал в скобки рядом со своим индексом то значение индекса, которое получил Гарри, и для пущей наглядности выделил эти ячейки оранжевым цветом. У Гарри Бальди диапазон изменения индекса больше, но я для сравнения брал лишь те его индексы, которые лежат внутри диапазона (-6,+6). 
Нельзя сказать, что в расхождениях абсолютно не проглядывается никакой системы. Так на жестких комбинациях при принятии решения брать/стоять из 20 индексов расхождения наблюдаются в 9, причем у меня в этих 9 случаях всегда на единицу меньше. То есть я получил некую более сдержанную стратегию относительно жестких брать/небрать. 
Мягкие брать/небрать совпадают (еще бы, совпадать-то нечему)! 
В жестких даблах из 15 индексов расходятся 6. Там, где есть расхождение, мои результаты “сдернуты” к нулю. Отрицательные индексы у меня выше, чем у Гарри, а положительные меньше. 
В мягком дабле не сходятся 14 индексов из 27. И в данном случае уже не проглядывается какой-либо системы в расхождениях.  
В сплитах  вообще бардак, совпадают лишь 6 индексов из 20(!). Некоторые отличаются серьезно. 
В стратегии саренды расходятся 2 индекса из 10. 
Но в то же время страховка должна производится со счета +3 (это совпадает), так как при счете +2 вероятность появления 10 – 32,(692307)%, а при счете +3 та же вероятность становится равна 33,6(538461)%, что больше, чем критические 33,(3)%. 
Но в то же время базовую стратегию ( для нулевого значения индекса) моя программа выдает правильно. У мистеров Лесного и Натансона в книге “Блекджек” есть таблица “Вероятности различных исходов при наборе карт дилером” (это у них для счета 0). Моя программа выдают аналогичную таблицу, цифры совпадают абсолютно (а ведь в книге приведены сотые доли процента!). Далее, в той же книге есть таблица “Средний выигрыш на жестких двухкарточных комбинациях” и “Средний выигрыш на мягких  двухкарточных комбинациях”, мои цифры совпадают вплоть до сотых долей процента, исключение составляют ожидаемые доходности по сплитам – расхождение в десятые доли процента. Но опять же, речь идет о истинном счете 0.    
К сожалению, пока нет больше времени на это, как только появится, я сравню ожидаемые доходности альтернатив, оцененные Гарри, и свои (их еще надо визуализовать из программы), может быть найду ошибку у себя. 
Буду исключительно рад всем высказываниям, пробужденным моим посланием. 
 
Удачи. 
Бадди.
 
        
     | 
 
 |  
  | 
    
    
    | Re: Сравнение 2-х методик расчета критических значений индекса   ID:45085   ответ на 45083   | 
Ср, 20 марта 2002 01:00 («] [#] [») | 
     
      | 
 
	
	
	| Peter | 
	 | 
	
	
	    
	    
	    
	
	
	
	  (иконки IM)
	Форумы Покер.ру 
	
	 | 
 
  | 
 
    
        Я до сих пор никак не могу понять - почему базовой стратегией считается стратегия при  
ИСХОДЯЩЕМ счете 0. Т.е. решение - делать ли дабл на А-2 vs 5 при счете 0 встречается реже  
(исходя из равномерного выхода карт), чем при текущем счете +1 по Хило - отсюда следует, что  
базовую стратегию необходимо считать при ВХОДЯЩЕМ счете = 0. Базовой стратегией должна  
быть не стратегия при счете=0, когда мы предполагаем, что против наших 2-х карт - 1 карта  
дилера и 6 полных колод, а стратегия принятия решений при 1-ой сдаче после шаффла при  
игре 1 на 1, учитывая счет с учетом этой сдачи именно потому, что такая сдача имеет наибольшую  
частоту в игре! 
 
Насколько я помню в книге Лесного-Натансона, посчитан именно случай при исходящем счете 0.  
Причина в расхождении базовых стратегий, предлагаемых на разных сайтах, которые очень  
пугают новичков (в свое время они пугали и меня) как раз в этом. 
 
Так, например именно по базовой стратегии надо всегда брать на своих 2-Т vs 10, на 5 - брать  
против А или делать  
дабл(трибл) на 8 vs 7 - Вот  
кстати в чем основа расхождений P.V. и Карела Яначека и других, кто голосовал за/против трибла  
по БС 8 vs 7. Кто-нибудь может мне объяснить - почему БС считается для ИСХОДЯЩЕГО счета =  
0? Просто потому, что алгоритм программы слегка усложнится? 
 
С уважением, Peter. 
  
        
     | 
 
 |  
  |