Камень, ножницы, теорема. Фон Нейман. Теория игр - Коллектив авторов (книги онлайн полностью .TXT) 📗
Фон Нейман был не единственным воинственно настроенным ученым. Британский математик Бертран Рассел, в то время пользовавшийся большой популярностью, тоже выступал за войну предупредительного характера. Но его высказывания были не такими острыми, как слова фон Неймана, поскольку Рассел предоставлял противнику альтернативу: сдайся, покорись США — и ты избежишь ядерного холокоста. Венгерский ученый же утверждал, что удар должен быть неожиданным: не нужно никого предупреждать.
Его идея предупредительной атаки состояла в том, чтобы как можно скорее уничтожить военную мощь СССР, не дожидаясь провокаций и, по возможности, пока граждане Союза будут спать. При оценке такого подхода фон Неймана надо учитывать два аспекта: эмоциональный и рациональный. Первый относится к началу его жизни, когда семье ученого пришлось бежать из Будапешта от красного террора Белы Куна, и в глазах фон Неймана коммунизм получил черную метку. С другой стороны, ученый был рациональным математиком с холодным умом, он думал в терминах стратегий и решений, которые находили выражение в числах, уравнениях, моделях и аксиомах. В таком сугубо рациональном смысле сценарий войны был сценарием игры, в которую он часами играл еще ребенком со своим братом Михалем, сидя перед доской с кригшпилем.
Фон Нейман был экспертом в теории игр, что, как мы уже видели, подразумевает способности принимать решения и определять стратегии. Эти два качества особенно ценятся на войне. Неудивительно, что список организаций (так или иначе относящихся к военной элите), которые консультировал фон Нейман, был очень длинным. Его часто критиковали за слишком большую приверженность военным интересам и за то, что математик его уровня тратит большую часть своего времени на решение вопросов, на первый взгляд очень далеких от чистой науки. В этом была большая доля правды, но необходимо также учесть, что именно в этих кругах, как в случае с корпорацией РЭНД, ученый мог получить все необходимые инструменты, прежде всего финансовые, чтобы свободно воплощать научные идеи, реализация которых в противном случае могла натолкнуться на серьезные препятствия. В сложившейся ситуации военные круги, движимые прагматическими мотивами, были более гибкими. Гораздо большей критики заслуживали академические организации, которые всегда с большой сдержанностью относились к новым проектам.
ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР РЭНД
После окончания Второй мировой войны большинство ученых, работавших на службы безопасности США, вернулись на свои прежние рабочие места в университетах или поступили на работу в частные компании. В армии произошла самая настоящая утечка мозгов. Тогда в 1946 году военно-воздушными силами американской армии была основана корпорация РЭНД (RAND, Research And Development). В 1947 году она стала независимой от армии. Организация была создана как think tank — хранилище идей. Ее сотрудники должны были «думать о немыслимом», в ней развивались исследовательские проекты, спектр которых варьировался от межконтинентальных ракет до исландской фонетики. Фон Нейман был принят на работу в РЭНД в декабре 1948 года со специальным контрактом на 200 долларов в месяц, который не обязывал его даже присутствовать на месте. Его просто попросили, чтобы то время, которое он тратил на бритье каждое утро, он посвящал просмотру какого-либо проекта, над которым работал центр, и сообщал свое мнение о нем.
Главное здание центра РЭНД на пляже Санта-Моники, 1958 год.
ДИЛЕММА ЗАКЛЮЧЕННОГО
В период работы в РЭНД фон Нейман заинтересовался математической подоплекой на первый взгляд очень простой задачи — дилеммы заключенного. Однако она таила много сложностей и к тому же перекликалась со сценарием сдерживания ядерной гонки, над которым в то время велась интенсивная работа.
Когда Мерил Флад и Мелвин Дрешер, исследователи центра РЭНД, придумали эту простую игру, которую Альберт Вильям Такер, еще один сотрудник этой организации, назвал дилеммой заключенного, они и представить себе не могли, что создали одну из главных задач теории игр.
Дилемма заключенного состоит в следующем. Два члена преступной группировки попали в тюрьму. У полиции есть основания подозревать, что они совершили преступление, за которое следует наказание в виде шести лет заключения, но у нее недостаточно доказательств. Без главной улики их могут осудить всего на год тюрьмы за меньшее преступление. Полиция предлагает им такой уговор: если один даст показания против другого, то его освободят, а второго приговорят к десяти годам. Если они оба обвинят друг друга, им обоим дадут по четыре года тюрьмы. Бандитов держат в раздельных камерах, чтобы ни один из них не знал, какое решение принял второй. Если мы назовем заключенных A и В, то суть ситуации можно отразить в следующей платежной матрице.
В не обвиняет А
B обвиняет А
А не обвиняет В
1, 1
10, 0
А обвиняет В
0, 10
4, 4
Поскольку они не могут согласовать свои стратегии, принятие решений становится непростой задачей. Сначала кажется, что самым выигрышным поведением будет самое эгоистичное, которое учитывает интересы конкретного заключенного. Тогда в случае осуждения ему придется провести в тюрьме самое большое четыре года по сравнению с максимальным наказанием в десять лет, а если повезет и второй преступник воздержится от обвинения, то можно вообще избежать срока.
Такой ход мысли кажется довольно разумным, но надо иметь в виду, что второй заключенный рассуждает точно так же. Поэтому вполне вероятно, что в конце концов обоим дадут по четыре года. Эта стратегия может считаться доминантной. Тем не менее ясно, что это не самое лучшее решение, ведь если они оба откажутся давать показания друг против друга, то срок составит всего один год. Таким образом, лучшей стратегией будет кооперация, но это значит, что мы должны быть уверены в позиции нашего партнера, а гарантий у нас нет.
Существует целая область математики, изучающая подобные ситуации, которые считаются стратегическими играми. Игра начинается с числовой таблицы, иногда очень сложной, а стратегиями являются наилучшие из возможных ходов игроков. Если использовать холодный интеллект, теорию вероятностей, так называемое математическое ожидание и алгебру, то мы получим рациональные выводы, согласно которым для каждого игрока лучше всего не следовать эгоистическим побуждениям. То, что один игрок считает лучшим для себя вариантом, может таковым и не быть, если учитывать возможные действия остальных игроков. Очень часто идеальным решением, или оптимальной стратегией, будет кооперация. Так все получают максимальный возможный выигрыш с наименьшими потерями. Опытные данные показывают, что в дилемме заключенного игроки предпочитают обвинять, нежели доверять, и с точки зрения математики ошибаются.
Если вопрос о дилемме заключенного возникает в неформальной обстановке, например за обедом между друзьями, которые хотят немного поразмышлять за чашкой кофе, мы можем быть уверены в двух вещах: во-первых, размышлять они будут долго, а во-вторых, не придут ни к какому заключению. Дело в том, что у дилеммы заключенного нет удовлетворительного решения, так как эта ситуация больше похожа на парадокс, чем на логическую загадку. Два возможных варианта, которые кажутся правильными (оба кооперируют или оба обвиняют), очень трудно объяснить с рациональной точки зрения.
Мы знаем, что в ситуациях такого типа на принятие решения могут влиять самые разные факторы, например мораль или эмоции. Можно положиться на интуицию, довериться предсказаниям гадалки или просто кинуть кости и уповать на волю случая. Но в любом случае останется открытым вопрос: существует ли метод, позволяющий принять это решение рациональным способом? Можно ли придать этой задаче математический характер? Желание математизировать реальность, присущее фон Нейману, заставило его заинтересоваться дилеммой заключенного.