Моделирование рассуждений. Опыт анализа мыслительных актов - Поспелов Дмитрий Александрович
В этом случае X проиграет.
А что будет, если X обладает вторым рангом рефлексии? В этом случае он предполагает, что Y способен к рефлексивным рассуждениям первого ранга. В этих условиях рассуждение X может выглядеть следующим образом:
Y думает, что X думает, что A
B и, следовательно, ХB и, следовательно, YB, отсюда ХА.И если X правильно оценил возможности Y, то он ушел от погони. Но если X провел рефлексивное рассуждение на уровне второго ранга рефлексии, а Y обладал лишь нулевым рангом, то X попался. Он «перемудрил сам себя», посчитав, что Y обладает способностями рассуждать, которые тому и не снились.
Ситуация, очень похожая на этот последний случай, послужила основанием для рассказа «Ограбление произойдет в полночь», принадлежащего известному советскому писателю-фантасту И. Варшавскому. В нем описана следующая забавная ситуация. Полицейское управление получает в свое распоряжение мощный компьютер с пакетом программ, позволяющих прогнозировать возможные преступления. Проанализировав все случаи ограбления банков за последние пятьдесят лет, ЭВМ выдает прогноз, что сегодня произойдет ограбление Национального банка и сделает это известная банда папаши Сколетти. Машина даже рассчитывает оптимальный вариант ограбления, сулящий банде наибольший успех.
Все было бы хорошо, но у банды Сколетти тоже есть ЭВМ – родная сестра машины, стоящей в полицейском управлении, а программисты, работающие у бандитов, конечно, знают об ЭВМ, приобретенной полицией. И, конечно, они легко могут просчитать действия полиции при оптимальном варианте ограбления. Поэтому если их уровень рефлексии выше нулевого, то бандиты воспользуются не оптимальным вариантом, а тем, который наименее от него отличается.
Так начинается дуэль двух ЭВМ, которые постепенно наращивают ранги рефлексии своих рассуждений. Процесс этот, как мы уже говорили, бесконечен. ЭВМ рассчитывают и отвергают один вариант за другим, не останавливаясь окончательно ни на одном из них, предполагая, что противники уже рассчитали эти варианты. Дуэль кончается неожиданно. Шефу полиции сообщают, что десять минут назад Национальный банк ограблен. На испуганный вопрос программиста полицейского управления: «Неужели Сколетти?..», – шеф полиции яростно отвечает: «Думаю, что Сколетти целиком доверился такому же болвану, как вы. Нет, судя по всему, это дело рук Вонючки Симса. Я знаю его манеру действовать в одиночку, угрожая кольтом образца 1912 года и консервной банкой, насаженной на ручку от мясорубки».
Вонючка Симс не был способен к рефлексивным рассуждениям и выиграл на этом.
Рефлексивные рассуждения тесно связаны с некоторым классом игр, в которых игроки при выборе своих действий могут опираться на соображения о поведении других игроков. Простейшей из таких игр является игра, получившая название «Дилемма заключенного». Эта игра задается матрицей с определенными отношениями между выигрышами игроков при выборе ими одной из двух доступных им альтернатив. Например, матрица может иметь следующий вид:
В этой матрице А1 и А2 обозначают два действия, которые может выбрать первый игрок, a B1 и B2 – действия второго игрока. На пересечении строк и столбцов написаны пары чисел, которые определяют выигрыши и проигрыши соответственно первого и второго игроков, когда они произведут одновременно свои альтернативные выборы.
Обычно для интерпретации этих выборов рассказывают следующую криминальную историю. Полиция задержала двух человек, которые полицейским показались подозрительными. Во всяком случае, они явно смахивали на бродяг, а в стране, где это происходит, за бродяжничество полагается наказание – год тюремного заключения. Но у полицейского комиссара есть основания подозревать в них не просто бродяг. Похоже, что они – давно разыскиваемые преступники, на совести которых немало краж. Но как установить истину?
Комиссар выбирает следующую тактику. Он сажает подозреваемых в разные камеры и не дает им общаться между собой. При допросе каждому из них он объясняет, что если допрашиваемый сознается в совершении краж, то все наказание (шесть лет тюрьмы) понесет нераскаявшийся преступник, а сознавшийся будет полностью освобожден от наказания. Если же оба преступника сознаются одновременно, то каждому из них придется отсидеть по три года.
Перед подозреваемыми возникает дилемма: сознаваться или не сознаваться? Если бы они могли договориться между собой, то, конечно, надо было бы упорно отрицать свое участие в кражах. Год тюрьмы не такой уж большой срок, и они вскоре были бы на свободе. Но договориться им не дают. И все время каждого мучает мысль: что если сообщник сознается? Тогда придется сидеть шесть лет, а он будет гулять на свободе.
Итак, перед каждым из игроков две стратегии: сознаться (в матрице игры этому соответствуют альтернативы А1 и В1) или не сознаваться (альтернативы A2 и В2). Как поведут себя люди в такой ситуации? Как они должны рассуждать?
Если у наших бродяг нулевой ранг рефлексии, то каждый из них способен рассуждать только на основе тех чисел, которые находятся в матрице игры. А это значит, что каждый из них руководствуется лишь собственными интересами. В таких условиях они мгновенно «раскалываются», признаются в совершенных кражах и получают по три года тюрьмы.
Если один из бродяг обладает первым рангом рефлексии, то он сначала подумает о своем компаньоне, встанет на его место, примет его посылки и критерии (в данной задаче эти посылки и критерии одинаковы у обоих игроков). Если имеются основания считать, что компаньон человек недалекий, не способный к рефлексии, то ясно, что он сознается при первой же возможности, ибо рассуждает по схеме
В этих условиях надо немедленно сознаваться, ибо три года тюрьмы все-таки лучше, чем шесть.
Если же компаньон умен, то хорошо бы знать, какой ранг он припишет своему сотоварищу. Если нулевой, то ситуация ясна – пары (А1, В1) не избежать и надо немедленно сознаваться. Если же он посчитает, что сотоварищ имеет первый ранг рефлексии, то он сделает правильный выбор: сознаваться не нужно. Хотя, если он будет выбирать B2, то почему бы не выбрать A1? И быть на свободе, оставив сидеть его в тюрьме. Такое рассуждение соответствует уже второму рангу рефлексии. Но ведь и компаньон может оказаться таким, что у него будет тоже второй ранг рефлексии. Что тогда?..
Оставим бродяг мучиться над их неразрешимой дилеммой, а комиссара полиции ждать, когда они «созреют». Вернемся к тем схемам рефлексивных рассуждений, которые мы привели.
Для того чтобы понять, как реализуются рассуждения с различными рангами рефлексии, введем специальный оператор x(y(z)), смысл которого заключается в словах «х думает, что у думает z». С помощью этого оператора можно записывать схемы рефлексивных рассуждений. Например, запись
соответствует следующему рассуждению: «x думает, что у думает, что х думает d, поэтому х делает h». Ясно, что ранг рефлексии х равен двум, а относительно у он предполагает, что его ранг рефлексии равен единице. В большинстве задач, связанных с рефлексивными рассуждениями, по-видимому, можно обойтись лишь двумя типами рангов рефлексии: четным и нечетным. Более тонкое исследование рефлексивных рассуждений читатель может найти в литературе, указанной в комментарии к этому разделу.