Как работает мозг. - Пинкер Стивен (серии книг читать бесплатно .txt) 📗
На самом деле перед нами прямоугольная прорезь в черной маске, через которую мы видим лишь часть изображения.
На следующем рисунке маска удалена, и мы можем видеть, что все пары серых квадратиков являются частями разных объектов.
Большие числа рядом с малыми могут появляться и в том случае, когда один предмет располагается перед другим. Примерами могут служить темная бумага, лежащая поверх светлой, поверхность, окрашенная в два разных оттенка серого цвета, два предмета, стоящие рядом вплотную друг к другу, серый целлофан, наложенный на белую страницу, угол, соединяющий две стены, а также любая тень. Мозг должен как-то решить эту проблему курицы и яйца: выделить трехмерные объекты из множества затененных участков на сетчатке и определить, что представляет из себя каждый участок (тень или краску, складку или наложение объектов, прозрачную или матовую поверхность), исходя из того, частью какого объекта является этот участок.
Однако на этом сложности не заканчиваются. Разделив визуально воспринимаемый мир на объекты, мы должны определить, из чего они сделаны, например, из снега или из угля. На первый взгляд эта задача представляется простой. Если большие числа соответствуют светлым участкам, а малые числа – темным, то большие числа будут означать снег, а малые – уголь, правильно? Нет. Количество света, попадающего на сетчатку глаза, зависит не только от того, насколько светлый или темный перед нами предмет, но и от того, насколько яркий или тусклый свет его освещает. Используемый фотографами прибор – экспонометр – покажет, что кусок угля на улице отражает больше света, чем комок снега в помещении. Именно поэтому люди нередко оказываются недовольны качеством своих снимков, и именно поэтому фотография – очень непростое ремесло. Фотоаппарат никогда не лжет; если предоставить ему возможность действовать без помощи человека, то все снимки, сделанные на улице, будут выглядеть как молоко, а сделанные в помещении – как грязь. Фотографы (а иногда и микропроцессоры, встроенные в фотоаппарат) добиваются от фотопленки реалистичного изображения, прибегая к таким приемам как регулировка скорости срабатывания затвора и диафрагмы объектива, светочувствительность пленки, вспышка и манипуляции в лаборатории.
Наша система зрительного восприятия справляется с этой задачей гораздо лучше. Она каким-то образом позволяет нам видеть, что блестящий на солнце уголь на самом деле черный, а кажущийся темным в помещении снег – белый. Это очень удобно, поскольку наше представление о цвете и свете совпадает с тем, каким мир является в действительности, а не с тем, каким он предстает перед глазами. Снег – объект мягкий, влажный и способный таять как в помещении, так и снаружи, и мы видим, что он остается белым независимо от того, в помещении он или снаружи. Уголь всегда твердый, маркий, способный гореть, и мы всегда видим его черным. Получившейся гармонией между тем, как выглядит окружающий мир, и тем, каким он является на самом деле, мы обязаны магии своего мозга: ведь сетчатка глаза не может сама по себе воспринимать черный и белый цвета. А если у вас все еще есть сомнения, вот пример из повседневной жизни. Когда телевизор выключен, экран имеет бледный зеленовато-серый оттенок. Когда телевизор включают, некоторые люминофорные точки начинают светиться, образуя светлые участки изображения, а некоторые другие точки не светятся, образуя темные участки; они остаются серыми. Те части изображения, которые мы видим как черные, на самом деле – все тот же бледно-серый оттенок кинескопа выключенного телевизора. Черный цвет – это фикция, результат работы мозга по той же схеме, благодаря которой мы видим, что уголь – это уголь. Именно эту схему работы использовали создатели телевидения, когда разрабатывали телеэкран.
Следующая проблема зрительного восприятия – это глубина. Наши глаза разбивают трехмерный мир на два двухмерных изображения на сетчатке глаз, а третье измерение должен воссоздать мозг. Однако в изображении на сетчатке нет никаких подсказок относительно того, насколько далеко от смотрящего расположен объект. Почтовая марка на вашей ладони оставит на сетчатке такое же квадратное изображение, как стул, стоящий у противоположной стены, или здание, расположенное за много километров от вас (первый рисунок на с. 17). Разделочная доска, если на нее смотреть фронтально, может давать такую же трапециевидную проекцию, как и фигуры неправильной формы, расположенные под углом (второй рисунок на с. 17).
Ближе вы можете познакомиться с этим явлением из области геометрии и с нейронным механизмом, который с ним работает, если посмотрите в течение нескольких секунд на электрическую лампочку или на фотоаппарат в момент вспышки: в результате на вашей сетчатке останется световое пятно. Теперь переведите взгляд на страницу книги; у вас перед глазами по-прежнему будет остаточное изображение лампочки шириной 3–5 см. Если вы посмотрите на стену, то остаточное изображение будет около метра в длину. А если посмотрите на небо, то это изображение будет размером с облако4
Наконец, как заставить модуль зрительного восприятия распознавать предметы, чтобы робот мог назвать их или вспомнить их назначение? Очевидным решением было бы построить для каждого объекта маску или шаблон, в точности повторяющий его форму. В таком случае при появлении объекта в поле зрения его проекция на сетчатке идеально совпадала бы с шаблоном. Шаблону присваивается метка с именем данной формы – в нашем случае это метка «Р», – и каждый раз, когда проекция совпадает с шаблоном, система выдает ее имя5:
Увы, это простое устройство допускает ошибки в обоих возможных случаях. С одной стороны, оно видит букву Р там, где ее нет: например, реагирует на букву R (первый вариант слева на рисунке внизу). С другой стороны, оно не замечает букву Р там, где она есть: например, если она смещена, наклонена, неровно написана, расположена слишком далеко или слишком близко, либо написана слишком затейливым шрифтом:
Столько проблем с распознаванием одной простой и понятной буквы алфавита! А теперь попробуйте представить, как сложно сконструировать устройство, способное распознать рубашку или, скажем, лицо! Конечно, сейчас, после сорока лет исследований в области искусственного интеллекта, технологии распознавания формы значительно улучшились. Вероятно, и у вас есть программное обеспечение, которое может довольно сносно распознать отсканированную страницу и преобразовать ее в цифровой файл. И все же искусственные средства распознавания формы по-прежнему не могут конкурировать с теми, что существуют у нас в голове. Они созданы для среды, где все безупречно и легко узнаваемо, а не для нашего сумбурного, беспорядочного реального мира. Странные цифры, напечатанные в нижней части чека, специально придуманы таким образом, чтобы не иметь даже частичных наложений; специальное оборудование для печати располагает их так, чтобы обеспечить распознование по заданным шаблонам. Когда в подъездах вместо консьержек появятся первые устройства, распознающие лицо, они даже не будут пытаться разгадать хитросплетения света и тени на вашем лице; они будут сканировать четко очерченные контуры радужной оболочки или кровеносные сосуды сетчатки. А вот наш мозг регистрирует форму каждого знакомого нам лица (а также каждой буквы, животного, инструмента и т. д.) и каким-то образом устанавливает ее соответствие с изображением на сетчатке, даже если это изображение искажено любым из рассмотренных выше способов. В главе 4 мы рассмотрим, как мозгу удается добиться таких потрясающих результатов.