Эволюция разума - Курцвейл Рэймонд (читать книги онлайн без сокращений TXT) 📗
Образы, которые мы учимся распознавать, особенно наиболее важные из них, отличаются высокой степенью избыточности. Распознавание образов (таких как обычные предметы и лица) происходит по тому же механизму, что и воспоминание, которое как раз и представляет собой воспроизведение уже знакомого образа. Воспоминания тоже хранятся в виде последовательностей образов, обычно в виде текстов. Тот же механизм используется и для обучения движениям и их воспроизведению. Избыточность образов позволяет нам распознавать предметы, людей и идеи даже в измененном виде и в разном контексте. Величина и вариабельность величины поступающих сигналов также позволяют новой коре кодировать изменения амплитуды в разных измерениях (длительность в случае звука). Один из способов кодирования этих параметров состоит в записи множества образов с различающимися входными сигналами. Например, это могут быть образы произнесенного слова steep с разными вариантами длительности звука [E], каждый из которых характеризуется параметрами значимости, указывающими, что длительность этого [E] может быть различной. Этот подход не является математическим эквивалентом точному указанию параметров величины сигнала и на практике реализуется гораздо хуже, тем не менее это одна из возможностей записи амплитуды параметра. Самое весомое доказательство важности данных параметров заключается в том, что без них системы искусственного интеллекта не могут достичь такой же эффективности распознавания, как живой человек.
Все эти выводы следуют из приведенных мной выше примеров исследований и мысленных экспериментов. Я повторяю, что представленная мной модель является единственной, которая удовлетворительным образом соответствует всем условиям, определяемым данными практическими и мысленными экспериментами.
Наконец, существует еще одно доказательство справедливости описанной модели. Созданные нами за последние десятилетия системы искусственного интеллекта для распознавания и обработки проявлений реальной жизни (таких как человеческая устная и письменная речь), а также для понимания природы языка, как выясняется, в математическом плане очень похожи на описанную мной модель. Они также являются примером теории мысленного распознавания образов. Создатели искусственного интеллекта не пытаются воспроизвести человеческий мозг в буквальном смысле, однако неизбежно приходят к тем же самым принципам.
Глава пятая
Старый мозг
У меня старый мозг, но великолепная память.
И теперь мы стоим посреди этого нового мира с нашим примитивным мозгом, настроенным на простую пещерную жизнь, и имеем в своем распоряжении невероятные возможности, которые вполне способны реализовать, однако не можем предугадать последствий.
Старый мозг — тот, который имели наши предки еще до того, как стали млекопитающими, — никуда не исчез. Он по-прежнему решает многие задачи, такие как стремление к удовольствию и уход от опасности. Однако эти задачи модулируются новой корой, которая у человека является доминирующей частью мозга как по массе, так и по активности.
Животные жили и выживали, не имея новой коры, причем не млекопитающие и сегодня без нее обходятся. Мы можем воспринимать новую кору в качестве мощного сублиматора: наше примитивное желание избежать встречи с опасным хищником сегодня трансформируется новой корой в стремление решить поставленную задачу так, чтобы угодить начальству. Охота, возможно, подменяется написанием книг (например, о мозге), а задача воспроизводства — стремлением к популярности или страстью к оформлению домашнего интерьера (впрочем, последнее обычно не скрывают).
Новая кора способна помочь нам решить эти проблемы по той причине, что прекрасно моделирует окружающий мир, отражая его истинно иерархическую природу. Но задачи перед нами ставит старый мозг. Конечно, как любой умный чиновник, новая кора часто переформулирует проблемы, прежде чем их решать. Учитывая это, давайте все же рассмотрим процессы обработки информации, происходящие в старом мозге.
Сенсорное восприятие
Эти изображения, распространяясь при помощи движения вдоль волокон оптических нервов в мозг, являются причиной зрения [60].
Каждый из нас живет во вселенной — или в тюрьме — собственного мозга. От него отходят миллионы хрупких чувствительных нервных волокон, которые образуют группы, уникальным образом адаптированные для определения энергетического состояния окружающего нас мира: тепла, света, силы и химического состава. Только это нам и известно из непосредственного опыта; все остальное — логические измышления.
Хотя нам кажется, что глаза воспринимают изображение с высоким разрешением, на самом деле зрительный нерв посылает в мозг лишь набор очертаний и указаний относительно объектов, попадающих в поле нашего зрения. А затем мы воображаем себе окружающий мир на основании воспоминаний, хранящихся в новой коре, которая с очень низкой скоростью интерпретирует серию образов, поступающих по параллельным каналам. Профессор молекулярной и клеточной биологии из Калифорнийского университета в Беркли Фрэнк С. Верблин и докторант Ботон Роска опубликовали в журнале Nature статью, где показали, что зрительный нерв содержит от 10 до 12 выходных каналов, через каждый из которых проходит лишь небольшое количество информации о конкретной ситуации [62].
Зрительная система человека.
Так называемые ганглионарные клетки посылают информацию лишь о контурах предметов (контраст). Другая группа клеток детектирует только протяженные области одинакового цвета, а третья группа воспринимает исключительно фон за интересующим нас предметом.
Семь из двенадцати изображений низкого порядка, которые зрительный нерв направляет в мозг.
«Хотя нам кажется, что мы видим мир во всем объеме, на самом деле мы получаем лишь подсказки, контуры в пространстве и времени, — говорит Верблин. — Эти 12 изображений мира составляют всю информацию о том, что нас окружает, и на основании этих 12 изображений, что чрезвычайно мало, мы воссоздаем все богатство видимого мира. Мне любопытно, почему природа отобрала эти 12 простых картинок и как их может быть достаточно, чтобы снабдить нас всей информацией, в которой мы нуждаемся».
Такой способ передачи информации в области искусственного интеллекта называют разреженным кодированием. При создании искусственных систем мы обнаружили, что наилучшие результаты получаются, если отбросить большую часть поступающей информации и оставить лишь самые заметные детали. В противном случае новая кора (биологическая или искусственная) не справляется с обработкой информации.
Слуховая система человека.
Ллойд Уатт и его исследовательская группа из компании Audience Inc. [63] тщательно смоделировали процессы обработки звуковой информации, поступающей от улитки человеческого внутреннего уха через подкорку в отделы новой коры. Ученые разработали технологию, позволяющую разложить звук на 600 частотных полос (60 на октаву). Это уже близко к значению 3000 полос — именно так оценивается способность человеческого уха (для сравнения: коммерческие звукораспознающие системы используют от 16 до 32 полос). Применяя два микрофона, а также детальную (и обладающую высоким спектральным разрешением) модель обработки звуковой информации, ученые создали коммерческую технологию (с чуть более низким спектральным разрешением, чем в лабораторной модели), которая эффективно удаляет фоновые шумы при разговоре. Эта система теперь широко применяется во многих мобильных телефонах и является впечатляющим примером коммерческого продукта, основанного на понимании способности человеческого слухового аппарата фокусироваться на одном конкретном источнике звука.