Синдром Паганини и другие правдивые истории о гениальности, записанные в нашем генетическом коде - Кин Сэм
Один из коллег как-то сказал про Ципфа, что тот «может ощипать прекрасную розу, чтобы сосчитать ее лепестки». С литературой Ципф обходился столь же бесцеремонно. Будучи студентом, он взялся за «Улисса» Джойса, и главное, что он вынес оттуда, – роман состоит из 260 430 слов, 29 899 из которых различны. Так же Ципф препарировал «Беовульфа», Гомера, тексты китайской литературы и творчество римского драматурга Плавта. Подсчитывая слова в каждом из произведений, он открыл закон Ципфа. Он гласит, что наиболее распространенное слово в языке встречается примерно вдвое чаще, чем второе по распространенности, примерно втрое чаще, чем третье, в сто раз чаще, чем сотое по распространенности, и т. д. В английском языке слово «the» составляет примерно 7 % от всех слов, «of» – примерно половину от этого, «a» – треть от этого и т. д., вплоть до экзотических слов типа «бустрофедон». Такое распределение соблюдается во всех языках – от санскрита и этрусского до современных хинди, испанского или русского (эти языки Ципф анализировал по прейскурантам каталогов от компании «Сирс»). Закон Ципфа действует даже по отношению к искусственным языкам.
Уже после смерти Ципфа в 1950 году ученые обнаружили свидетельства того, что его закон соблюдается отнюдь не только в языке. Его также можно проследить: в музыке (подробнее об этом расскажем чуть позже), списках городов по численности населения, распределении доходов, массовом вымирании живых существ, магнитудах землетрясений, соотношении различных цветов в картинах или мультфильмах и т. д. В каждом случае самый большой или самый распространенный из элементов был вдвое больше/распространеннее второго в списке, втрое – третьего и т. п. Внезапная популярность этой теории ожидаемо привела и к обратной реакции, особенно среди лингвистов, которые часто ставят под сомнение само существование этого закона [18]. В то же время многие другие специалисты защищают этот закон, так как он видится корректным – частота слов не кажется случайной – и, опытным путем, описывает языки со сверхъестественной точностью. Даже «язык» ДНК.
Конечно, соблюдение закона Ципфа в случае с ДНК на первый взгляд не кажется очевидным, особенно для носителей западноевропейских языков. В отличие от большинства языков ДНК не имеет очевидных пробелов, помогающих отличать каждое слово. Это скорее напоминает тексты древних рукописей, без каких-либо пробелов, пауз и без единого знака препинания, бесконечные строки букв. Можно предположить, что триплеты, состоящие из А, Ц, Г и Т, которые кодируют аминокислоты, могут выступать в качестве «слов», но их соотношение совсем не похоже на ципфианское. Чтобы найти действие закона Ципфа, ученым пришлось обратить внимание на группы триплетов, и в этих поисках некоторые специалисты обратились к необычным помощникам: китайским поисковым системам. Китайский язык создает сложные слова путем связи соседних символов. Так, если в китайском тексте написано АБВГ, поисковые системы могут выступать своеобразным раздвижным окном, в котором помещаются найденные значимые отрывки: сначала АБ, БВ и ВГ, затем АБВ и БВГ. Использование принципа «раздвижного окна» оказалось неплохой стратегией для поиска значимых отрывков ДНК. Оказалось, что, в каком-то смысле, ДНК выглядит даже более ципфианской, чем язык, в группах, каждая из которых насчитывает до двадцати оснований. В общем, возможно, что наиболее значимой единицей для ДНК может быть не триплет, а четыре триплета, работающих сообща, – додекаэдрный мотив.
Выражение ДНК и ее трансляция в белки также подчиняются закону Ципфа. Как и распространенные слова, некоторые гены в каждой клетке появляются снова и снова, в то время как большинство генов вряд ли примут участие в конверсии. На протяжении веков клетки учились полагаться на эти общие белки все в большей и большей степени, и наиболее распространенные из них появлялись вдвое, втрое, вчетверо раз чаще, чем белки, следующие по популярности. Честно говоря, многие ученые хмыкают, что эти ципфианские фигуры вовсе ничего не значат; но другие специалисты говорят, что уже самое время признать: ДНК не только аналогична языку, но и реально функционирует, как язык.
И не только язык: ДНК обладает теми же ципфианскими свойствами, что и музыка. Возьмем тональность какого-нибудь музыкального отрывка, например до мажор, и убедимся, что определенные ноты там встречаются чаще остальных. Ципф действительно как-то исследовал преобладание тех или иных нот у Моцарта, Шопена, Ирвинга Берлина и Джерома Керна – и (внимание!) нашел ципфианское распределение! Позже исследователи подтвердили справедливость этих выводов и в других музыкальных жанрах, от Россини до Ramones, и обнаружили подобные пропорции не только во встречаемости нот, но и в тембре, и в громкости звука.
Однако если ДНК демонстрирует ципфианские тенденции, можно ли сказать, что цепочки организованы в своего рода партитуру? Музыкантам на практике удалось перевести А-Ц-Г-Т последовательность серотонина – химической составляющей мозга – в небольшие песенки, заменяя четыре символа ДНК нотами: ля (А), до (С), соль (G) и, поскольку буква T никакой ноте не соответствует, ми (Е). Другие музыканты составляли ДНК-мелодии, присваивая ноты звукоряда определенным аминокислотам, которые встречаются чаще остальных: это привело к появлению более сложных и приятных звуков. Второй метод укрепил идею, что ДНК, как во многом и музыка, лишь частично представляет собой строгую последовательность «нот». Она также определяется мотивами и темами, показывает, как часто появляются определенные последовательности и хорошо ли они взаимодействуют. Один биолог даже доказывал, что музыка – это природный посредник в изучении того, как комбинируются частицы генома, с тех пор как люди обзавелись четким слухом, чтобы улавливать, как фразы сообща действуют в музыке.
Нечто еще более интересное произошло, когда двое ученых, вместо того чтобы превращать последовательность ДНК в музыку, решили осуществить обратный процесс и перевели ноты ноктюрна Шопена в ДНК. Итогом опыта стала последовательность, «поразительно похожая» на часть гена РНК-полимеразы. Эта полимераза, белок, не меняющийся на протяжении всей жизни организма, и есть то, с помощью чего из ДНК строится РНК. А это, если посмотреть внимательнее, обозначает, что ноктюрн копирует весь жизненный цикл. Смотрите сами: полимераза использует ДНК для построения РНК. РНК, в свою очередь, строит сложные белки. Эти белки образовывают клетки, а из клеток происходят люди – такие, как Шопен. Композитор выполняет свою работу – создает гармоничную музыку, которая завершает цикл, кодируя ДНК на постройку полимеразы. Так музыковедение обобщает всю онтологию.
Является ли это открытие случайностью? Не совсем. Ученые утверждают, что впервые гены появились в ДНК не случайным образом, по какому-нибудь старому участку хромосомы. Вместо этого они начали дублироваться сразу в виде повторяющихся фраз, десятка-другого оснований ДНК, дублированных снова и снова. Эти участки функционируют как основная музыкальная тема, куда композитор добавляет всякие приятные излишества, побочные мелодии, с помощью которых создает приятно звучащие вариации на основе оригинала. Продолжая оперировать этими понятиями, заметим, что гены с самого начала имеют определенную «мелодию», на основе которой они и построены.
Люди давно хотели связать музыку с какими-то более глубокими, более грандиозными природными процессами. В частности, астрономы – начиная от древнегреческих и заканчивая Кеплером – верили, что небесный путь планет проходит через рай земной и что планеты создали безумно красивую музыку небесных сфер – гимн во славу творения. И оказалось, что универсальная музыка существует на самом деле, только гораздо ближе, чем мы себе представляли, – в нашей ДНК.
Генетика и лингвистика связаны не только законом Ципфа, но еще глубже. Мендель, до того как стать монахом, пробовал себя в лингвистике, в том числе пытался вывести точный математический закон по поводу того, как немецкие фамильные суффиксы (такие, как «-манн» или «-бауэр») скрещиваются с другими именами и воспроизводят себя в каждом поколении (звучит знакомо, не правда ли?) И, черт возьми, сейчас генетики не могут даже говорить о своей работе безо всех этих терминов, позаимствованных из изучения языков. У ДНК есть синонимы, переводы, пунктуация, префиксы и суффиксы. Мутации с изменением смысла (с заменой аминокислот) и с утратой смысла (с вмешательством стоп-кодонов) – это, как правило, «опечатки», а мутации, связанные со сдвигом рамки считывания (искажающие смысл триплетов) – это старомодные ошибки, связанные с нарушением работы типографии. В генетике даже есть свои грамматика и синтаксис: правила для комбинирования «слов» из аминокислот и сложения белковых «предложений», которые может прочитать клетка.