Логика случая. О природе и происхождении биологической эволюции - Кунин Евгений Викторович (серии книг читать бесплатно txt) 📗
Новая эра геномики наступила на исходе лета 1995 года. Тогда лаборатория Дж. Крейга Вентера опубликовала результаты секвенирования генома условно-патогенной бактерии гемофильного гриппа Haemophilus influenzae (Fleischmann et al., 1995). В процессе расшифровки геномной последовательности H. influenzae Вентер, Гамильтон Смит и их коллеги усовершенствовали так называемый «метод дробовика». Этот подход грубого деления генома на короткие произвольные участки с расшифровкой их по частям и последующим восстановлением полной геномной последовательности быстро превратил секвенирование длинных нуклеотидных цепочек в рутинное дело. В течение года были расшифрованы геномы некоторых других бактерий, первый геном археи (Methanocaldococcus jannaschii) и первый геном эукариота (пекарские дрожжи Saccharomyces cerevisiae) (Koonin et al., 1996). К 1999 году установился стабильный экспоненциальный рост коллекции секвенированных геномов (см. рис. 3–1).
В диапазоне от вирусов до животных геномы различаются по размеру на шесть порядков – от нескольких тысяч до нескольких миллиардов нуклеотидов; для клеточных организмов, исключая вирусы, ширина диапазона составляет четыре порядка (см. рис. 3–2). По количеству генов диапазон значительно уже и составляет всего около четырех порядков, от двух-трех генов у простейших вирусов до приблизительно 40 тысяч генов у некоторых животных. Если же исключить вирусы и паразитические (симбиотические) бактерии, диапазон по числу генов становится довольно узким, немногим более одного порядка (см. рис. 3–2; Koonin, 2009a; Lynch, 2007c). Кажется весьма удивительным, что млекопитающие или цветковые растения имеют всего примерно в десять раз больше (легко идентифицируемых) генов, чем какая-нибудь средняя свободно живущая бактерия, и лишь примерно в два раза больше, чем бактерия из разряда наиболее сложных (см. рис. 3–2). Далее в книге рассматриваются всевозможные объяснения этих явных ограничений по числу генов в геномах всех форм жизни (см. гл. 5, 7 и 10).
Рис. 3–1. Экспоненциальный рост коллекции секвенированных геномов. Данные с веб-сайта Национального центра биотехнологической информации (www.ncbi.nlm.nih.gov/genome/)
Рис. 3–2. Общий размер геномов и число генов у вирусов, бактерий, архей и эукариот. Данные с веб-сайта Национального центра биотехнологической информации. Представлено в двойном логарифмическом масштабе. Стрелка указывает на точку изменения наклона кривой, соответствующую переходу от «малых» к «большим» геномам.
Грубо говоря, геномы могут быть разделены на два четко выделенных класса (Koonin, 2009а). Граница, разделяющая эти классы, находится в точке изменения наклона кривой на графике, представленном на рис. 3–2.
1. Геномы со строгим соответствием между размером генома и числом генов. К ним относятся геномы всех вирусов и прокариот, имеющие огромную плотность генов от 0,5 до 2 генов на тысячу пар оснований и очень короткие участки между генами (10–15 процентов длины генома и даже меньше), состоящие главным образом из регуляторных элементов. Иногда, говоря о таких геномах, вспоминают ковер «от стены к стене» (wall to wall genomes) [32], так как они почти полностью состоят из легко определяемых генов. Геномы большинства одноклеточных эукариот демонстрируют несколько меньшую зависимость между размером генома и числом генов, чем геномы вирусов и прокариот, тем не менее они могут быть отнесены к этому же классу.
2. Геномы, у которых нет четкой взаимосвязи между размером генома и числом генов, в частности большие геномы многоклеточных и некоторых одноклеточных эукариот. Здесь в лучшем случае наблюдается слабая корреляция между общим размером генома и числом генов. Соответственно, доля генома, занимаемая межгенными участками (а также другими некодирующими последовательностями, такими как интроны), сильно варьирует. В некоторых наиболее сложных геномах, в частности у млекопитающих, основную часть генома составляют именно некодирующие последовательности.
Вариабельность размеров генома и числа генов дополняется разнообразием в других измерениях – например, в физической организации и композиции нуклеотидов. При рассмотрении как вирусной, так и клеточной формы жизни геномы предстают во всевозможных формах нуклеиновых кислот (подробнее см. в гл. 10). Все геномы клеточных организмов состоят из двухцепочечных ДНК, однако количество геномных сегментов (хромосом) и их размеры, форма (кольцевая или линейная), а также плоидность (число наборов) широко разнятся. Азбучная истина гласит, что прокариоты имеют гаплоидные, простые кольцевые хромосомы, в то время как у геномов эукариот, сильно различающихся по плоидности, гены распределены между множеством линейных хромосом. И хотя такие геномные формы, по-видимому, действительно доминируют, на самом деле разнообразие геномов выходит далеко за рамки такого простого дихотомического разделения. В частности, у многих прокариот имеется несколько хромосом, в отдельных случаях – линейных. Более того, вопреки распространенному заблуждению, у прокариот большинство клеток не гаплоидные, то есть они содержат несколько копий генома.
Древние гены составляют в геноме большинство и имеют отчетливую эволюционную судьбу
Как уже упоминалось в предыдущей главе, Эрнст Майр, великий эволюционист XX века и один из основателей СТЭ, с уверенностью предсказывал исходя из больших фенотипических различий между организмами, что гены разных организмов, даже близкородственных, не будут иметь узнаваемого сходства. Ошибочность этого предсказания оказалась просто феерической, что само по себе делает его нетривиальным и ценным. Сравнение последовательностей даже в догеномный период выявило высокий консерватизм последовательностей у некоторых гомологичных белков и молекул некодирующих РНК по всему спектру жизни, от бактерий до млекопитающих (см. предыдущую главу). Более того, высокая степень сходства последовательностей существует у древних паралогов, которые, по-видимому, происходят от копий, ведущих свое происхождение от LUCA (Gogarten et al., 1989; Iwabe et al., 1989). Геномика позволяет перевести это общее понимание в количественное разбиение генов любого генома на классы эволюционной консервативности (см. рис. 3–3; Koonin and Wolf, 2008b).
Ключевое открытие сравнительной геномики состоит в том, что большинство генов в каждом геноме могут считаться высококонсервативными – они имеют легко обнаруживаемые гомологи в организмах, разделяемых сотнями миллионов лет эволюции (например, в случае генов человека, на уровне общего предка позвоночных; см. рис. 3–3; Wolf et al., 2009). Это открытие демонстрирует поразительную устойчивость последовательностей РНК и белков в процессе эволюции: типичное время исчезновения сходства последовательностей у гомологичных генов сравнимо со временем существования жизни на Земле. Помимо основополагающего значения, данный факт имеет огромные практические последствия: благодаря ему, прежде всего, сравнительная геномика становится крайне информативной и действенной.
Рис. 3–3. Распределение генов по эволюционному возрасту. «Эволюционный возраст» соответствует самому старому таксономическому узлу, в котором могут быть определены гомологи для белка, производимого данным геном. В частности, для человека древние всеобщие означает «гомологи, обнаруживаемые у прокариот», древние эукариотические означает «гомологи, обнаруживаемые у прокариот вне супергруппы униконтов» (см. гл. 7), царство и тип означает «гомологи, обнаруживаемые у животных вне класса млекопитающих», а класс и моложе означает «вне класса млекопитающих гомологи не обнаружены» (данные по Wolf et al., 2009)