Геном человека. Энциклопедия, написанная четырьмя буквами - Тарантул Вячеслав Залманович (книги без регистрации полные версии txt) 📗
Так были построены первые генетические карты генома человека, на которых первоначально были отмечены различные генетические маркеры, отстоящие друг от друга на расстоянии не более 2 миллионов нуклеотидных пар (млн. н. п.).
Затем были составлены физические карты хромосом: первоначально с разрешением 0,1 млн. н. п., а затем 0,001 млн. н. п. Для этой цели на первом этапе применяли методы окрашивания хромосом и гибридизации с хромосомами in situ. И лишь позднее использовали рестриктазы. С помощью этих удивительно точно работающих ферментов «дробили» ДНК по строго определенным участкам на миллионы перекрывающихся между собой по нуклеотидной последовательности фрагментов, «разбирали» каждый из них по отдельности, после чего из них «склеивали» оригинал. «Склеивание» проводили на основании перекрывания фрагментов по нуклеотидной последовательности. Так постепенно шли все выше и выше. Поэтому данная стратегия получила название «снизу вверх». Со всей очевидностью можно сказать, что решалась грандиозная по масштабам и сложности задача. И решить ее ученые смогли только с помощью суперкомпьютеров. В результате были созданы физические карты разных областей ДНК и целых хромосом, состоящие из последовательно перекрывающихся друг с другом фрагментов. Набор таких «родственных» фрагментов получил название контиг (рис. 16).
А далее наступила очередь секвенирования отдельных рестрикционных фрагментов. Это привело в конечном итоге к построению секвенсовых карт, на которых степень разрешения была доведена до своего максимального значения. Если 20 лет назад расшифровка нуклеотидной последовательности ДНК длиной 1000 п. н. считалась большим научным достижением (за это можно было сразу получить степень доктора наук), то уже к 1990 году секвенирование ДНК стало массовой технологией. А сейчас квалифицированный лаборант проделывает такую работу всего за несколько часов.
После появления эффективных методов секвенирования ДНК и нескольких стратегий использования этого метода стал стремительно нарастать вал расшифрованных нуклеотидных последовательностей, в первую очередь таких простых организмов, как вирусы, а также отдельных клонированных фрагментов ДНК различных видов высших организмов. Так, еще в конце 1970-х годов была расшифрована структура первого живого объекта — вируса бактерий — бактериофага, обозначаемого как φΧ 174, имеющего длину 5386 п. н. Затем последовала очередь других.
В конце 80-х гг. были начаты крупные международные проекты, целью которых было полное секвенирование геномов бактерий, грибов, дрожжей, дрозофилы, мыши, пшеницы, человека и др. Первоначально была определена первичная структура ДНК микроорганизмов с размерами генома до 20 млн. п. н., к концу 1998 г. их число составило уже 18 (см. табл. 2). Наименьший размер генома у свободно живущих организмов (например, у бактерии Mycoplasma genitalium) составляет лишь около 600 000 п. н. У этой бактерии содержится всего 500 генов, причем 150 из них (если их удалять по одиночке) никак не влияют на её жизнеспособность. Так возникло предположение, что элементарная «машина жизни» теоретически должна работать при наличии всего лишь 350 генов.
Первые объекты для секвенирования были выбраны неслучайно. Большинство из этих микроорганизмов (архебактерии, спирохеты, хламидобактерии, кишечная палочка, возбудители пневмоний, сифилиса, гемофилии, метанобразующие бактерии, микоплазмы, риккетсии, цианобактерии) способны вызывать различные патологии у человека. В настоящее время многие из этих проектов уже завершены; исследовано свыше 800 полных клеточных геномов микоплазм, архебактерий, кишечной палочки, возбудителей ряда болезней человека, а также пекарских дрожжей, маленького червя-нематоды, дрозофилы и весьма интересного в практическом плане растения арабидопсиса. Весьма вероятно, что истинное число секвенированных к настоящему времени геномов гораздо больше, потому что многие фармацевтические фирмы засекречивают свои результаты, не публикуя их в открытой печати.
Таблица 2. Некоторые микроорганизмы, геномы которых полностью секвенированы к настоящему времени
ТАЙНА ТАЙН ЗА 6 МИЛЛИАРДОВ ДОЛЛАРОВ
Лучше изучить лишнее, чем ничего не изучить.
Сенека Старший
Кто хочет много знать,
тому надо мало спать.
Русская пословица
И вот дошла очередь до расшифровки сокровеннейшей тайны человека — ДНКового текста его генома, который некоторые называют Книгой жизни или Энциклопедией человека.
Напомним еще раз, как все это начиналось и происходило. В 1988 году был создан проект «Геном человека» Национального института здоровья США. Главой работ по полному секвенированию генома человека стал нобелевский лауреат Джеймс Уотсон. Одновременно в России с этой же идеей выступил академик А. А. Баев. Государственная программа «Геном человека» была принята в этом же году в Советском Союзе. Позднее к программе подключились другие страны, и широкомасштабные координированные исследования стали проводиться под эгидой международной организации Human Genom Organisation (HUGO). На работу по секвенированию генома человека, осуществленную этим мировым консорциумом, было потрачено в сумме более 3 миллиардов долларов. В России членами этой организации являются сегодня около 80 российских ученых (председатель Российского совета по геному человека — академик Л. Л. Киселев). Из 24-х хромосом генома человека ученые России в основном концентрировались на 3-й, 13-й и 19-й хромосомах. При этом непосредственно секвенированием ДНК они занимались очень мало, основное внимание было обращено на структурно-функциональные исследования генома. В материальном отношении наш вклад был настолько скромен, что сейчас при общих подсчетах его вообще не учитывают.
Первоначально огромный объем предстоящей работы очень пугал многих исследователей. И действительно ситуация на первых этапах не была слишком обнадеживающей. В первые 2 года работы проекта «Геном человека» скорости секвенирования были еще очень низкими. Для полного завершения работы такими темпами потребовалось бы около 100 лет. Это удручало одних исследователей, но не останавливало других. Последним стало очевидно, что решение данной задачи невыполнимо традиционными методами и необходим поиск новых подходов и технологий расшифровки нуклеотидных последовательностей фрагментов ДНК, а также создание новой вычислительной техники и оригинальных компьютерных программ. Все это, конечно, было невыполнимо в рамках отдельно взятого государства. По этой причине к проекту были привлечены около 20 различных стран, организован международный банк данных, куда поставлялась вся информация, полученная в процессе решения данной задачи. В результате технических новаций постепенно возрастала производительность аппаратуры, стали использовать промышленные роботы, многие процессы были автоматизированы. И вскоре скорость секвенирования достигла 10 млн. нуклеотидных пар в сутки! Теперь уже выполнение проекта стало реальностью. За 1995 г. длина участков ДНК человека с установленной последовательностью нуклеотидов увеличилась почти в 10 раз, но это составляло еще менее 0,001% от всего генома человека. К началу 1998 г. было секвенировано всего около 3% генома.
Примерно в это время к работе по секвенированию ДНК человека неожиданно присоединилась частная американская компания из штата Мериленд «Celera Genomics» под руководством Крега Вентера, которая объявила, что закончит свою работу на 4 года раньше международного консорциума. Это сильно подхлестнуло всех участников.
Следует отметить, что два конкурирующих коллектива — HUGO и Celera — использовали в своей работе разные подходы к секвенированию ДНК. Эту разницу можно сравнить с процессом создания подробной маршрутной карты. Можно описать подробнейшим образом каждую горку, каждую канавку, каждый бугорок. А можно описать весь путь, но при этом отметить только наиболее важные участки. Международный консорциум применил в своей работе традиционный метод, который заключался в том, что «кусочки» молекул ДНК выстраивали друг за другом: сначала делали карты хромосом, а потом по ним «прогуливались». Таким образом, ученые теряли время на подготовке материала, картировании, но выигрывали в секвенировании — не нужно было помногу раз делать одно и то же. Руководитель компании «Селера» Крег Вентер предложил ускоренный вариант, так называемый «шрапнельный» метод расшифровки структуры целого генома. Этот метод предусматривает разделение всего генома на небольшие фрагменты ДНК без предварительного их картирования, а затем расшифровку последовательностей с использованием высокопроизводительных автоматов и «сборку» фрагментов в нужном порядке с помощью суперкомпьютера с учетом соответствия перекрывающихся нуклеотидных последовательностей на концах фрагментов. Все это напоминает сборку гигантского неизвестного паззла по отдельным совершенно абстрактным его фрагментам. Метод, конечно, казался очень простым, но при этом одни и те же «кусочки» неизбежно попадали в аппарат-секвенатор по 10, а то и по 20 раз. «Celera», конечно же, теряла на том, что по многу раз секвенировала одни и те же фрагменты, поскольку до начала их секвенирования ничего о них не знала. Это казалось многим непроизводительной тратой средств и времени. Но в конечном итоге в результате использования своего подхода «Селера» сильно сэкономила время и деньги на предварительной подготовке материала, так как нужно было только раздробить ДНК на фрагменты и не заниматься трудоемким процессом их предварительного картирования. Кроме того, «Селера» почти с самого начала использовала специальный робот, который способен автоматически расшифровывать ДНК. Этот робот обладал способностью метить разные «буквы» ДНКового текста различными флюоресцирующими красками, а затем с помощью лазера считывать последовательности цветов, как последовательность букв. Огромный объем информации обрабатывался с помощью уникального суперкомпьютера. Celera по-латински обозначает «быстрая». И компания оправдала свое название. Еще в 1995-м году на основе предложенного Вентером подхода было осуществлено секвенирование генома бактерии Haemophilus influenzae. А когда «Селера» приступила к секвенированию генома человека, то и здесь добилась большого успеха, быстро встав по числу секвенированных нуклеотидных последовательностей генома человека вровень с международным консорциумом.