Методы генома. Исследования генома человека

Как наука генетика возникла на рубеже XIX и XX веков. Многие официальной датой ее рождения считают 1900 год, когда Корренс, Чермак и де Фриз независимо друг от друга обнаружили определенные закономерности в передаче наследственных признаков. Открытие законов наследственности состоялось, по существу, вторично - еще в 1865 году чешский ученый-естествоиспытатель Грегор Мендель получил те же результаты, экспериментируя с садовым горохом. После 1900 года открытия в области генетики следовали одно за другим, исследования, посвященные строению клетки, функциям белков, строению нуклеиновых кислот, открытых Мишером в 1869 году, шаг за шагом приближали человека к разгадке тайн природы, создавались новые научные направления, совершенствовались новые методы. И, наконец, в конце XX века генетика вплотную подошла к решению одного из фундаментальных вопросов биологической науки - вопроса о полной расшифровке наследственной информации о человеке.

В реализации грандиозного проекта по расшифровке генетического кода ДНК, получившего название HUGO (Human Genome Organization) приняли участие 220 ученых из разных стран, в том числе и пять советских биологов. В нашей стране была создана собственная программа «Геном человека», руководителем которой стал академик Александр Александрович Баев.

Впервые идея организации подобной программы была выдвинута в 1986 году. Тогда идея показалась неприемлемой: геном человека, то есть совокупность всех его генов содержит около трех миллиардов нуклеотидов, а в конце 80-х годов затраты на определение одного нуклеотида составляли около 5 долларов США. Кроме того технологии 80-х позволяли одному человеку определять не более 100 000 нуклеотидов в год. Тем не менее, уже в 1988 году Конгресс США одобрил создание американского проекта исследований в этой области, руководитель программы Дж. Уотсон так определил ее перспективы: «Я вижу исключительную возможность для улучшения человечества в ближайшем будущем». Осуществление российской программы началось в 1989 году.

Сейчас определение одного нуклеотида обходится всего в один доллар, созданы аппараты, способные секвенировать (от лат. sequi - следовать) до 35 млн. последовательностей нуклеотидов в год. Одним из важных достижений стало открытие так называемой полимеразной цепной реакции, позволяющей из микроскопических количеств ДНК за несколько часов получить объем ДНК, достаточный для генетического анализа. По оценкам специалистов существует возможность завершения проекта через 15 лет, и уже сейчас программа приносит полезные результаты. Суть работ заключается в следующем: сначала проводится картирование генома (определение положения гена в хромосоме), локализация некоторых генов, а после этого секвенирование (определение точной последовательности нуклеотидов в молекуле ДНК). Первым геном, который удалось локализовать, стал ген дальтонизма, картированный в половой хромосоме в 1911 году. К 1990 году число идентифицированных генов достигло 5000, из них картированных 1825, секвенированных - 460. Удалось локализовать гены, связанные с тяжелейшими наследственными болезнями, такими, как хорея Гентингтона, болезнь Альцгеймера, мышечная дистрофия Дюшена, кистозный фиброз и др.


Таким образом, проект исследования генома человека имеет колоссальное значение для изучения молекулярных основ наследственных болезней, их диагностики, профилактики и лечения. Следует обратить внимание на то, что за последние десятилетия в индустриально развитых странах доля наследственных болезней в общем объеме заболеваний значительно увеличилась. Именно наследственностью обусловлена предрасположенность к раковым и сердечно-сосудистым заболеваниям. В значительной степени это связано с экологической ситуацией, с загрязнением окружающей среды, так как многие отходы промышленности и сельского хозяйства являются мутагенами, то есть изменяют человеческий генофонд. Учитывая современный уровень развития генетики можно предположить, что научные открытия будущего позволят путем изменения генома адаптировать человека к неблагоприятным условиям внешней среды. Что же касается борьбы с наследственными заболеваниями, то их лечение путем замены больных генов на здоровые кажется реальным уже сейчас. Все это означает, что человек получит возможность не только изменять живые организмы, но и конструировать новые формы жизни. В связи с этим возникает целый ряд серьезных вопросов.

На мой взгляд одним из наиболее важных вопросов является вопрос об использовании генетической информации в коммерческих целях. Несмотря на то, что и участники проекта HUGO, и представители международных организаций, в частности ЮНЕСКО, единодушны в том, что любые результаты исследований по картированию и секвенированию генома должны быть доступны всем странам и не могут служить источником прибыли, частный капитал начинает играть все большую роль в генетических исследованиях. Когда появилась программа HUGO, возникли так называемые геномные компании, которые занялись самостоятельно занялись расшифровкой генома. В качестве примера можно привести американскую организацию под названием Institute of Genomic Research (TIGR) или компанию Human Genome Sciences Inc. (HGS). Между крупными фирмами идет ожесточенная борьба за патенты. Так в октябре 1994 Крэк Вентер, глава вышеупомянутой компании TIGR, о том, что в распоряжении его корпорации находится библиотека из 35000 фрагментов ДНК, синтезированных с помощью РНК на генах, полученных лабораторным путем. Эти фрагменты сравнили с 32 известными генами наследственных заболеваний. Оказалось, что 8 из них полностью идентичны, а 19 гомологичны. TIGR оказался обладателем ценнейшей научной информации, но его руководители заявили, что химическое строение всех последовательностей из этой библиотеки засекречено и будет сделано достоянием гласности только в том случае, если за компанией будет признано право собственности на все 35000 фрагментов. Это не единственный случай, а между тем, развитие генетики намного опережает развитие соответствующей законодательной базы. Хотя шаги в этом направлении предпринимаются (в России, например, в конце 1996 года был принят закон "О государственном регулировании в области генно-инженерной деятельности", в1995 был принят закон о биоэтике во Франции, в США Акт о гражданских правах запрещает дискриминацию при найме на работу по расовым, половым, религиозным и национальным признакам, при этом ген серповидноклеточной анемии, в частности у негров, может считаться расовым признаком, другой закон запрещает дискриминацию при найме на работу лиц с пониженной трудоспособностью, а таковыми могут считаться и лица с отягощенной наследственностью, большое значение имеет так называемый принцип Тарасовой, обязывающий врачей нарушать конфиденциальность врачебных сведений с целью предотвращения возможного вреда обществу), международных актов, регулирующих все стороны деятельности, связанной с генетикой, пока не существует.

5710 0

Существует точка зрения, которую разделяет немалое число специалистов, что все заболевания человека за исключением травм связаны с генетическими дефектами. Очевидно, это крайняя точка зрения, тем не менее она отражает важность генетических факторов в определении состоянии здоровья людей. Генетические дефекты бывают разной значимости и состояния.

Хотя обычно считают диабет и мышечную дистрофию заболеванием, а расщепление неба или цветовую слепоту - наследственными дефектами - все это является результатом мутаций в генетическом материале. Показано также, что предрасположенность к заболеванию также зависит от генетической конституции.

Генетические дефекты или мутации в последовательности ДНК выражаются в замене одного нуклеотида другим, потере целого фрагмента или его переносе на другое положение в геноме и пр. Такие изменения могут привести к изменениям структуры (и функции) белка, который кодируется данным фрагментом ДНК или к изменению регуляторных участков генов, гибельным для клеток. Говоря о наследственных заболеваниях, мы имеем в виду мутации, которые появляются в половых клетках и передаются потомству.

В соматических клетках на протяжении жизни также накапливаются мутации, которые могут стать причиной заболевания, но они по наследству не передаются. Ранее считалось, что все мутации вредны. Это связано с тем, что именно с таких мутаций, вызывающих заболевания, было начато изучение генетических характеристик человека. Но сейчас, когда прочитан практически весь нуклеотидный текст человека, стало ясно, что большая часть мутаций является нейтральной. Вредные мутации, приводящие к грубому нарушению развития организма, отсеиваются отбором - их носители не выживают или не дают потомства.

Огромный прорыв в понимании, как унаследованные гены влияют на физические и психологические особенности человека, произошел за последние десятилетия благодаря открытиям, сделанным при исследовании генома человека. Установлены и диагностируются как целый ряд генетических заболеваний, так и предрасположенность к ним, причем на самых ранних этапах развития эмбриона. Большие надежды на расширение возможностей современной медицины связаны с реализацией проекта «Геном человека».

Реализация научного проекта «Геном человека»

Научный проект «Геном человека» - это международная программа, конечной целью которой являлось определение нуклеотидной последовательности (секвенирование) всей геномной ДНК человека, а также идентификация генов и их локализация в геноме (картирование). В 1988 г. Министерство энергетики США и Национальный институт здоровья США представили обширный проект, в задачи которого входило секвенирование геномов человека, а также бактерий, дрожжей, нематоды, плодовой мушки и мыши - организмов, которые широко использовались в качестве модельных систем в изучении генетики человека.

На реализацию этого проекта Конгресс выделил 3 млрд дол. (по одному доллару за каждый нуклеотид человеческого генома). Директором проекта был назначен лауреат Нобелевской премии Джеймс Уотсон. К проекту присоединились другие страны - Англия, Франция, Япония и др.

В 1989 г. по инициативе академика А.А. Баева в нашей стране был организован научный совет по программе «Геном человека». В 1990 г. была создана Международная организация по изучению генома человека (HUGO), вице-президентом которой в течение нескольких лет был академик А.Д. Мирза-беков. Независимо от вклада и государственной принадлежности отдельных участников программы с самого ее начала вся получаемая ими в ходе работ информация была открыта и доступна для всех его участников.

Двадцать три хромосомы человека были поделены между странами-участницами. Российские ученые должны были исследовать структуры 3-й и 19-й хромосом. Однако вскоре финансирование работ по этому проекту было сильно сокращено, и реального участия в секвенировании наша страна не принимала. Тем не менее работы по геномному проекту в нашей стране не прекратились: программа была пересмотрена и сконцентрирована на развитии биоинформатики -математических методов, вычислительной техники, программного обеспечения, совершенствовании способов описания и храненеия геномной информации, которые бы помогли понять и осмыслить расшифрованную информацию.

На расшифровку генома человека было отведено 15 лет. Однако постоянное развитие технологии секвенирования позволило завершить проект на 2 года раньше. Немалую роль в интенсификации работ сыграла частная американская компания Celera, возглавляемая Дж. Вентером (в прошлом - биолог Национального института здоровья США). Если в начальные годы осуществления проекта по всему миру секвенировали несколько миллионов нуклеотидных пар в год, то в конце 1999 г. Celera расшифровывала не менее 10 млн нуклеотидных пар в сутки. Для этого работы велись круглосуточно в автоматическом режиме 250 роботизированными установками, информация сразу же передавалась в банки данных, где систематизировалась, аннотировалась и выкладывалась в Интернет.

При проведении работ в 1995 г. Вентер с соавторами разработал и опубликовал совершенно новый подход к секвенированию генома, названный методом произвольного секвенирования полного генома (более известный как произвольное секвенирование методом дробления), который позволял собрать полный геном из частично секвенированных фрагментов ДНК при помощи компьютерной модели.

Этим методом впервые был полностью секвенирован геном самореплицирующегося свободно живущего организма - бактерии Haemophilus in-fluenzae Rd. Копии ДНК бактерии были разрезаны на куски произвольной длины от 200 до 1 600 п.о. Эти фрагменты секвенировали по несколько сот с каждого конца. Кроме того, были секвенированы и более длинные фрагменты по 15-20 тыс. п.о. Полученные последовательности были внесены в компьютер, который их сравнивал, распределял по группам и по сходству.

Первыми идентифицировались неповторяющиеся последовательности, затем -повторяющиеся последовательности фрагментов. Длинные фрагменты помогали установить порядок часто повторяющихся, почти идентичных последовательностей. Затем заполнялись пробелы между полученными основными кусками ДНК. Секвенирование генома Haemophilus influenzae заняло один год и при этом была определена последовательность 1 830 137 п.о. и 1 749 генов, расположенных на 24 304 фрагментах.

Это был несомненный успех, который доказал, что новая технология может быть применима для быстрого и точного секвенирования целых геномов. В 1996 г. картировали геном первой эукариотической клетки - дрожжевой, а в 1998 впервые секвенировали геном многоклеточного организма - круглого земляного червя Caenorhabolits elegans.

В феврале 2001 г. рабочий вариант генома человека (выполненный на 90 %) был одновременно опубликован в журналах «Nature» - результаты HUGO и «Science» - результаты исследований компании Celera. Анализ полученного варианта генома человека выявил около 25 тыс. генов. Ранее предполагалось, что это количество должно достигать 140 тыс. (если исходить из постулата «один ген кодирует один белок»). В настоящее время представляется возможным, что один ген может кодировать 5-6 белков. Многообразие белков, кодируемых одним и тем же геном, обеспечивается несколькими механизмами: с помощью альтернативного сплайсинга, посттрансляционных превращений белков - фосфорилирования, ацетилирования, метилирования, гликозилирования и многих других.

В 2003 г. был опубликован окончательный вариант полной последовательности генома человека. Вся эта информация является доступной и находится в Интернете на нескольких сайтах. Однако до сих пор некоторые элементы генома не поддаются секвенированию современными технологиями, а наши знания о геноме остаются неполными. Оказалось, что лишь 30 % генома кодируют белки и участвуют в регуляции действия генов.

Каковы функции остальных участков генома и есть ли они вообще, остается совершенно неясным. Около 10 % генома составляют так называемые Alu-элементы длиной около 300 п.о. Они появились неизвестно откуда в ходе эволюции только у приматов. Попав к человеку, они размножились до полумиллиона копий и распределились по хромосомам самым причудливым образом.

Что касается кодирующих участков ДНК, то при чисто молекулярно-компьютерном анализе они были названы генами по сугубо формальным критериям: наличию знаков пунктуации, необходимых для прочтения информации и синтеза конкретного генного продукта. При этом время и действие большинства потенциальных генов пока неясны, и для определения их функций может потребоваться не меньше ста лет.

Н.А. Воинов, Т.Г. Волова

Начальными этапами изучения генома человека можно считать разработку методов определения последовательности нуклеотидов или секвенирования ДНК (Гилберт У., Берг П., Сенджер Ф.), за которую в 1980 г была присуждена Нобелевская премия по химии. Через четыре года начались работы по полному секвенированию генома человека (Human Genome Projekt, финансированный конгрессом США - 3 млрд. долларов). К 2003 г была завершена полная расшифровка нуклеотидной последовательности генома человека. Последней была секвенирована самая большая хромосома человека (№ 1). Теперь каждый желающий теоретически может секвенировать весь свой геном за несколько минут, что обойдется ему в 1500 долларов.

В настоящее время считают, что в геноме человека 20-25 тысяч структурных генов, причем только 1% всей ДНК приходится на экзоны. Достаточно людям взглянуть друг на друга, чтобы понять, что существует генетическая вариабельность вида Homo sapiens. Структура геномов разных рас и национальностей идентична на 99,9%, а индивидуальная вариабельность составляет 0,1%. Различия между генотипами людей обусловлены в основном мутациями. Такую вариабельность и называют генетическим полиморфизмом, под которым понимают небольшие различия нуклеотидной последовательности, дающие нормальный фенотип. К полиморфизмам относят, например, однонуклеотидные замены – SNP, которые встречаются через каждые 300-400 п.о. в геноме человека. Большинство этих SNP располагаются в некодирующих участках. SNP легко идентифицировать ввиду их стабильности, и они могут использоваться в качестве маркеров для картирования генов, ответственных за такие мультифакториальные болезни, как диабет и атеросклероз. В настоящее время идентифицировано 4,0 млн. SNP, среди них значимыми внутригенными SNP являются 2,6 млн.

Следующим этапом исследования генома человека являлась программа ENCODE «Encyclopedia of DNA Elements». Геном человека или число нуклеотидов в гаплоидном наборе клетки насчитывает 3 млрд. пар оснований, из которых 10-20% являются кодирующими, а 80-90% являются некодирующими последовательностями, и поэтому основная часть ДНК не несет информацию о структуре белков, составляющих основу любого живого организма. Некодирующие последовательности представлены повторами разной протяженности, и для половины из них функции пока не известны, но предполагается, что в них содержится информация о программе индивидуального развития, которую называют партитурой «симфонии жизни». Именно она регулирует работу генов, процессинг РНК, точность матричных процессов, конъюгации и кроссинговера. Некодирующая ДНК может обеспечить компартментализацию геномов разных видов или может создавать основу для большей генетической изменчивости. Транскрибируемая часть генома составляет лишь 10%, причем из них 25% приходится на синтез РНК, и 5% транслируется до белков.



По данным ENCODE последовательности ДНК, не несущие инфрмацию о структуре белка, кодирует разные виды РНК - тРНК, рРНК и регуляторные РНК: малые интерферирующие РНК (small interfering RNA, si RNA) и микроРНК (microRNA, mi RNA). Все малые регуляторные РНК влияют на экспрессию генов на разных уровнях – синтеза РНК и посттранскрипционных модификаций, сплайсинга пре-РНК, стабилизации РНК, трансляции, они участвуют в геномном импринтинге, метилировании ДНК и ремоделировании хроматина. Действие таких РНК основано на феномене РНК-интерференции, суть которого заключается в подавлении экспрессии генов на уровне транскрипции или трансляции.

Указанные выше si RNA работают как кофакторы РНК-азных комплексов, вызывающих деградацию определенных ненужных клетке и-РНК. РНК-интерференцию можно использовать для нокдауна генов. Различают понятия «нокаут» и «нокдаун» генов. При нокауте гена индуцируются мутации, повреждающие и выключающие ген. При нокдауне гена вызывается деградация синтезированной с него и-РНК с помощью si-RNA. Введение siРНК в клетки пациентов является частью инновационной стратегии, снижающей активность генов, при лечении некоторых видов рака, гепатита и других заболеваний.

Микро РНК - mi RNA класс некодирующих шпилечных РНК, которые имеют длину около 22 нуклеотидов. Структура mi-РНК закодирована в геноме, гены mi-РНК расположены в областях инвертированных повторов интронов белок - кодирующих генов, в экзонах или межгенных областях. Они могут временно выключать трансляцию белков за счет своей гибридизации с комплементарным участком и-РНК, образуя двойную спираль РНК-РНК в норме не характерную для клеток.



Кроме того обнаружены другие классы регуляторных РНК, к которым относятся - малые ядерные РНК (snRNA), участвующие в сплайсинге иРНК; теломеразные РНК; малые ядрышковые РНК (snoRNA) и рибозимы - cRNA, участвующие в модификации других РНК; длинные некодирующие РНК - lincRNA (long noncocling RNAs) с неизвестной пока функцией, содержащие примерно более 200н; piRNA (piwi - interacting RNA)- короткие молекулы длиной в 24–30 нуклеотида, закодированные в центромерных и теломерных областях хромосомы, возможно участвующие в организации хроматина. Оказалось, что последовательности нуклеотидов piRNA комплементарны мобильным генетическим элементам и могут подавлять активность МГЭ на уровне транскрипции и репликации. Гены piRNA активны только в зародышевых клетках во время эмбриогенеза.

Все виды регуляторных РНК синтезируются с ¾ нашего генома, т.е. примерно 80,4% геномных последовательностей так или иначе участвуют в регуляторных процессах.

Оказалось, что у больных с наследственной патологией одинаковые SNP-замены расположены в генах регуляторных РНК, а не в структурных генах белков.

3. Методы изучения мутаций у человека .

В зависимости от типа мутации, которую предполагают выявить у человека, используют либо цитогенетические, либо молекулярно-генетические методы. С помощью цитогенетических методов можно выявлять у пациентов хромосомные и геномные мутации, а с помощью молекулярно-генетических – генные мутации.

25 апреля теперь уже далекого 1953 г. журнал Nature опубликовал небольшое письмо молодых и никому неизвестных Ф.Крика и Дж.Уотсона редактору журнала, которое начиналось словами: «Мы хотели бы предложить свои соображения по поводу структуры соли ДНК. Эта структура имеет новые свойства, которые представляют большой биологический интерес». Статья содержала около 900 слов, но – и это не преувеличение – каждое из них было на вес золота.

«Ершистая молодежь» посмела выступить против нобелевского лауреата Лайнуса Полинга, автора знаменитой альфа-спирали белков. Полинг буквально накануне опубликовал статью, согласно которой ДНК представляла собой трехцепочечную спиральную структуру, наподобие девичьей косы. Тогда никто не знал, что у Полинга был просто недостаточно очищенный материал. Но и Полинг оказался отчасти прав – сейчас трехцепочечность некоторых участков наших генов хорошо известна. Это свойство ДНК даже пытались одно время использовать в борьбе с раком, выключая с помощью олигонуклеотидов те или иные раковые гены (онкогены).

Биологии нуклеиновых кислот долго не везло. Достаточно сказать, что первую нобелевскую премию за открытие строения нуклеотидов немец А.Коссель получил еще в 1910 г. А знаменитая реакция Фельгена для окрашивания ДНК была предложена накануне Первой мировой войны и усовершенствована в 1920-е гг. Тогда и могла бы начаться новая эра биологии, однако...

Однако биологи были уверены, что «монотонная» ДНК с ее только четырьмя различающимися основаниями просто не могла нести генетическую информацию о миллионах самых разнообразных белков. И хотя уже применялась азбука Морзе с тремя кодирующими элементами, менталитет исследователей еще не достиг уровня информационной эры с ее двоичной системой записи («0» и «1») любой информации.

Лишь к началу 1950-х гг. отдельные ученые стали обращать внимание на ДНК, роль которой в передаче наследственных признаков у микроорганизмов установил в 1943 г. Освальд Эйвери. Результатам Эйвери поверил Сальвадор Лурия, который вместе с Максом Дельбрюком организовал неподалеку от Нью-Йорка лабораторию на биостанции в местечке Колд-Спринг Харбор.

Заметим в скобках, что физик М.Дельбрюк был учеником Н.В. Тимофеева-Ресовского в биологии и соавтором их совместной с К.Циммером знаменитой статьи, посвященной определению размеров гена. Лурия с Дельбрюком изучали жизненный цикл бактериофагов – вирусов микроорганизмов, в результате чего и пришли к предположениям о биологической роли ДНК. Лурия послал своего аспиранта Джеймса Уотсона в Кавендишскую лабораторию в Кембридже, где Морис Уилкинс и Розалинд Франклин исследовали строение ДНК с помощью рентгена (англичане лидировали в рентгеноструктурном анализе биомолекул).

В лаборатории Уилкинса работал также еще довольно молодой физик Фрэнсис Крик, известный в узких лабораторных кругах своим научным скепсисом: для него просто не существовало никаких авторитетов, чем он и заработал себе репутацию скандалиста. Статью Полинга в лабораторию принес его сын, который помог, кстати, Уотсону и Крику уяснить роль попарного комплементарного соединения азотистых оснований. Статья стала последней каплей перед озарением, или пониманием... тем, что оформилось в открытие молодых ученых.

Научное сообщество, однако, не сразу признало их открытие. Достаточно сказать, что сначала Нобелевскую премию за работы в области ДНК «судьи» из Стокгольма присудили в 1959 г. известным американским биохимикам Северо Очоа и Артуру Корнбергу. Очоа был первым (1955), кто сумел синтезировать рибонуклеиновую кислоту (РНК). Корнберг же получил премию за синтез ДНК в пробирке (1956).

В 1962 г. настал черед Крика, Уотсона и Уилкинса. Р.Франклин к тому времени уже умерла от рака в возрасте 37 лет, иначе это был бы единственный случай в истории Нобелевских премий, когда награду вручили бы четверым, хотя это и не допускается уставом. Вклад Франклин в развитие рентгеноструктурного анализа ДНК был просто неоценим.

После открытия Уотсона и Крика важнейшей проблемой стало выявление соответствия между первичными структурами ДНК и белков. Поскольку в составе белков обнаруживается 20 аминокислот, а нуклеиновых оснований всего 4, то для записи информации о последовательности аминокислот в полинуклеотидах необходимо не менее трех оснований. На основании таких общих рассуждений варианты «трехбуквенных» генетических кодов предложили физик Г.Гамов и биолог А.Нейфах. Однако их гипотезы были чисто умозрительными и не вызвали большого отклика среди ученых.

Трехбуквенный генетический код к 1964 г. расшифровал Ф.Крик. Вряд ли он тогда предполагал, что в обозримом будущем станет возможной расшифровка генома человека. Эта задача долгое время казалась неразрешимой. Однако два открытия позволили сдвинуть проблему с места.

В 1970 г. не известные широкой научной общественности Г.Темин и Д.Балтимор опубликовали в Nature статьи, посвященные обратной транскриптазе (ОТ) – ферменту РНК-содержащих, в том числе раковых, вирусов, которые синтезируют ДНК на матрице РНК, т.е. осуществляют реакцию, обратную той, которую до тех пор наблюдали в клетках.

Открытие обратной транскриптазы позволило выделить первые гены. Но процесс этот был крайне трудоемким и чрезвычайно дорогим. А спустя 15 лет некий химик из Калифорнии предложил на суд коллег уникальную полимеразную цепную реакцию (ПЦР), сразу же ставшую знаменитой. В этой реакции фермент, полимераза, «ходит как челнок» по фрагменту ДНК, поэтому ПЦР позволяет нарабатывать любые количества этого фрагмента, необходимые для анализа*.

ПЦР, а также появление новейшей электронной техники и компьютеров сделали вполне реальной задачу расшифровки всего генома человека. Долгие дебаты закончились в конце сентября 1988 г., когда во главе проекта HUGO – Организации по расшифровке генома человека – был поставлен Дж.Уотсон.

Журнал Time назвал в связи с этим Уотсона «охотником за генами». Сам же ученый сказал следующее: «Это захватывающая перспектива. Тридцать лет назад мы не могли и мечтать о том, чтобы узнать структуру генома даже мельчайшего вируса. А сегодня мы уже расшифровали геном вируса СПИДа и почти полностью прочитали геном кишечной палочки объемом в 4,5 млн букв ген-кода. Точное знание детальной структуры генома человека – это восхитительно!».

И вот геном прочитан
Завершение работ по расшифровке генома человека консорциумом ученых планировалось к 2003 г. – 50-летию открытия структуры ДНК. Однако конкуренция сказала свое слово и в этой области.

Крейг Вентер основал частную компанию «Селера», которая продает генные последовательности за большие деньги. Включившись в гонку по расшифровке генома, она за один год сделала то, на что у международного консорциума ученых из разных стран ушло десять лет. Это стало возможным благодаря новому методу чтения генетических последовательностей и использованию автоматизации процесса чтения.

Итак, геном прочитан. Казалось бы, надо радоваться, но ученые пришли в недоумение: уж очень мало генов оказалось у человека – примерно в три раза меньше, чем ожидалось. Раньше думали, что генов у нас около 100 тыс., а на самом деле их оказалось около 35 тыс. Но даже не это самое главное.

Недоумение ученых понятно: у дрозофилы 13 601 ген, у круглого почвенного червя – 19 тыс., у горчицы – 25 тыс. генов. Столь малое количество генов у человека не позволяет выделить его из животного царства и считать «венцом» творения.

Зато там, где располагаются гены, активность ДНК и ферментов, синтезирующих ее копии в виде молекул информационной РНК, повышается в 200–800 раз! Это – «горячие точки» генома.

В геноме человека ученые насчитали 223 гена, которые сходны с генами кишечной палочки. Кишечная палочка возникла примерно 3 млрд лет назад. Зачем нам такие «древние» гены? Видимо, современные организмы унаследовали от предков какие-то фундаментальные структурные свойства клеток и биохимические реакции, для которых необходимы соответствующие белки.

Нет поэтому ничего удивительного и в том, что половина белков млекопитающих имеют сходство аминокислотных последовательностей с белками мухи дрозофилы. В конце концов мы дышим одним и тем же воздухом и потребляем животные и растительные белки, состоящие из одних и тех же аминокислот.

Удивительно, что с мышью мы имеем 90% общих генов, а с шимпанзе – вообще 99%!

В нашем геноме много последовательностей, доставшихся нам в «наследство» от ретровирусов. Эти вирусы, к которым относятся вирусы рака и СПИДа, вместо ДНК в качестве наследственного материала содержат РНК. Особенностью ретровирусов является, как уже говорилось, наличие обратной транскриптазы. После синтеза ДНК по РНК вируса вирусный геном встраивается в ДНК хромосом клетки.

Таких ретровирусных последовательностей у нас много. Время от времени они «вырываются» на волю, в результате чего возникает рак (но рак в полном соответствии с законом Менделя проявляется лишь у рецессивных гомозигот, т.е. не более чем в 25% случаев). Совсем недавно было сделано открытие, которое позволяет понять не только механизм встраивания вирусов, но и назначение некодирующих последовательностей ДНК. Оказалось, что для встраивания вируса необходима специфическая последовательность из 14 букв генетического кода. Таким образом, можно надеяться, что вскоре ученые научатся не только блокировать агрессивные ретровирусы, но и целенаправленно «внедрять» нужные гены, и генотерапия из мечты превратится в реальность.

В организме млекопитающих ретровирусы играют и еще одну немаловажную роль. В отношении млекопитающих, у которых плод развивается внутри организма матери, правомерен вопрос: почему иммунная система матери позволяет развиваться организму, который наполовину генетически ей чужероден, поскольку половина генома плода отцовская?

Все дело в ретровирусах, которые блокируют активность иммунных Т-лимфоцитов, ответственных за отторжение органов и тканей, содержащих чужеродные белки, например, после трансплантации органов. Эти ретровирусы активируются в геноме клеток плаценты, которая образуется тканями плода.

Недавно был обнаружен вирус, который блокирует развитие (экспрессию) ретровируса. Если этим вирусом-блокатором заразить беременную мышь, то мышата рождаются нормальными и в срок. Но если его ввести в клетки плаценты, то происходит выкидыш плода, так как активируются Т-лимфоциты матери.

Не стоит забывать, что ретровирусные последовательности возникают также непосредственно на концах хромосом – теломерах. Как известно, теломеры состоят из одноцепочечной ДНК, которая синтезируется ферментом теломеразой по матрице РНК. Считается, что теломеры являются нашими молекулярными часами, поскольку они укорачиваются с каждым клеточным делением. Раньше считалось, что в теломерах нет генов, однако расшифровка генома показала, что генов там довольно много и они активны в детстве и молодом возрасте, постепенно «угасая» по мере старения организма.

Не так уж бездеятельны и тандемные повторы. В норме они имеют определенное число повторяющихся троек, пятерок и даже семерок букв. Но в некоторых случаях в результате мутаций число повторов начинает нарастать, что ведет к нестабильности генома. Дело доходит даже до «поломок» концов хромосом. Фрагментация концевых участков хромосомы может привести к перемещениям (транслокации) участков ДНК в другую хромосому, а также синтезу таких форм белка, которые вызывают гибель нервных клеток, как это наблюдается при наследственной хорее Гентингтона.

К.Вентер говорил, что понимание генома потребует сотни лет. Ведь мы до сих пор не знаем функций и роли более чем 25 тыс. генов. И даже не знаем, как подступиться к решению этой задачи, поскольку большинство генов просто «молчит» в геноме, никак себя не проявляя.

Следует учитывать, что в геноме накопилось множество псевдогенов и генов-«перевертышей», которые также неактивны. Похоже, что некодирующие последовательности являются как бы изолятором активных генов. В то же время, хотя генов у нас и не слишком много, они обеспечивают синтез до 1 млн (!) самых разных белков. Как же это достигается при таком ограниченном наборе генов.

Как оказалось, в нашем геноме существует специальный механизм – альтернативный сплайсинг. Заключается он в следующеем. На матрице одной и той же ДНК происходит синтез разных альтернативных и-РНК. Сплайсинг и означает «расщепление», когда образуются разные молекулы РНК, которые как бы «расщепляют» ген на разные варианты. Этот приводит к невообразимому разнообразию белков при ограниченном наборе генов.

Функционирование генома человека, как и всех млекопитающих, регулируется различными транскрипционными факторами – специальными белками. Эти белки связываются с регуляторной частью гена (промотером) и таким образом регулируют его активность. Одни и те же факторы могут по-разному проявлять себя в разных тканях. У человека есть свои собственные, присущие только ему, транскрипционные факторы. Выявить эти чисто человеческие особенности генома еще только предстоит ученым.

СНП
Существует и еще один механизм генетического разнообразия, который выявился только в процессе прочтения генома. Это сингулярный нуклеотидный полиморфизм, или, так называемые факторы СНП.

Полиморфизмом в генетике называют ситуацию, когда гены одного и того же признака существуют в разных вариантах. Примером полиморфизма, или, другими словами, множественных аллелей, служат группы крови, когда в одном хромосомном локусе (участке) могут находиться варианты генов А, В или О.

Сингулярность по-латыни означает одиночество, что-то единственное. СНП – это изменение «буквы» генетического кода без «последствий для здоровья». Считается, что у человека СНП встречается с частотой 0,1%, т.е. каждый человек отличается от других одним нуклеотидом на каждую тысячу нуклеотидов. У шимпанзе, представляющей собой более древний вид, и к тому же гораздо более гетерогенный, число СНП при сравнении двух разных особей достигает 0,4%.

Но если различия в СНП не сказываются на здоровье особей, то чем они интересны и важны? Во-первых, изучение СНП имеет большое теоретическое значение. Именно они позволяет сравнивать возрасты популяций и определять пути их миграции. Так, например, в мужской половой хромосоме (Y) выделены 22 фактора СНП, анализ которых у 1007 европейцев позволил определить, что 80% европейских мужчин имеют сходный «СНП-паттерн», т.е. «рисунок». Это говорит о том, что тысячи поколений назад 4/5 европейских мужчин имели общего предка!

Но и практическое значение СНП велико. Возможно, не все знают, что сегодня самые распространенные лекарства эффективны не более чем для четверти населения. Минимальные генетические отличия, обусловленные СНП, определяют эффективность лекарств и их переносимость в каждом конкретном случае. Так, у больных диабетом выявили 16 специфических СНП. Всего при анализе 22-й хромосомы определили местоположение 2730 СНП. В одном из генов, кодирующих синтез рецептора адреналина, выявлено 13 СНП, которые могут комбинироватьcя друг с другом, давая 8192 различных варианта (гаплотипа).

Насколько скоро и полно начнет использоваться полученная информация, пока не совсем ясно. Пока же приведем еще один конкретный пример.

Среди астматиков довольно популярно лекарство албутерол, который взаимодействует с указанным рецептором адреналина и подавляет приступ удушья. Однако из-за разнообразия гаплотипов людей лекарство действует не на всех, а некоторым больным оно вообще противопоказано. Это обусловлено СНП: люди с последовательностью букв в одном из генов ТЦТЦЦ (Т–тимин, Ц–цитозин) не реагируют на албутерол, если же концевой цитозин заменен на гуанин (ТЦТЦГ), то реакция есть, но частичная. Для людей же с тимином вместо концевого цитозина в этом участке – ТЦТЦТ – лекарство токсично!

Протеомика
Эта совершенно новая отрасль биологии, изучающая структуру и функции белков и взаимосвязи между ними, названа по аналогии с геномикой, занимавшейся геномом человека. Само рождение протеомики уже объясняет, зачем нужна была программа «Геном человека». Поясним на примере перспективы нового направления.

В далеком 1962 г. вместе с Уотсоном и Криком в Стокгольм были приглашены из Кембриджа Джон Кэндрью и Макс Перутц. Они были удостоены Нобелевской премии по химии за впервые осуществленную расшифровку трехмерной структуры белков миоглобина и гемоглобина, ответственных за перенос кислорода в мышцах и эритроцитах соответственно.

Напомним, что даже в начале 1990-х гг. расшифровка структуры каждого нового белка представляла значительные трудности. Каждый анализ занимал до десятка лет. И хотя сейчас вместо рентгеновских лучей используют ядерно-магнитный резонанс (ЯМР), однако времени и денег на определение пространственной структуры каждого белка уходит очень много.

Протеомика позволяет ускорить и удешевить эти работы. К.Вентер отметил, что он 10 лет потратил на выделение и секвенирование гена адреналинового рецептора человека, теперь же его лаборатория тратит на это 15 с. Еще в середине 90-х гг. нахождение «адреса» гена в хромосомах занимало 5 лет, в конце 90-х – полгода, а в 2001 г. – одну неделю! Кстати, ускорению определения положения гена помогает информация о СНП, которых сегодня насчитываются уже миллионы.

Вернемся к протеомике. Знание аминокислотных последовательностей и трехмерной структуры определенных белков позволило разработать программы сопоставления генетических последовательностей с аминокислотными, а затем программы предположительного расположения их в трехмерной структуре полипептидов. Знание трехмерной структуры позволяет быстро находить химические варианты молекул, в которых блокирован, например, активный центр, или определять положение активного центра у мутантного фермента.

Известно, что повышение артериального давления вызывается ферментом АСЕ, сокращенное название которого переводится с английского как ангиотензин-конвертирующий фермент. Образующийся под действием фермента ангиотензин воздействует на стенки артерии, что и ведет к гипертонии. Уже относительно давно были найдены блокаторы фермента АСЕ, которые стали продаваться в качестве лекарств от повышенного давления. Однако, эти лекарственные средства оказались малоэффективными.

Анализ генома позволил выделить ген АСЕ-2, который кодирует более распространенный и эффективный вариант фермента. Затем была определена виртуальная структура белкового продукта, после чего подобраны химические вещества, активно связывающиеся с белком АСЕ-2. Так был найден новый препарат против артериального давления, причем за вдвое меньшее время и всего лишь за 200 вместо 500 млн долларов!

Признаемся, что это был пример «догеномного» периода. Теперь же, после прочтения генома, на первый план выходит протеомика, цель которой – быстрее разобраться с тем миллионом белков, которые потенциально могут существовать в наших клетках. Протеомика позволит более тщательно диагностировать генетические отклонения и блокировать неблагоприятное действие мутантных белков на клетку.

А со временем можно будет планировать и «исправление» генов.

В настоящее время изучение геномов не ограничивается только картированием генов, стало возможным изучать последовательность расположения нуклеотидов в составе любого гена. Решающим шагом на пути к решению этой проблемы явилось применение особых ферментов рестрикционных эндонуклеаз и разработка метода клонирования генов.

Рестрикционные эндонуклеазы (рестриктазы) ферменты, расщепляющие ДНК в специфических участках нуклеотидных последовательностей, которые они распознают. Эти ферменты обнаружены у многих бактерий. Они определяют и разрушают чужеродные молекулы ДНК, попадающие в клетку, в том числе при инфицировании их фагами или при трансформации. Таких ферментов обнаружено более 100, и каждый из них распознает в ДНК специфическую последовательность из 4 6 нуклеотидов. Каждая рестриктаза способна разрезать двойную спираль ДНК любой длины. При этом образуется серия фрагментов, называемых рестрикционными фрагментами. Сравнение размеров этих фрагментов, полученных при обработке бактериальных или плазмидных геномов (а также ДНК хромосом эукариот), позволяет создавать рестрикционные карты, в которых отмечается локализация каждого разреза участка относительно соседних участков других таких разрезов (рестрикций).

Существенно, что многие рестриктазы вносят разрывы в обе цепи ДНК со смещением на несколько нуклеотидов. Вследствие этого на конце нити одного фрагмента образуется участок, нуклеотидные последовательности которого оказываются комплементарными нуклеотидным последовательностям другой нити с другого конца фрагмента. Такие концевые последовательности, комплементарные друг другу, получили название липких концов. С их помощью образовавшиеся рестрикционные фрагменты будут вновь образовывать кольца в результате спаривания липких концов. Способность рестрикционных нуклеаз разрезать ДНК с образованием липких концов широко используется в технологии создания рекомбинантных ДНК, так как при помощи таких концов можно соединить два любых фрагмента ДНК, если они получены с помощью одной и той же рестриктазы и, следовательно, имеют комплементарные липкие концы. После замыкания последних путем образования комплементарных пар оснований образовавшееся кольцо из фрагментов разных ДНК можно сшить ковалентными фосфодиэфирными связями между противоположными концами каждой нити ДНК с помощью ДНК-лигазы. В этом заключается суть технологии получения рекомбинантных молекул ДНК.

Ранее всего был изучен геном бактериального вируса ФХ174. Е го ДНК состоит из 5400 нуклеотидов и содержит 9 генов. Вирус ФХ174 можно увидеть только с помощью электронного микроскопа, а запись его генетической информации, содержащейся в 9 генах, в виде линейной последовательности через буквы (А, Т, Г, Ц) занимает целую страницу текста. Запись в таком же виде информации, имеющейся в хромосоме животной клетки, составит книгу объемом более 500000 страниц!

Изучение генома человека началось в 80-х гг. XX в. В последующем была создана Международная организация по изучению генома человека HUGO (от англ. Human Genome Organization организация генома человека). Изучением генома человека занимаются ученые США, Японии, ряда стран Европы, России и др.

Основная задача определить последовательное расположение всех нуклеотидов (а их 3,5 109 пар) во всех 23 парах хромосом человека. Предстоит выяснить молекулярные основы наследственных болезней и определить пути их лечения рано или поздно генотерапия станет вполне реальной. Уже сейчас осуществляется ДНК-диагностика более 100 наследственных болезней. После открытия структуры ДНК, гена и расшифровки генетического кода осуществление программы «Геном человека» будет означать самую фундаментальную революцию в биологии и медицине.