Генетика
Как расшифровывается ДНК
Лишь малая часть людей знает как расшифровывается ДНК. Более того, большинство людей (и я не исключение) затрудняются прочитать полное название с первого раза. Хотите попробовать?
Дезоксирибонуклеиновая кислота.
Да уж, словечко не из самых приятных. Нуклеиновые кислоты, такие как дезоксирибонуклеиновая кислота (ДНК) и рибонуклеиновая кислота (РНК) являются химическими переносчиками генетической информации клеток. В клеточной ДНК зашифрована информация, которая будет определять какую роль будет выполнять эта клетка, контролировать её рост и деление, и направлять биосинтез ферментов и белков, необходимых для жизни клетки. В дополнении к нуклеиновым кислотам в “чистом” виде, существуют еще производные нуклеиновых кислот, как например АТФ, которые выполняют не менее важные роли. АТФ являются этакой денежной валютой в мире молекул, поскольку именно она затрачивается при синтезе каких-нибудь сложных соединений.
Нуклеиновые кислоты являются последним из четырех основных классов биологических молекул, о которых мы будем говорить. Возможно, каждый из вас слышал о такой загадочной молекуле ДНК, которая определяет все ваши физические особенности, но вряд ли многие из вас знают что это такое с химической точки зрения.
Так же как белки сделаны из маленьких частичек – аминокислот, нуклеиновые кислоты сделаны из нуклеотидов, соединенных в длинную цепь. Каждый нуклеотид состоит из трех основных частей: углевода, азотистого основания и остатка фосфорной кислоты. В РНК углеводом является рибоза (отсюда и название: рибонуклеиновая кислота), а в ДНК углеводом является производное рибозы, которые называется дезоксирибоза и отличается лишь тем, что в нем находится на один атом кислорода меньше (и отсюда же и название: дезоксирибонуклеиновая кислота). В ДНК содержится четыре основных азотистых основания: аденин, тимин, гуанин и цитозин. В РНК вместо тимина можно встретить довольно похожее основание, которое называется урацил.
И хоть ДНК и РНК похожи с химической точки зрения, они значительно отличаются по размерам. Молекулы ДНК огромны и содержат около 245 миллионов нуклеотидов, а их молекулярная масса достигает 75 миллиардов грамм на моль. Молекулы РНК в сравнении гораздо меньше, самые маленькие содержат 21 нуклеотид и обладают массой в 7000 грамм на моль.
Несмотря на то, что клетки мозга и клетки кожи обладают совершенно разной структурой и выполняют совершенно разные биологические функции, они обладают совершенно одинаковым генетическим кодом, т.е. одинаковыми молекулами ДНК. При этом, примерно любая человеческая ДНК содержит по 30% аденина и тимина, и по 20% гуанина и цитозина. Более того, феномен равенства количеств тимина и аденина, гуанина и цитозина не является уникальным для человеческого организма. Это повсеместное явление в природе. Но почему?
В 1953 году, Джеймс Уотсон и Фрэнсис Крик обнаружили истинную вторичную структуру молекулы ДНК. Согласно их модели, ДНК состоит из двух цепочек из нуклеотидов, которые сворачиваются в витки двойной спирали, также как винтовые лестницы. Две цепочки не идентичны, а комплементарны и удерживаются водородными связями. Каждый Аденин (А) связывается с Тимином (Т), а каждый Гуанин (G) связывается с Цитозином (С) и наоборот. То есть, каждый раз как в одной цепочке встречается А, в другой цепочке будет Т. Этот факт обьясняет то, что мы видим одинаковые количества А и Т, G и С в любых живых организмах.
В среднем, каждый виток спирали ДНК содержит около 10 пар оснований (нуклеотидов). Как можно заметить из рисунка: две нити ДНК переплетаются таким образом, что образуются две разных по размерам бороздки: большая (12А в ширину) и малая (6А в ширину), где 1 А в 10 миллиардов раз меньше метра. Большая бороздка немного глубже, и как мы видим на картинке, все азотистые основания складываются в хорошие такие параллельные линии. Все дело в том, что эти основания содержат шестичленные и пятичленные ароматические циклы, которые по форме являются шести- и пятиугольниками. Их называют ароматическими потому, что они а) плоские и б) содержат много двойных связей. Эти самые двойные связи и могут стабилизировать структуру ДНК если, например, две двойных связи с двух разных ароматических молекул находятся строго параллельно друг под другом. Именно так и происходит в реальной структуре и мы видим параллельно-лежащие молекулы и пространство между ними. Большое количество полициклических ароматических молекул может пролезать в эти пространства, или на научном языке интеркалировать. Многие канцерогены (вещества вызывающие рак) и лекарства от рака функционируют именно взаимодействуя с ДНК методом интеркаляции.
Генетическая информация организма хранится как последовательность нуклеотидов в цепочке ДНК. Все гены, которые определяют наш цвет глаз, наш цвет волос, наш цвет кожи, наши особенности, наш потенциальный рост, наши физические задатки – все это всего лишь последовательность четырех нуклеотидов А, Т, G и С. Ровно как все операционные системы – это лишь последовательности 0 и 1, точно так же ДНК это – последовательности четырех нуклеотидов.
Для того чтобы сохранять генетическую информацию и передавать её следующим поколениям должен существовать механизм для копирования ДНК. Чтобы использовать эту информацию, должен существовать механизм для расшифровки и использования этого кода. Хорошая новость заключается в том, что эти механизмы более-менее изучены.
Однажды, Фрэнсис Крик сформулировал центральную догму молекулярной биологии, которая гласит: функция ДНК заключается в хранении и передаче информации РНК, а функция РНК заключается в чтении, де|шифровке и использование информации из ДНК для создания белков. И хоть такой взгляд может казаться слишком упрощенным, он достаточно хорошо обобщает детали.
Существует три фундаментальных процесса:
- Репликация – процесс по которому создаются идентичные копии ДНК с целью передачи информации потомкам.
- Транскрипция – процесс по которому генетическая информация читается и переносится из ядра клетки к специальным станциям (рибосомам), где происходит синтез белка.
- Трансляция – сам процесс синтеза белка в специальных станциях.
Репликация ДНК – это реакция, катализируемая ферментами, которая начинается с частичного раскручивания двойной спирали в некоторых местах молекулы ДНК. Раскручивание происходит под действием фермента хеликаза (от английского хеликс – спираль), иными словами приходит фермент и разрывает парочку водородных связей между азотистыми основаниями, тем самым образуя некий пузырь и выворачивая азотистые основания навстречу окружающей среде. При этом, рядом спокойно плавают разные нуклеотиды в свободном виде, и мимо проходя, они подходят к азотистым основаниям ДНК и образуют с ними водородные связи. Таким образом, к каждой из старых двух цепочек ДНК приходят новые нуклеотиды и образуется две молекулы ДНК, каждая из которых содержит по цепочке от начальной молекулы. Нуклеотиды выстраиваются по принципу комплементарности, и поэтому две новые копии идентичны. Размах процесса репликации просто ошеломляет: каждое ядро любой нашей клетки содержит по две копии 22 х хромосом и еще две половые хромосомы (всего 46). Каждая хромосома стоит из одной большой молекулы ДНК, компактно свернутой вокруг специальных белков, называемых гистонами. В целом, оценивается что во всех 46 хромосомах находится в сумме около 3 миллиардов пар оснований, или 6 миллиардов нуклеотидов. Несмотря на такой размер генома человека, процесс занимает всего несколько часов, а средняя скорость репликации ДНК составляет 50 нуклеотидов в секунду.
Но разве не опасно копировать нашу ДНК так быстро? Случайная ошибка и в ДНК встанет неправильный нуклеотид, а это уже будет означать мутацию всего гена! Если бы мы сознательно копировали нашу ДНК, мы бы перепроверяли каждое основание по несколько раз, никто же не хочет случайных мутаций? Чтобы убедиться в отсутствии ошибок, клетки тоже делают повторное чтение цепочки ДНК и при необходимости исправляют ошибки. В итоге, ошибка может встречаться лишь один раз на каждые 10-100 миллиардов нуклеотидов. При этом, учитывая то, что молекулы ДНК копируются при каждом клеточном делении, а клетки делятся на протяжении всей жизни, всего 60 случайных ошибок (мутаций) передается следующему поколению.
После того как ДНК полностью копируется, образуются две новые копии. Так происходит с каждой хромосомой. В итоге, когда клетка делится на две новые, она передает одну копию одной клетке, а другую другой. Похожим образом происходит и образование половых клеток, которые участвуют в процессе передачи генетической информации от поколения к поколению.
Но как же организм может читать информацию зашифрованную в молекуле ДНК? Вернемся к РНК. Ранее мы говорили, что она структурно похожа наиДНК, но содержит рибозу вместо дезоксирибозы, и урацил вместо тимина. В нашем организме есть четыре основных типа РНК: матричная (информационная) – мРНК, рибосомальная – рРНК, транспортная – тРНК, и много маленьких РНК, также называемых функциональными РНК. Последние выполняют большое количество различных функций внутри клетки, например остановка процесса транскрипции или ускорение химической модификации других молекул РНК (катализ).
Генетическая информация в ДНК содержится в определенных сегментах, называемых генами, каждый из которых состоит из специфичной последовательности нуклеотидов, которые кодируют тот или иной белок. Да, да, именно так: все наши гены это просто последовательности нуклеотидов, которые кодируют синтез того или иного белка. При этом, по большей части ДНК хранится в свернутом виде, однако, в разных частях организма развернуты разные части ДНК, будто бы открыты разные страницы одной книги. Именно поэтому, клетки мозга, клетки крови, мышцы, железы обладают одной ДНК но такими разными функциями, которые определяются теми или иными белками в их составе.
Но как же происходит синтез белка? Во-первых, представим что есть определенная последовательность ДНК на цепочке №1, а цепочка ей комплементарная пусть будет №2. Во время транскрипции приходит специальный фермент и опять разворачивает небольшой участок молекулы ДНК. При этом, вместо того, чтобы позволять нуклеотидам присоединяться к обоим цепочкам, фермент удерживает первую (ее еще называют кодирующей), а рибонуклеотиды (именно те, которые входят в состав РНК) присоединяются ко второй цепочке (ее еще называют шаблонной), образуя матричную РНК, которая комплементарна цепочке №2, которая в свою очередь комплементарна цепочке №1. Надеюсь вы еще не запутались. В итоге, мРНК идентична кодирующей цепочке №1, за исключением лишь того, что вместо тимина везде находится урацил.
Очень часто в природе встречается следующая картина: последовательности ДНК, которые несут какой либо смысл (гены) начинаются в одном месте (называемом экзоном), но периодически прерываются бессмысленными вставками (в том плане, что они не кодируют белок) называемыми интронами. Финальная мРНК появляется только тогда, когда эти интроны вырезаются специальными ферментами, которые называются сплисеосомами. Да, пожалуй к этому моменту вы уже убедились в том, что биологи любят придумывать разные термины. Например, гены кукурузы, которые кодируют фермент триозофосфатизомеразу (отвечает за очень важную стадию в процессе метаболизма углеводов) содержат 8 некодирующих интронов, которые занимают примерно 70% от всей последовательности, и 9 кодирующих экзонов, которые занимают оставшиеся 30%.
Ну вот у нас есть мРНК, которая содержит кодирующую последовательность, но что дальше? мРНК приходит в рибосому (специальную станцию клетки для биосинтеза белка) и там встречается с другими ферментами, в том числе с разными тРНК. Каждые три нуклеотида в мРНК кодируют ту или иную аминокислоту. Например AAA кодирует аминокислоту лизин, a UGC кодирует цистеин. Но почему природа выбрала именно три нуклеотида, не больше и не меньше? Дело в том, что существует лишь 16 разных последовательностей из двух нуклеотидов (при выборе из A,T,G,C), а аминокислот как мы помним 20. Если добавить всего один нуклеотид, количество вариантов возрастает до 64, но теперь одна и та же аминокислота может кодироваться разными последовательностями ДНК. Возвращаясь к кодированию аминокислот: замени хоть один нуклеотид – и ты получишь другую аминокислоту. А вдруг она играла критичную роль? Без нее организм уже становится мутантом.
Что мы имеем в итоге? ДНК состоит из последовательностей нуклеотидов. Гены – последовательность нуклеотидов. Три таких нуклеотида называют кодоном и они являются такой буковкой в молекулярном мире. Каждая буковка кодируют какую-либо аминокислоту. Но что же значит кодируют? Дело в том, что существует 61 тРНК, у которых есть участки комплементарные кодонам, а каждая из этих тРНК несет на другом конце одну аминокислоту. В процессе биосинтеза белков, тРНК присоединяется к комплементарным участкам на мРНК, а ферменты соединяют аминокислоты, которые они несут с другой стороны. Но мы сказали что существует 64 кодона, а тРНК вроде как всего 61, где остальные 3? Остальные 3 тРНК останавливают процесс биосинтеза белка, т.е. в конце любой генетической последовательности есть кодон который говорит организму остановиться. Вот такой вот сложный механизм обеспечивает всю нашу генетическую разнообразность.