VII Съезд биофизиков России
Краснодар, Россия
17-23 апреля 2023 г.
Главная
О Съезде
Организаторы
Программный комитет
Программа Съезда
Место проведения Съезда
Проживание
Оргвзносы
Основные даты
Регистрация
Публикации материалов Съезда
Молодежный конкурс
Контакты
Тезисы
English version
Партнеры Съезда
Правила оформления докладов

Программа Съезда

Секции и тезисы:

Молекулярная биофизика. Структура и динамика биополимеров и биомакромолекулярных систем

О предпочтительности кодонов

В.М. Комаров1*, А.А. Самченко1, М.С. Кондратьев1

1.Институт биофизики клетки РАН;
2.Институт биофизики клетки РАН;

* komarov_vm(at)mail.ru

В современной геномике весьма важным и интригующим моментом остается вопрос о происхождении неравноправного участия кодонов (codon usage bias) в функционировании живого организма.

Традиционно, здесь используется общее положение об определяющей роли GC-состава в формировании основных структурных свойств геномной ДНК. В соответствии с этими представлениями в качестве возможной меры предпочтительности кодона очень часто привлекаются оценки величины вклада гуанина или цитозина в третье положение кодона (GC3) в составе белок кодирующих генов. Однако в реальных обстоятельствах, исходя, например, из конкретного строения генома человека, такая «GC3 предпочтительность» оказывается не столь впечатляющей и оставляет около 25%! Поэтому на данный момент многие склонны все же считать, что в существующих условиях вырожденности генетического кода, наблюдаемое неравноправие синонимических кодонов как у про-, так и у эукариот, есть следствие нетривиального баланса двух факторов – влияния естественного отбора и мутационной предрасположенности.

Раннее в своих работах мы уже указывали на важный вклад существующей «скрытой» неоднозначности исходной формы комплементарного Н-спаривания азотистых оснований в инициировании наблюдаемых особенностей структурно-функциональной организации молекул нуклеиновых кислот. Данная неоднозначность связана с би-стабильным характером пирамидального строения экзоциклических амино групп аденина, гуанина и цитозина, участвующих в водородном связывании. Пониженный, 2-х кратный полиморфизм структуры АТ-пар по сравнению с 4-х кратным полиморфизмом GC-пар обуславливает наблюдаемое доминирование А/Т-треков над G/C-треками в составе двойных спиралей ДНК любых организмов. Реализуется, таким образом, естественный отбор пар в обеспечении надежности протекания в клетке процессов сохранения и передачи генетической информации.

Есть основания ожидать, что повышенная неоднозначность формы GC-спаривания оснований по сравнению с АТ-спариванием должна каким-то образом отразиться и в обсуждаемом случае, при формировании предпочтительного состава нуклеотидных триплетов в структуре «кодон-антикодон» центра связывания нуклеиновых кислот для поддержания высокой точности и стабильности протекания генетических процессов.

Нами, с использованием данных GenBank и ресурса www.kazusa.or.jp/codon, был выполнен спектральный анализ частот встречаемости всех 64 типов кодонов в генах широкого представительства про- и эукариот, охватывающий масштабный диапазон размеров исследуемых геномов (от 1,6 Mb до 140 000 Mb) с разным GC-составом. В качестве примера реликтовых эукариот были выбраны геномы амебы (Amoeba proteus), тихоходки (Targidrada), мечехвоста (Limulus Polyphemus), моллюска (Nautilus pompilius). Другие эукариоты, а также прокариоты, были представлены геномами человека (Homo sapiens), шимпанзе (Pan triglodites), мыши (Mus musculis), мраморной двоякодышащей рыбы (Protopterus aethiopicus), лягушки (Xenopus tropicalis), мухи (Drosophila melanogaster), цветка (Arabidopsis thaliana), клеточного слизевика (Dictyostelium discoideum), паразита (Leishmania major), дрожжей (Saccharomyces cerevisiae), малярийного паразита (Plasmodium farciparum), бактерии (Escherichia coli) и очень маленькой бактерии (Candidatus Pelagibacter). Спектральный анализ был проведен на основе разработанной собственной компьютерной программы с описанием алгоритма в [А.А.Самченко и др, Биофизика, 61 (6), 1045-1058 (2016)].

Полученные результаты в целом подтвердили сделанное нами предположение. Было выявленно, что для каждого организма оказывается свойственным существование двух групп предпочтительных кодонов. Первая группа – наиболее многочисленная. В ней сосредотачивается примерно от 64 до 95 процентов такого типа кодонов с наличием во втором положении либо А либо Т(U) основания. Обозначается, таким образом, приоритет вклада "наиболее надежных" оснований с исходно низким структурным полиморфизмом комплементарного Н-спаривания. Этим достигается сохранение достаточно стабильной и четкой пространственной фиксации центрального звена системы узнавания «замок-ключ» (кодон-антикодон) в функциональных комплексах ДНК-мРНК, мРНК-тРНК, тРНК-рРНК.

Во второй, весьма малочисленной группе, собрались оставшиеся приоритетные кодоны с центральным G или C азотистым основанием.

В целом, разбиение предпочтительных кодонов по двум таким группам оказывается довольно значительным, может доходить до соотношения 95:5 (%), и зависит от состава конкретного генома.

On the codon usage bias

V.M. Komarov1*, A.A. Samchenko1, M.S. Kondratiev1

1.Institute of Cell Biophysics of RAS;
2.Institute of Cell Biophysics of RAS;

* komarov_vm(at)mail.ru

In modern genomics, the question of the codon usage bias in the functioning of a living organism remains very important and intriguing.

Traditionally, here the general position is used about the determining role of the GC composition in the formation of the main structural properties of genomic DNA. According to this concept, assessments of the contribution of guanine and cytosine to the third position of the codon (GC3) in the composition of protein-coding genes are often used as a possible measure of codon bias. However, in real circumstances, based, for example, on the specific composition of the human genome, such a “GC3 preference” turns out to be no more than 25%! Therefore, at the moment, many are still inclined to believe that under the existing conditions of the degeneracy of the genetic code, the observed inequality of synonymous codons in both pro and eukaryotes is a consequence of a non-trivial balance of two factors - the influence of natural selection and mutational predisposition.

Earlier in our work, we have already pointed out the important contribution of the "hidden" ambiguity of the initial form of complementary H-pairing of nitrous bases in initiating the observed features of the structural and functional organization of nucleic acid molecules. This ambiguity is caused by the bi-stable nature of the pyramidal structure of the exocyclic amino groups of adenine, guanine, and cytosine involved in the hydrogen bonding. The reduced, 2-fold polymorphism of the structure of AT-pairs compared to the 4-fold polymorphism of GC-pairs determines the observed dominance of A/T tracks over G/C tracks in the DNA double helix of any organisms. Thus, the natural selection of pairs is realized in ensuring the reliability of the processes of preservation and transmission of genetic information in the cell.

There is reason to expect that the increased ambiguity of GC base pairing form of compared to AT-pairing should somehow be reflected in the case under discussion, when forming the preferred composition of nucleotide triplets in the “codon-anticodon” structure of the nucleic acid binding center to maintain high accuracy and stability of the course of genetic processes.

Using the GenBank data and the www.kazusa.or.jp/codon resource, we performed a spectral analysis of the frequencies of occurrence of all 64 types of codons in the genes of a wide representation of pro- and eukaryotes, covering a scale range of sizes of the studied genomes (from 1.6 Mb to 140 000 Mb) with different GC-content. The genomes of amoeba (Amoeba proteus), tardigrade (Targidrada), horseshoe crab (Limulus polyphemus), and mollusk (Nautilus pompilius) were studied as an example of relic eukaryotes. Other eukaryotes as well as prokaryotes were represented by the genomes of a human (Homo sapiens), a chimpanzee (Pan triglodites), a mouse (Mus musculis), a marble lungfish (Protopterus aethiopicus), a frog (Xenopus tropicalis), a fly (Drosophila melanogaster), a flower (Arabidopsis thaliana ), slime mold (Dictyostelium discoideum), parasite (Leishmania major), yeast (Saccharomyces cerevisiae), malaria parasite (Plasmodium farciparum), bacteria (Escherichia coli), and very small bacteria (Candidatus Pelagibacter). The spectral analysis itself was carried out on the basis of a developed own computer program with a description of the algorithm in [A.A.Samchenko et al, Biophysics,2016, 61 (6),813-824].

The results obtained generally confirmed the assumption made. It has been shown that each organism has two sets of codons bias. The first group is the most numerous. It concentrates approximately 64 to 95 percent of these codons with either an A or T(U) base in the second position. Thus, the priority of the contribution of the "most reliable" bases with initially low structural polymorphism of complementary H-pairing is implemented. This achieves a consistently clear spatial fixation of the central link of the "lock-key" recognition system (codon-anticodon) in the functional complexes of DNA-mRNA, mRNA-tRNA, tRNA-rRNA.

In the second, very small group, the remaining codon usage bias with a central G or C nitrous base gathered.

In general, the resulting split of codon bias into two such groups is quite significant, can reach a ratio of 95:5 (%), and depends on the composition of a particular genome.



Докладчик: Комаров В.М.
428
2023-01-31

Национальный комитет Российских биофизиков © 2022
National committee of Russian Biophysicists