VII Съезд биофизиков России
Краснодар, Россия
17-23 апреля 2023 г.
Главная
О Съезде
Организаторы
Программный комитет
Программа Съезда
Место проведения Съезда
Проживание
Оргвзносы
Основные даты
Регистрация
Публикации материалов Съезда
Молодежный конкурс
Контакты
Тезисы
English version
Партнеры Съезда
Правила оформления докладов

Программа Съезда

Секции и тезисы:

Биофизика сложных многокомпонентных систем. Математическое моделирование. Биоинформатика

Как AlphaFold находит структуру белка: предсказывает он её на основе физики, или распознает по сходству последовательностей с помощью огромных баз данных?

А.В. Финкельштейн1,2,3*

1.Институт белка Российской академии наук;
2.Биотехнологический факультет МГУ им. Ломоносова;
3.Биологический факультет МГУ им. Ломоносова;

* afinkel(at)vega.protres.ru

Огромный успех программ типа AlphaFold [1-3] в идентификации структуры белка по его аминокислотной последовательности подымает вопросы: (i) В чем главная причина этого успеха? (ii) Что именно делает AlphaFold: основанное на физике предсказание пространственной структуры белка, или распознавание этой структуры по сходству целевой аминокислотной последовательности с последовательностями с уже известной пространственной структурой? Ответы, данные в этом докладе, таковы: основной причиной успеха программ типа AlphaFold является (i) использование огромных баз данных, которые уже охватывают практически все существующие в природе суперсемейства белков; (ii) используя эти базы данных, множественные выравнивания последовательностей и коэволюционную информацию, такую как корреляции в триплетах аминокислотных остатков контактирующих участков цепи, программ типа AlphaFold распознают пространственную структуру белка по сходству его аминокислотной последовательности (или ее частей) с родственными последовательностями с уже известными трехмерными структурами [4]. Подчеркну, что это не умаляет достоинства и полезности AlphaFold; это только объясняет основу его успеха.

Я благодарен Российскому научному фонду (грант № 21-14-00268) за финансовую поддержку.

Литература

1. A. W. Senior et al., Improved protein structure prediction using potentials from deep learning. Nature 577, 706–710 (2020).

2. J. Jumper et al., Highly accurate protein structure prediction with AlphaFold. Nature 596, 583-589 (2021).

3. G. Ahdritz et al., OpenFold: Retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization. bioRxiv preprint (2022) https://doi.org/10.1101/2022.11.20.517210.

4. A.V. Finkelstein, Does AlphaFold predict the spatial structure of a protein from physics or recognize it (its main parts and their association) using databases? bioRxiv preprint https://doi.org/10.1101/2022.11.21.517308 (November 22, 2022).

How does AlphaFold identifies 3D protein structure: Is it a physics-based prediction or sequence similarity-based recognition using huge databases?

A.V. Finkelstein1,2,3*

1.Institute of Protein Research of the Russian Academy of Sciences;
2.Biotechnology Department of the Lomonosov Moscow State University;
3.Biology Department of the Lomonosov Moscow State University;

* afinkel(at)vega.protres.ru

The great success of AlphaFold-kind programs [1-3] in protein structure identification from the sequence poses the questions: (i) What is the main reason for this success? (ii) What exactly do AlphaFolds do: the physics-based prediction of the spatial structure of a protein from its amino acid sequence or recognition of this structure from similarity of the target amino acid sequence to some parts of sequences with already known spatial structures? The answers given in this talk are: the main reason for the success of AlphaFold-kind programs is (i) the usage of huge databases which already cover virtually all protein superfamilies existing in Nature; (ii) using these databases, multiple sequence alignments, and coevolutionary information like correlations in triplets of amino acid residues of the contacting chain regions, AlphaFold-kind programs recognize a structure by similarity of the examined amino acid sequence (or its parts) to related sequence(s) with already known 3D structures [4]. I emphasize that this does not diminish the merit and utility of AlphaFold; it only explains the basis of its success.

I acknowledge funding from the Russian Science Foundation (grant № 21-14-00268).

References

1. A. W. Senior et al., Improved protein structure prediction using potentials from deep learning. Nature 577, 706–710 (2020).

2. J. Jumper et al., Highly accurate protein structure prediction with AlphaFold. Nature 596, 583-589 (2021).

3. G. Ahdritz et al., OpenFold: Retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization. bioRxiv preprint (2022) https://doi.org/10.1101/2022.11.20.517210.

4. A.V. Finkelstein, Does AlphaFold predict the spatial structure of a protein from physics or recognize it (its main parts and their association) using databases? bioRxiv preprint https://doi.org/10.1101/2022.11.21.517308 (November 22, 2022).



Докладчик: Финкельштейн А.В.
36
2023-02-02

Национальный комитет Российских биофизиков © 2022
National committee of Russian Biophysicists