Comments 72
Заранее, спасибо! Статью чуть позже, но обязательно прочту!
Ой, заминусовали, не ожидал. Собственно комментарий был оставлен, потому что перед сном мог не осилить, хотя бегло пробежав понял что статья интересная. В общем так и есть, многое узнал, еще раз спасибо!

По сути, лично мне кажется главное решение так и останется в вычислительной мощности.
И если можно вопрос, правильно ли я понял, что даже если вычислительных мощностей хватит для вычисления структуры не маленьких белков, то скорее всего этот результат будет все равно приближенным?
Пожалуйста, рад, что статья понравилась, я не минусовал :)

Предполагается, что если делать молекулярную динамику с правильными force fields, то должно свернуться в нативную (природную) конформацию. Proof of principle: The protein was initially configured in a fully extended state and was observed to fold to a stable conformation with a backbone root-mean-squared deviation (RMSD) of ~1 Å from the crystal structure. (с) www.sciencemag.org/content/330/6002/341.full?ijkey=s.yjp.RDsEAFk&keytype=ref&siteid=sci (RMSD в 1 ангстрем — это точно правильная структура, в пределах обычных флуктуаций белковой цепи)
Это хорошо.

А если решение задачи в будущем станет тривиальной, станет ли человек Богом? :-)
Нет, от решения данной конкретной задачи человек Богом не станет, не бойтесь :) Так как нужно понять устройство живого на более высоких уровнях — на уровне клетки и тд. Разобраться, как все-таки мозг работает и так далее.
А для обОжения надо, по слову отцов, Духа Святого стяжать!
Занимательно!
но очень сложно и серьезно. А ведь так и просится смайлик после «Почему бéлки важны?» :)
В самом начале не просто так было предупреждение о том, что много букв ;)

Про бЕлок — рассказывали байку про то, как биологи из Пущино приехали в гости к физикам в Дубну, а у них там в парке табличка «Берегите белок!», пущинцы конечно же прочитали неправильно и удивлялись, почему физиков так волнует сохранность белкА :)
А вот вам не байка. На сайте РАН институт белка долгое время был переведен как «Squirrel institute».
Было дело, правда.

Кстати, там выше я ссылался на лекции А.В. Финкельштейна по физике белка, он в том самом Институте белка работает.
В Пущино про БелОк (а это самый продвинутый институт там) много шуток. Например, «Чудесный город Пущино: магазин Зайчик, институт БЕлка» :)
Фенилаланин — всегда интересовало, что же это за слово такое на этикетке лимонада)
«Содержит фенилаланин» пишут для больных фенилкетонурией, у них в организме не расщепляется до конца фенилаланин, накапливаются вредные промежуточные продукты расщепления и человеку становится совсем плохо. У здоровых людей проблем с этим нет :)
Спасибо! Очень интересно и до некоторой степени понятно для неспециалиста. А какой принцип использует программы для локальной оптимизации структуры, molecular dynamics или что-то более хитрое?
Пожалуйста! «до некоторой степени понятно» — хм, это вежливое «не очень понятно»? :) Я старался сфокусироваться на важных вещах, чтобы было от чего оттолкнуться и начать копать глубже.

Для уменьшения объема вычислений, насколько я в курсе, зачастую не считают полноценную молекулярную динамику, а делают «минимизацию энергии» своими фирменными алгоритмами. В реальности это означает, что текущая позиция оценивается, скажем, по количеству «плохих» контактов, то есть когда расстояние между атомами меньше Ван-дер-Ваальсового, и подобным критериям, а потом структура слегка двигается для оптимизации по этим критериям (отличие от молдинамики в том, что двигают не отдельные атомы, а большие группы атомов, соответствующих аминокислотам и тд). Заодно алгоритм может перебрать стандартные конформации боковых групп, чтобы посмотреть, какая из них лучше «вписывается» и тд.
На хим.факе даже если минимизировать мол.механикой, могут обидеться. Кар-парринелло всякие надо хотя бы. К тому же, минимизацию энергии системы с адренорецептором (к примеру) — это 60к атомов — громакс выполняет часов за 5 на домашнем ноуте.
Вообще говоря, крутить группы — гиблое дело. Лучше не изобретать велосипед — использовать структуру из базы данных (при наличии) или пытаться построить по аналогии+ с учетом каких то специфичных вещей для отдельных остатков
хм, это вежливое «не очень понятно»? :)

Напротив — стала понятна задача, и почему ее тяжело решить, хотя химией после школы не занимался.
Еще понятно, что функцию поля для нее я никогда не напишу. :)
Мы в свое время занимались минимизацией энергии «двиганием» элементов вторичной структуры (очень похоже на FoldIt, только в автоматическом режиме). Вся хитрость в том — в каких потенциалах считать, чем точнее потенциал, тем больше мерность пространства, в котором надо делать минимизацию => объем вычислений. Соответственно чтобы за разумное (конечное) время проветси расчеты — приходится упрощать модель. Даже кое-каких интересных результатов удалось добиться, с точки зрения алгоритмов.
Интересно! Результаты где-нибудь опубликованы? Вы использовали что-то типа shape matching или оно по-другому работало?
Ага, похоже на Shape Matching. Сначала рассчитывали «упругость» отдельных элементов вторичной структуры по-честному — MD, потом гнули их. По публикации не знаю, я потом другой темой занялся — МД льдоподобных структур воды (связанная вода, например), а потом и вовсе из науки ушел, к сожалению. А то чем у нас фолдинговая группа занималась уж больно на шаманство похоже было, да и сыро очень, так что думаю, что публикаций особо не было =)
Знакомые все лица :) Я сам в Пущино кандидатскую делал, только не в белке, а в микре (ИБФМ РАН).
Просто подумал, может где-то еще в нашей необъятной Родине фолдингом белка занимаются, ан нет.
Ну, с точки зрения биофизики/физхимии Родина не столь уж и необъятна :-) 5-6 серьезных институтов в дефолт-сити и вокруг, вот собственно и все.
Да, именно так. Хотя я видел людей из Питера и Новосиба, утверждающих, что и у них есть биохимия и молекулярка :)
UFO landed and left these words here
Смайлик в конце моего поста как-бы намекал на его ироничность :)
Просто в Москве/подмосковных наукоградах на самом деле сконцентрировано большое количество интеллектуальных ресурсов, поэтому у людей, работающих в Москве/подмосковье, складывается впечатление, что больше в России науки нигде нет. А она, как Вы верно заметили, немножко есть.
Под Новосибом есть даже синхротрон, на нем была первая в Советском Союзе синхротронная станция для сбора дифракционных данных с белковых кристаллов.
ага, мы примерно этим же занимались и тоже в автоматическом режиме. Выделяли в т.ч. закономерности вторичных структур и накладывали доп. ограничения.
Да, к сожалению, подходы, работающие у химиков для малых молекул (для биологов все, что меньше ~500 Дальтон — малая молекула), перестают эффективно работать для макромолекул (15-150 и больше килоДальтон) из-за вычислительной сложности. Приходится изобретать гиблые, но более быстрые костыли.
Это, кстати, отдельный вопрос — сколько проблем может быть решено просто увеличением доступной вычислительной мощности. Похоже, что фолдинг белка — одна из таких проблем.
Учитывая нелинейный рост времени расчёта для больших белков, традиционное увеличение доступной мощности вряд ли является панацеей. Может быть, в будущем найдутся какие-то более новые и более скоростные вычислительные подходы — например, те же расчёты, но с использованием квантовых алгоритмов.
Насколько я помню, химики по-честному (численным решением Шредингера) что-то порядка 1000 атомов уже считают за очень разумные времена (часы). Так что хорошо спроектированный узкоспециализированный суперкомпьютер должен эту проблему снять лет через 10-15.
Вопрос: на чем держится трехмерная структура белка?
Ответ: если коротко, на большом количестве слабых взаимодействий.

Аж сердце ёкнуло. Прочитал дальше — фух, картина мира на месте, взаимодействия электромагнитные, а не слабые. :)

В физике термин «слабое взаимодействие» (как и «сильное») имеет вполне определенное значение, может, как-то поправить этот кусок?
Спасибо! Уже поправил на «в основном на большом количестве нековалентных взаимодействий». Просто я использовал наш жаргонизм «слабое взаимодействие», как противоположность ковалентной связи.
Судя по количеству и соотношению комментарии / добавление в избранное, очень много людей решили почитать статью попозже.
В избранное часть добавляешь, если хочешь вернуться и перечитать, или показать кому-то при случае.
Я перечитал статей о программировании. Прочитав заголовок ожидал нестандартную структуру данных «белка», думал с воображаемым колесом это как то связанно.
Отличная статья! Кратко, информативно, и выделены ключевые моменты — нерешенные вычислительные задачи, именно для айтишников. Даже залогинился, чтобы плюсануть. А еще заинтересовался, как именно белки выполняют всю эту работу в живых организмах и почему именно белки, какие ключевые свойства белков заставили именно их быть «рабочими лошадками».
Меня заинтересовал вопрос — как можно понять свойства белка по его структуре? И наоборот, как предсказать структуру белка, которая будет соответствовать каким-то желаемым свойствам?
Вопрос первый — в общем случае, не имея дополнительной информации — никак :) В реальности алгоритм такой — можно поискать гомологичные (сходные по первичной последовательности) белки, узнать, что они делают и от этого оттолкнуться. Если есть структура — такой же поиск структурных гомологов, может дать ответ на вопрос, но подтвердить функцию белка можно только в лаборатории, экспериментально. Далее, если нет гомологов с известной функцией, можно провести анализ окружения гена, кодирующего данный белок, в ДНК. Очень часто гены белков, участвующих в разных стадиях одного процесса, находятся на ДНК рядом (у бактерий это называется оперон), так можно хоть процесс определить. Если же совсем ничего не ясно, в бой идет тяжелая артиллерия — генетическая инженерия. Для начала обычно просто убивают нужный ген и смотрят, какой процесс в организме сломался, потом возможен более тонкий анализ мутантных версий белка и тд :)
Плюс возможный всякие скрининги — например, если есть подозрение, что белок взаимодействует с другими белками, можно прогнать Yeast 2 hybrid system и идентифицировать возможных партнеров, далее раскручивать от них.

Второй вопрос: стопроцентно — никак. Но можно предположить, как именно должны быть расположены атомы активного центра для осуществления нужной функции, а потом попытаться найти подходящий остов белка, который сможет поддерживать нужную структуру атомов активного центра. Сейчас это на уровне шаманства, люди меняли специфичности отдельных ферментов успешно и тд, но такая инженерия (успешная) — пока очень большая редкость.
Для начала обычно просто убивают нужный ген и смотрят, какой процесс в организме сломался

А как это делают?
Нужно ведь найти нужный ген из миллиардов(или сколько их там) нуклеотидов и повредить только нужные.
Спасибо! Вопросы глубокие и точного ответа не имеющие, но в контексте эволюционной теории самой разумной отговоркой будет, что «так случайно получилось, а потом закрепилось». На самом деле аминокислоты могут спонтанно образоваться из неорганики (те самые опыты Миллера — http://ru.wikipedia.org/wiki/Эксперимент_Миллера_—_Юри ), плюс аминокислоты умеют даже спонтанно полимеризоваться в короткие пептиды в присутствии ионов меди. То есть их химия, скорее всего, оказалась самой «удобной» для эволюции, но точней ответить вряд ли можно. Репертуар боковых остатков аминокислот достаточно богат и позволяет катализировать множество реакций, но возникает вопрос, почему именно эти 20 аминокислот закрепились эволюцией? Ведь химически возможно существование бОльшего количества аминокислот, просто Природа не использует их в белках. Лучший ответ — так случайно получилось, то есть мы не знаем. Сторонники «intelligent design» немедленно указали бы, что здесь имеется лазейка для существования Творца. В плане же инженерии белка, сейчас поставлена такая задача — сделать искусственную систему трансляции, которая позволила бы включать в белки нестандартные аминокислоты, существенно расширяя каталитический репертуар белков. Первые успехи и proof of principle уже есть: www.nature.com/nature/journal/v464/n7287/full/nature08817.html
Есть еще хороший спор о курице и яйце — РНК и аминокислотная последовательность (особенно в свете экспериментов, показавших принципиальную возможность обратной трансляции РНК из аминокислотной последовательности). Тоже загадка из загадок, связанная с уникальной функцией белка.
Так, а вот про обратную трансляцию можно поподробней? В официальной мэйнстримной науке вроде бы до сих пор этот процесс считается невозможным, отсюда и вера в идею «мира РНК».
Вот, довольно старая статья, которая по-моему не получила продолжения, но механизм возможной обратной трансляции вполне правдоподобен. Не знаю, были ли сделаны кем-то проверочные эксперименты, но тема, как мне кажется, перспективная.

Хотя, конечно, это сильно неофициальная точка зрения. С другой стороны, с точки зрения физики и химии процесса трансляции, я не вижу ни одной причины, почему не может существовать обратного механизма, так же как есть обратная транскрипция (ретровирусы, те же).
Поправка, на коротких последовательностях, конечно. Потому что обратная трансляция не денатуририванного сфолденного белка, конечно, вряд ли получится, но ведь и самопроизвольная полимеризация аминокислот пока только на коротких цепочках была показана, так что есть все шансы увидеть когда-нибудь и механизм Белок->РНК
Да, обратная трансляция — это полная эзотерика, официально ее нет. Есть несколько линий доказательства, почему обратная трансляция невозможна. Во-первых, функции значительного количества белков известны и такого фермента не обнаружено. Глядя на рибосому, делающую прямую трансляцию и весящую больше трех мегадальтон, 52 белка плюс длинные РНК, невольно предполагаешь, что обратную транскрипцию будет делать такая же махина и не заметить ее очень сложно. Во-вторых, синтез белка — многоступенчатый процесс, поэтому он термодинамически не может быть обращен, в отличие от одноступенчатых реакций (к которым, например, относится транскрипция — химически там образуется лишь фосфодиэфирная связь между нуклеотидами, реакция может быть легко обращена). Были еще какие-то свидетельства, которые нам читали, но уже плохо помню — давно это было :)
Спасибо за увлекательную статью!

__________________
Что же делать? Есть достаточно известный хабравчанам самый общий подход, называемый «молекулярная динамика» и подходящий для любых молекул и систем. Берем развернутый белок, приписываем всем атомам случайные значения скоростей, считаем взаимодействия между атомами, повторяем до тех пор, пока система не придет в стабильное состояние, соответствующее свернутому белку. Почему это не работает? Потому что современные вычислительные мощности позволяют за месяцы работы кластера считать десятки наносекунд для системы из тысяч атомов, какой является белок, помещенный в воду.
___________________

Почему-то сразу же на ум приходит CUDA: 3 000 ядер на одной видеокарте! до 3-х слотов в материнке.
Т.е. в принципе, можно на каждое ядро повесить по атому и посмотреть что будет.
(Задумчиво) А он считает взаимодействие всех атомов со всеми, или как-то бьет их по группам?
Я, к примеру, когда считал замерзание воды, считал по кубам пространства
Достоверно не знаю, но, похоже, что все со всеми. Глядя на видео, трудно представить, что можно угадать, какие
атомы останутся достаточно далекими. А динамически обновляемый proximity усложняет обработку на конвейeре GPU.
Потом, межатомные взаимодействия хоть и ослабевают с расстоянием, но все равно остаются. Исключение из модели «слабых» взаимодействий искажает поле. А, поскольку интегрировать нужно с фемтосекундным шагом до миллисекунд, есть риск получить откровенную ересь.

Блин, это действительно надо писать и пробовать…
так, с ходу, попробовал предложить две модели упрощенного расчета, но понял, что тут надо самому сперва попробовать. потому что, в итоге, вполне себе может оказаться правильным какой-то третий вариант, который пока и в голову не приходит.
А были попытки cкомбинировать молекулярную динамику с кинематической моделью: рассматривать спирали и тяжи как жесткие элементы, а остальные атомы по отдельности? Что-то мне подсказывает, что это и есть вышеупомянутые гиблые костыли, но вдруг…
Да, именно так «минимизация энергии» и делается. Подходы в деталях отличаются, но суть в том, что ты уже двигаешь группы атомов, в том числе и расширенные до целого элемента вторичной структуры. Проблема тут в том, что при таком приближении система обычно сползает до ближайшего локального энергетического минимума, который совсем не есть глобальный минимум. Выпрыгнуть же из локального минимума такой подход пока не может, в этом вся проблема…
UFO landed and left these words here
В статье было написано так:

Длина цепи – от 70 до более чем 1000 мономеров (аминокислотных остатков), средняя длина для высших организмов – примерно 500-600 аминокислотных остатков, для бактерий эта величина будет меньше, скорее 300-400 остатков.


Каждая аминокислота состоит из от 10 до почти 30 атомов, включая атомы водорода. То есть в среднем в белке несколько тысяч атомов, в крупных может быть больше десятка тысяч.

Если же запускать молекулярную динамику, то белок обычно помещают в «коробочку» из воды, так как взаимодействие с водой критично для белка (хотя раньше и в «вакууме» гоняли, но поняли, что это не кошерно). Соответственно, молдинамика в таких случаях еще должна все атомы воды просчитывать.
UFO landed and left these words here
Эээ, батенька, тут главный вопрос — в каком приближении считать. Т.к. если считать все честно, то на каждый шаг надо обсчитать как минимум С(n,k)=C(10^6, 2) взаимодействий, т.к. даже сильно удаленные друг от друга атомы все равно оказывают друг на друга влияние, а следовательно — влияние на энергию системы. Это отнюдь нетривиальная задачка.

Собственно все танцы с бубном в фолдинге и развернуты вокруг того, как бы считать поменьше взаимодействий, чтобы получить рабочую модель реальной молекулы. Современных вычислительных ресурсов хватает на полноценный (неупрощенный) обсчет примерно 10^3 атомов, а сложность расчетов растет нелинейно от кол-ва атомов, поэтому до появления работающих квантовых суперкомпьютеров ждать, что задачка будет решена брутфорсом не стоит.
UFO landed and left these words here
UFO landed and left these words here
Существуют и тепловая, и холодовая денатурация (разрушение структуры) белка, они возникают за счет разных эффектов. Если на пальцах, то тепловая денатурация происходит из-за разрушения водородных связей при повышении температуры, подвижность возрастает и белок разворачивается. Обычно белки денатурируют в диапазоне ~50-70 градусов Цельсия, так называемые термостабильные белки выдерживают и более высокие температуры, до 90-110 градусов. Холодовая денатурация — за счет изменения свойств воды при понижении температуры, гидрофобный эффект ослабляется при низких температурах и может привести к разворачиванию белка. Для большинства белков температура холодовой денатурации ниже 0 по Цельсию, то есть белок еще не успевает денатурировать, а раствор уже замерзает. Для некоторых же белков холодовая денатурация наблюдалась экспериментально. Подробности про сворачивание и температуру здесь: phys.protres.ru/lectures/protein_physics/l16.html
Олег, заинетересовало растворимость в воде и сворачиваемость белка — это одно и тоже? То есть расворим — это всегда сворачиваемый и наоборот?
И еще, правильно ли я понимаю, что несворачиваемый белок не может выполнять никакой функции и соответственно мертвый?
Первый вопрос — в первом приближении, да, именно так, во всяком случае это скоррелированные параметры. Если белок растворим и не выпадает в осадок — это хороший знак, он свидетельствует, что белок скорее свернут, чем нет (но не гарантирует, особенно для больших белков — часть белка может свернуться, а часть — нет). Если белок нерастворим — скорее всего, не смог свернуться. Тут все дело в гидрофобных остатках — в свернутом белке они «спрятаны» внутри глобулы, где формируют гидрофобное ядро, а снаружи глобулы — гидрофильные и заряженные группы, обеспечивающие растворимость (в общем случае). Если белок не смог свернуться, то гидрофобные остатки могут торчать наружу, «слипаться» с торчащими наружу аналогичными остатками других молекул белка, вызывая массивную аггрегацию и выпадение в осадок. Как-то так, но из любого правила могут быть исключения.

Второй вопрос — раньше именно так и считалось, однако сейчас потихоньку приходит понимание, что есть «intrinsically disordered proteins» — разупорядоченные белки, не имеющие выраженной трехмерной структуры и при этом выполняющие свои функции. Такие белки не могут быть ферментами, выполняющими катализ (для катализа нужна четкая структура), но они часто участвуют в белок-белковых взаимодействиях и регуляции клеточных процессов. Дело в том, что для связывания с другим белком структура не очень важна, так как структурированный белок может распознавать и связывать кусок несвернутого белка-партнера (BRCT domain, например). В свою очередь, на несвернутом белке могут быть сайты распознавания для нескольких разных структурированных белков и он может служить «затравкой» для образования биологически важного комплекса из нескольких белков. Связывание структурированных белков с неструктурированным, в свою очередь, может регулироваться белками-регуляторами за счет фофсорилирования неструктурированного белка, например.
Спасибо за ответы! Из твоих ответов, я понял, что я не до конца понимаю, что значит раствориться. Чисто на бытовом уровне, как понимаю — это состояние из кторого белок не выпадает в осадок со временем. Наверно так.
В принципе, все правильно.
В практическом плане это выглядит так — белок же не берется сам по себе с потолка, его продуцируют в бактериях или культуре эукариотических клеток, в которые засунут ген нужного белка так, чтобы бактерия или клетка вырабатывала его в больших количествах (по-научному — ген под контролем сильного промотора). Соответственно, в какой-то момент у нас есть несколько грамм бактерий, собранных после выращивания в паре литров среды. Мы эти бактерии суспендируем в некотором растворе и разрушаем их клеточную стенку и мембраны ультразвуком или специальным прессом (грубо говоря, клетки лопаются). В результате имеем растворимую фракцию белков и прочего клеточного содержимого плюс «осколки» клеток, которые нерастворимы. Растворимое отделяется от нерастворимого центрифугированием, а потом смотришь — есть ли твой белок в растворе или он находится вместе с осколками клеток в нерастворимом осадке. Обычно считается, что если белок не растворим, значит по какой-то причине он не смог свернуться, хотя реально никто не знает, в чем там точно дело. Как-то так. Причем хитро перебирая компоненты раствора иногда удается растворить нерастворимый белок. Но редко :(
Для проведения экспериментов, как Вы понимаете, нужен растворимый, функционально активный белок…
Да, тут есть еще тонкий момент: химический раствор у ученых в пробирке — это совсем не то, что среда внутри живой клетки. Например, внутри живой клетки фактически нет свободных молекул воды, а в растворе их полно. Поэтому возможна такая ситуация, когда белок в естественных условиях синтезируется в количестве две-три молекулы на всю клетку и в таких условиях он прекрасно сворачивается и работает. Однако если мы запустим суперпродукцию белка (нужный белок будет составлять 5-50% от всех белков клетки по массе), то белок не будет успевать сворачиваться, плюс ему будет плохо в условиях раствора в пробирке и он обидится и выпадет в осадок. Справедливости ради стоит отметить, что большинство белков счастливы и растворимы и после суперпродукции, и после переноса их из клетки в химический раствор. Как-то так. Уффф…
Очень круто, что публикуете статьи по медицине, биологии, химии на IT-ресурсе.
Вот потрясающая статья с наглядными картинками о молекулах РНК. (там их полно подобных задач-историй)
elementy.ru/problems/624
Only those users with full accounts are able to leave comments. Log in, please.