Pull to refresh

Comments 78

это конечно хорошая попытка приобщить народ хабра к биоинформатике, но переписывать главы из учебников… плохой тон. Плюс тематика алгоритма не раскрыта.
Я извиняюсь — где я что переписал?

Про алгоритмы — не все сразу, чтобы их понять надо много знать до этого, вот и пишу более популярно основы.
переписывать = копировать

про алгоритмы — мне кажется если бы вы описали алгоритимические решения, используемые для фолдинга РНК было бы интереснее, а тому что вы описываете уже как минимум 20 лет, если не больше.
А можно хоть немного конкретнее — что я скопировал? Рисунки на слайде? Или вы имеете введу что-то еще?

Как вы себе представляете объяснить людям далеким от этого без основ?

Чему именно 20 лет?
Может я и не прав. Жду продолжения описания алгоритма.
Я могу вам дать ссылку на мою первую статью о этом Целенаправленный поиск в задаче сворачивания третичной структуры РНК. Там алгоритм по сути простой, но я почему-то аналогов не встречал. Может посмотрите и обсудим?
Хотите чуть посложнее — не спешите, дождитесь хотя бы 4-ой части сего рассказа. Не вся аудитория имеет предварительные знания. Я начинаю с самых основ, как и сам начинал. Может в учебниках что-то и есть — но много лишнего и не нужного, и простой человек не угробив пару лет просто не поймет. Я же пытаюсь, чтобы он понял достаточно именно с информационной точки зрения.

Вот вы говорите многое описано — покажите мне пожалуйста учебник в котором написано как описать математически когда образовалась ковалентная и водородная связь. Я не видел не одного, где четко было бы это указано. Вы встречали? Где?
Что значит «как описать математически когда образовалась ковалентная и водородная связь»?

Ковалентная связь либо есть либо ее нет. Моделирование реакции совсем-совсем другой вопрос — квантовая химия к примеру это давно описывает.

Образование водородной связи — молекулярная механика вроде это все неплохо описывает. Математически.

И еще, а зачем вам описывать обраование ковалентных связей при фолдинге белка?

И если не секрет, вы учитесь? студент? аспирант? и по какой специальности?
А вы читали эту статью? Или просто по диагонали?

Вот видите: квантовая химия, молекулярная механика… а все куда проще, например: водородная связь образуется тогда когда определенные атомы находятся на расстоянии <3 ангстрем друг от друга и под определенным углом <20 градусов. Все математически достаточно. И никаких сложностей. Но почему то НИ В ОДНОМ учебнике.

Не секрет: свое я уже отучился, mg. sc. ing — мне хватает. Это мое хобби, но у кого-то это на уровне почитать, а у меня сделать что-то полезное для науки :) А работаю я совсем по другой специальности.

Ну назовите один конкретно и страницу где это написано?
Похоже мы о разном. Определение то есть. Но какое? Где там разговор о 3 ангстремах и угле в 20 градусов?
Да, статью только по диагонали, тк подобное я читал в учебниках, но изложенное в более приятное форме. Наши авторы умеют преподнести сложные вещи еще сложнее чем они есть на самом деле.
Зря, к четвертой статье уже не будите понимать из чего я исхожу в алгоритмах.
Тут у вас драка не на шутку… Я лучше в сторонке со своим плакатом постою… Это собственно основная из функций в моей докторской по нахождению свободной энергии фолдинга белков… image
Поясните пожалуйста — по русски.
Пока я хабр до 3ей страницы дочитал, статью опять ниже порога главной опустили…

Ладно, давайте по сути. Это очень простая функция, которая выражает классическую электростатику взаимодействия атомов кислорода и водорода в белке. Коэффициенты, а в данном случае это численные значения частичных (ещё их смещёнными иногда называют) зарядов находятся из квантовых симуляций.

Т.е. Е — это просто энергия взаимодействия. Для простоты можно ввести пороговое значение -0.5 ккал/моль и если энергия меньше этого значения — будем считать, что водородная связь присутствует. Если больше — то её нет.

Это если мы хотим работать в дискретном пространстве вероятностей. Тут тоже можно многое чего увидеть интересного.

Но я пробовал вычислять разницу свободной энергии Ландау, а точнее энергию перехода. И для этого мне нужна была непрерывная функция. Поэтому я энергию водородной связи запихивал в такую самодельную шаговую функцию. Подбирал параметры. И даже что-то там интересное намерил.

А по поводу статьи… Мне показалось, как-то Вы всё с ног на голову поставили. Перебором, понятное дело, ничего нельзя найти. Но кто мешает Вам использовать динамические методы, которые успешно развиваются уже последние 50 лет.

Просто для доп.информации: в 2000 году на тему молекулярного моделирования было опубликовано свыше 1 000 статей только в одних американских журналах. Общее число сегодня уже превышает 50 000. Только в прошлом году было опубликовано 12к статей. Вопрос качества их давайте лучше опустим)))
А что я поставил с ног на голову? Если конкретнее, с чем не согласны?
кто мешает Вам использовать динамические методы, которые успешно развиваются уже последние 50 лет

И результат этих методов и числа статей?

Мне мешает? Сложность, причем совершенно не нужная.
Из Вашей первой статьи:
Биологи могут лишь с определенной погрешностью увидеть путем биоэкспериментов состояние в уже свернутом состоянии, но проследить как это происходит пока не возможно.

Именно эту фразу я и назвал постановкой вопроса неправильно. Молекулярная динамика показываем динамическое изменение состояния биологической системы. С теми методами, что мы, например, в моей группе разрабатывали, получается ускорение динамики в десятки тысяч раз. Что позволяет симулировать большие протеиновые комплексы. Если Вам кажется молекулярная динамика сложной, ну что же, Ваше право выбрать другой подход. Я просто показал, что можно удачно использовать и этот.

И если честно, как-то мне перестал нравится Ваша «тролевидная» манера общения. Потому пойду-ка я спать, пока в очередной холивар не влез.
Ах вот как. Чем же вам моя манера общения не понравилась? Не то что-то спросил?

Молекулярная динамика — это разве биоэксперименты? Я говорил, в указаной цитате о NMR и рентгеноструктурной кристаллографии.

Где в свободном доступе ваши алгоритмы? Или этого нету?
Написали бы популярную статью на хабре — мы бы почитали про ваш метод, тогда бы и был бы повод это все изучить и выбрать…
Вот еще напомню, что я писал в самом начале

Сразу надо сказать, что буду излагать вопрос о биовычислениях с определенной кибернетико-геометрической точки зрения. Это мое название и это направление не распространено. Уверен, что так будет легче понять тем кто не в теме этой биологической проблематики. Те кто уже в теме — готов и с вами подискутировать и показать почему традиционные методы не пригодны с точки зрения кибернетического подхода (но в этой статье не вы моя аудитория — уж извините, но уверен и вам она будет полезна как расширение мировоззрения на проблематику).


т.е. НИКАКОЙ физики и биологии — Вы от меня не дождетесь. А со специалистами, такими как вы хотелось бы понять, точнее чтобы вы помогли понять, зачем вы все так усложнили? И есть ли лучший результат по сравнению с моим подходом (конечно, с учетом того, что моему подходу всего пару лет, а не тысячи статей за 50)?
Если Вы про 3 ангстрема и угол в 20 градусов — то и на плакате у вас этого нет.
Хотя есть, но очень как-то косвенно, и без чисел.
картинка была представлена не для того
Кстати, мне любопытно стало, а Вы в курсе откуда вообще взялись эти волшебные 3 А и 20 градусов?
сложно видимо рассказать, легче минус поставить ;)
Правильно я понимаю, что вы в докторской занимались фолдингом белка in silico?
Я использовал вот этот источник для этих значений:

Wolfgang Kabsch and Christian Sander. Dictionary of protein secondary structure:
Pattern recognition of hydrogen-bonded and geometrical features. Biopolymers,
22(12):2577–2637, Dec 1983. ISSN 1097-0282. doi: 10.1002/bip.360221211. URL
www3.interscience.wiley.com/cgi-bin/abstract/107587714/ABSTRACT.
вы ему список литературы в личку киньте, просто технарю сложно понимать некоторые тонкости молекулярной биологии.
Прям ВЕСЬ список литературы ему кидать? Ради интереса полез к себе в тезис смотреть сколько ж это статей — оказалось 124 наименования. Из них, вроде, 5-6 книг, остальное — научные публикации.

Да и зечем человеку, который сам говорит, что занимается совершенно другим по-жизни, тратить время и энергию на изучение того, что ему не нужно профессионально.

И кстати, если что, я то себя тоже к технарям причисляю. Я больше программист, нежели биолог.
Надо отвечать нормально, а не ссылками кидаться
а вы прописные истины спрашиваете, у меня вот совсем мало желания лезть в книгу и искать точную страницу, где приведены расстояния и углы водородной связи.
Привыкайте, мы тут долго «прописными истинами» заниматься будем. А если специалистам лень — так о чем говорить?
Нет, это лень вам. Вы хотя просто статью в википедии читали про водородную связь? я вот сразу нашел там и длины и углы
Мне? Не во мне дело, Вы забыли кто это тут начал обсуждать? Я уж нашел кое как. А цитату можно дать? Я вот не нашел :(
The partially covalent nature of a hydrogen bond raises the following questions: «To which molecule or atom does the hydrogen nucleus belong?» and «Which should be labeled 'donor' and which 'acceptor'?» Usually, this is simple to determine on the basis of interatomic distances in the X−H…Y system: X−H distance is typically ≈110 pm, whereas H…Y distance is ≈160 to 200 pm. Liquids that display hydrogen bonding are called associated liquids.
Hydrogen bonds can vary in strength from very weak (1–2 kJ mol−1) to extremely strong (161.5 kJ mol−1 in the ion HF−
2).[6][7] Typical enthalpies in vapor include:
F−H…:F (161.5 kJ/mol or 38.6 kcal/mol)
O−H…:N (29 kJ/mol or 6.9 kcal/mol)
O−H…:O (21 kJ/mol or 5.0 kcal/mol)
N−H…:N (13 kJ/mol or 3.1 kcal/mol)
N−H…:O (8 kJ/mol or 1.9 kcal/mol)
HO−H…:OH+
3 (18 kJ/mol[8] or 4.3 kcal/mol; data obtained using molecular dynamics as detailed in the reference and should be compared to 7.9 kJ/mol for bulk waters, obtained using the same molecular dynamics.)

en.wikipedia.org/wiki/Hydrogen_bond
где здесь 3 ангстрема и 20 градусов?
и нету в википедии этого
И сами то подумайте — «прописные истины», которые не специалисту сложно найти. Это чья проблема? Это проблема неумелого изложения предмета, а если точнее изложения предмета не под тут аудиторию. Видимо еще запрос ИТ на эту тематику маленький, вот пока и доходчивых материалов нет.
не нужно так пренебрежительно говорить о других.

Всего то нужно было дать нотацию своим обозначениям. Достаю из указанной ссылки

with q1 = 0.42e and q 2 = 0.20e, e being the unit electron charge and r(AB)
the interatomic distance from A to B.


От куда столько негатива, на простые уточнения? Можно хоть немного соучастия?
Никакого пренебрежения не было, вы неудосужились изучить элементарные вещи.
А это так принято давать формулы без пояснения обозначений?
Я и вижу, как вы не можете дать ссылки — где эти элементарные вещи описаны.
Вот вы интересный человек, решаете за меня, что я изучил, а что нет — и говорите что пренебрежения нет. Может пора уже Вам начать конструктивно обсуждать? Вы прочитали мою статью, есть что сказать? Так чего тогда тут говорим не ясно о чем?
Кстати, от туда же

more complicated description of H bonds in terms of one distance and one
angle. There is no generally correct H-bond definition, as there is no sharp
border between the quantum-mechanical (wave-function overlap dominates
at short distances) and electrostatic (electrostatic interaction dominates
at larger distances) regimes and no discontinuity of the interaction
energy as a function of distance or alignment. Thus, any H-bond definition
is empirically tailored to a particular purpose.


Вот не ужели так сложно написать полнотекстово, а не давать какие то обрывки, чтобы люди гадали, искали, недоумевали — что вы хотели вообще сказать?

Вы видимо использовали просто другое определение. Можно было так и сказать. Я единственно не понял почему авторы вашего источника считают определение через расстояние и угол более сложным?
Даже выделю
There is no generally correct H-bond definition

как окончание бесперспективного разговора.
Я 15 лет назад делал похожее в институте. И пока да, не было серьезного прорыва решении NP полных задач. А белки почти все уже сфоткали, так что как мне кажется задача из классической перешла в более частные, например, в существующий белок добавляют другое молекулярное соединение и смотрят есть вероятность ужиться вместе или нет.
сфоткали сотые доли процентов… попробуйте найти модели хотя бы сотни тРНК. Я уже не говорю о больших белках/РНК. Тут статья Нобелевская премия 2009 по химии, а вы говорите 15 лет. А это мизер — есть только 2-5 моделей большой рРНК. Ну, и задача то в другом — имеешь первичную последовательность — высчитай трехмерную. Я же писал — все это дорого: знаете сколько уходит денег на одну «фотку»?
Белки и РНК не одно и тоже.
я же такого не утверждал, знаю :) И с белками сложнее…
Я сказал что белки сфоткали, а не сказал, что РНК.
Я кстате не доконца уверен, а сворачивается ли тРНК в природе, она из ядра выходит и с неё сразу копировать начинают, зачем ей сворачиваться то?
Венее она дорезается подорезается обрезается и mRNA выходит.
Эх как всегда напутал, да tRNA как-то хитро и должна сворачиваться
Ну знаете ли… не знаю ГДЕ она сворачивается, но сворачивается это точно :)
Я хотел сказать, что она может не просто так сворачиваться, а по каким-то дополнительным законам не только физика, но и биология, может на ней какие белки сидят дополнительно.
А это не важно. Вы наверное тоже по диагонали читали. Так как это важно выделю даже

мы идеализируем процесс сворачивания, не рассматривая никакие другие взаимодействия, кроме водородных связей. Таким образом, в моделировании мы намеренно исходим из упрощения, идеализации, как бы отвечая на вопросы: «как пойдет ход сворачивания, если РНК будет стремиться только к образованию водородных связей?» и «каков “чистый” вклад образования водородных связей в процесс сворачивания?» (это из моей научной статьи)


и почему то я уверен, что этого будет достаточно для образования тРНК, и тем самым даже если там есть какие-то белки или еще какие-то силы — они будут не важны.
Да я не спорю, то что она будет делать понятно, но надо к реалиям приближать, а если реали еще и упростят то вообще супер.

Вот не плохая статья
physwww.mcmaster.ca/~higgsp/4S03/QRBHiggs2000.pdf
все равно их очень мало
О! Так у меня может быть проф. критик… а вы занимаетесь этим чисто биологически или in silico также?
я из соседней области, только in silico. Фолдингом не занимаюсь.
В смысле Вы и Ваш друг.
а он фолдингом биологически или тоже in silico?
т.е ручками работает
А нельзя ли для перебора использовать модифицированный метод UCT, применяемый в текущий момент в самых сильных программах, играющих в ГО (Можно посмотреть здесь или здесь)? Этот метод основан на скрещении метода Монте-Карло и альфа-бета отсечения.
В настоящий момент про этот алгоритм даже нет статьи на английской википедии.

Прошу прощения, если написал какой-то абсурд не в тему, т.к. я сам в биоинформатике почти ничего не смыслю. Но если кому не понятно про этот алгоритм, могу объяснить.
Как раз в тему, надо смотреть. Если бы еще вы написали об этом алгоритме на хабре — вообще хорошо…
Да, я собираюсь писать статьи про данный алгоритм и про другие, но применительно к малораспространенной и малоисследованной игре «Точки».

Только не знаю когда это будет — у меня такой подход, что сначала нужно добиться результатов на практике, а потом писать)
Положу здесь пару ссылкок. Прямую не дам, в этом секторе сильна конкуренция и раздражение, выйдите через поисковик. По нуклеотидным последовательностям быстро собирают модели белков. Сейчас участвуют в CASP.

img-fotki.yandex.ru/get/6203/126580004.4a/0_b72b8_4e83ca7e_orig.gif
img-fotki.yandex.ru/get/5106/nanoworld.205/0_48908_9fa5c119_orig.gif
Sign up to leave a comment.

Articles