Я не решусь придумывать расчетные формулы, возможно они существуют. Но могу сказать, что многие цифры, которые встречаются в текстах Elastic были получены эмпирически. Касательно количества запросов и объема данных, здесь я пытался сказать, что эти цифры будут влиять на производительность кластера. Важно учитывать третью переменную — требуемое время выполнения. Например для пользовательского поиска я бы выжимал максимум скорости обработки. Т.е. важно отталкиваться от требований бизнеса в первую очередь.
Касательно мастеров, важные и легкие действия это, например, отправка запросов на выделение шарда или его перемещение. Важные потому что от них зависит работоспособность кластера, а легкие потому что не требуют сложной обработки данных. В этом контексте слово "большой" не совсем уместно, я с вами согласен, правильней будет "достаточный", достаточность зависит от количества нод в кластере и количества шардов. Главное — избегать пиков нагрузки близких к максимуму для физической ноды. Надеюсь, я немного прояснил.
Спасибо. Транзакции в ES — интересная тема для отдельной публикации, хочу написать об этом тоже. А касательно остального, старался выразить все максимально кратко концентрируясь на
распределенности.
Для небольших и незагруженных кластеров вполне можно обойтись нодами с совмещенными ролями. В тексте нужно было сделать акцент о том, что ES позволяет разделением ролей разгружать узкие места.
Я не решусь придумывать расчетные формулы, возможно они существуют. Но могу сказать, что многие цифры, которые встречаются в текстах Elastic были получены эмпирически. Касательно количества запросов и объема данных, здесь я пытался сказать, что эти цифры будут влиять на производительность кластера. Важно учитывать третью переменную — требуемое время выполнения. Например для пользовательского поиска я бы выжимал максимум скорости обработки. Т.е. важно отталкиваться от требований бизнеса в первую очередь.
Касательно мастеров, важные и легкие действия это, например, отправка запросов на выделение шарда или его перемещение. Важные потому что от них зависит работоспособность кластера, а легкие потому что не требуют сложной обработки данных. В этом контексте слово "большой" не совсем уместно, я с вами согласен, правильней будет "достаточный", достаточность зависит от количества нод в кластере и количества шардов. Главное — избегать пиков нагрузки близких к максимуму для физической ноды. Надеюсь, я немного прояснил.
Спасибо. Транзакции в ES — интересная тема для отдельной публикации, хочу написать об этом тоже. А касательно остального, старался выразить все максимально кратко концентрируясь на
распределенности.
Для небольших и незагруженных кластеров вполне можно обойтись нодами с совмещенными ролями. В тексте нужно было сделать акцент о том, что ES позволяет разделением ролей разгружать узкие места.
Да, ES предоставляет возможность бэкапов вот тут поподробнее