4dmonster 14 мая 2013 в 12:04

Redis — главное хранилище? Что за хрень?!

8 мин

295K

Анализ и проектирование систем*NoSQL*

Перевод

+54

Комментарии 31

tehnerd 14 мая 2013 в 12:15

линк на оригинал можно?

-6

4dmonster 14 мая 2013 в 12:17

Это же перевод — щёлкаете на имя автора: Courtney Couch и переходите на moot.it/blog/technology/redis-as-primary-datastore-wtf.html

+10

impwx 14 мая 2013 в 13:02

Я бы посоветовал перечитать статью пару раз перед тем, как ее публиковать — очень много косноязычных фраз вроде «ужас грядущего счёта». Про запятые вообще молчу.

+14

bubuq 14 мая 2013 в 23:26

ослепительно быстрый

Large 14 мая 2013 в 13:30

На своём проекте мы тоже используем redis как основное хранилище.

Проблемы сохранности данных решаем репликацией, кластер пока не используем так как не храним большие тексты, а только данные приложений и короткие строки. Храним в памяти только ключи и часто используемые данные, данные которые не использовались давно записываются на диск и не хранятся в памяти.

Единственная проблема с которой мы пока столкнулись — это поиск данных по критериям (возможно скрипты на lua решат эту проблему, но драйвер для node.js пока криво с ними работает и вообще работает криво, сидим на версии 0.7.2 как наиболее не глючной).

4dmonster 14 мая 2013 в 13:49

Должны решить, их применение снимет большинство накладных расходов. К сожалению автор ещё не написал про их работу с Lua.

le0pard 16 мая 2013 в 00:29

Lua скрипты блокируют работу redis (при выполнении одного скрипта другие команды в redis или другие скрипты не будут выполнены, пока он не закончить) для атомарности. Поэтому много интересной логики туда не напишеш.

Qualab 16 мая 2013 в 01:09

www.lua.org/pil/26.html — запускаешь процесс с нужной логикой из новой функции, которую напишешь на Си, передашь в него что нужно, а скрипт благополучно сведётся к одной недорогой команде, после чего завершится. Потом можно периодически опрашивать процесс через сообщения например или пайпы.

Large 16 мая 2013 в 12:39

Для проблемы поиска мы думали сделать скрипт, который принимает номер объекта и критерии которым объект должен удовлетворять. Этот скрипт мы вызывали бы в цикле из основного процесса увеличивая номер пока бы не перебрали все объекты, каждый раз когда скрипт отрабатывал бы, мы бы обновляли результаты поиска.

Таким образом процесс редис блокировался бы только на время простой операции получения одного объекта и сравнения его с критериями, а асинхронный перебор ложился бы на плечи ноды. Теоретически это должно работать в несколько раз быстрее чем чистое сравнение на ноде.

На практике пока сливаем часть редиса раз в сутки в мускл и ищем в нем, но в будущем хотелось бы отказаться от этого.

spanasik 14 мая 2013 в 13:36

Почему-то после прочтения этой статьи у меня в голове сразу всплыла фраза о преждевременной оптимизации. Хотя, конечно, с технологической точки зрения опыт весьма полезный.

4dmonster 14 мая 2013 в 13:47

По статье как раз наоборот, если использовать Redis как основное хранилище — необходимо сразу думать и разделении данных — потом будет очень проблематично.

spanasik 14 мая 2013 в 13:49

Это понятно, я имел в виду, что для начала им запросто хватило бы и MySQL.

4dmonster 14 мая 2013 в 13:52

«У нас была изначальная цель, чтобы все вызовы API обрабатывались менее чем за 10мс даже под высокой нагрузкой»
И вряд ли они собирались в последствии переписывать свою систему.

spanasik 14 мая 2013 в 13:56

API не видел, но никаких проблем добиться тех же результатов с MySQL, просто тот же memcached подключить агрессивно.
Они, судя по статье, сразу рассчитывали на очень высокие нагрузки, т.е. что проект сразу станет мега-популярным. Вопрос — стал ли? Я, конечно, не мерило, но об этом сервисе прочитал только тут в первый раз. Кстати, их конкурент, Disqus, вполне себе работает на Postgres, и ничего, всё шевелится.

zxcabs 14 мая 2013 в 13:59

По моему они просто взяли с разу заложили возможность для расширения, и это правильно, и к оптимизации не относиться.

spanasik 14 мая 2013 в 14:02

Относится, ещё как. Всё имеет свою цену. В данном случае они заплатили усложнением общей архитектуры, и ещё не факт, как оно реально поведёт себя в дальнейшем, ведь такие конфигурации уникальны, опыта фактически нет.

4dmonster 14 мая 2013 в 14:07

В общем я понимаю вашу мысль, сам я, при прочтении, подумал «что ещё изобретут, чтобы только не использовать MUMPS на GT.M». Но полагаю, что могут быть ещё не названные аргументы за выбранное ими решение. И как раз эти не названные — и могли бы вас переубедить.

4dmonster 14 мая 2013 в 14:01

Там ещё ограничения и по цене. Да и в начале он сразу написал «Прежде всего, я хотел бы подчеркнуть что большинство приложений вовсе не должны обращать внимания на костыли использованные, что бы пойти таким путём. Это было важно для нашего сценария использования, но мы можем быть граничным случаем.»

furyk 14 мая 2013 в 14:04

Ну они и запустились-то совсем недавно.

Fafnir 14 мая 2013 в 14:23

На самом деле, если отбросить нагрузки, то делать сразу на NoSql банально проще, разработка идет быстрее. Говорю по своему опыту использования Redis. Просто с NoSql надо четко понимать, КАК используются данные.
C SQL мы сваливаем все в одну кучу и только потом начинаем думать, что с этим делать, отсюда проблемы не только с нагрузкой, но и с миграциями и прочим.

SowingSadness 14 мая 2013 в 16:58

дошел до вашего комментария и улыбнулся — я не одинок :)
но это всего лишь моё ощущение и не больше.

440hz 14 мая 2013 в 16:19

изначальное разделение данных очень правильных подход.

aimodify 14 мая 2013 в 18:18

На самом деле redis хорош. Очень хорош.
Ознакомившись с Маленькой Книгой (http://cloud.github.com/downloads/kondratovich/the-little-redis-book/redis-ru.pdf) можно сделать выводы о целесообразности использования его у себя.

Цитата:
Redis использует множество способов облегчить наше взаимодействие с данными. Эта система убирает большую часть сложности и абстракции, присущих другим системам. Во многих случаях это делает Redis неудачным выбором. Но в других случаях может показаться, что Redis был написан для решения именно вашей проблемы.
Redis прост в освоении. Когда вокруг так много новых технологий, не просто понять, на изучение какой стоит потратить время. Когда вы увидите реальные преимущества, которые Redis может предложить, я уверен, что у вас не останется вопросов о том, уделять ли время на изучение Redis.

gooddaytoday 14 мая 2013 в 20:04

Я не понимаю, почему во всех статьях про Redis пишут, что это отличная замена Memcached и он хорош в качестве основного хранилища данных?
Во втором случае Redis ведь при исчерпании памяти свопится на диск, что ведет к тормозам. А если докупать сервера, то сравним объем HDD и RAM, из-за чего Redis потребует больше серверов для хранения.

В первом случае у Memcached есть неоспоримое преимущество: при исчерпании памяти для кэша автоматически удаляются самые старые кэши. Redis же в этот момент опять свопится на диск.

B7W 15 мая 2013 в 01:06

Вы ошибаетесь, никакого свопа на диск не происходит. Redis ведет только синхронизацию памяти и диска, которая гибко настраивается параметром save в конфиге. Политика обработки переполнения памяти описана в параметре maxmemory-policy, почитайте.
Вот стандартный конфиг.

Диск может притормаживать, но есть два очень важных преимущества перед Memcached. При падении/перезапуске не надо прогревать кеш заново. И клевые структуры конечно.

gooddaytoday 15 мая 2013 в 11:50

Здорово. Как-то я при чтении доки упустил этот момент.
Правда есть одна непонятная вещь: разработчики рекомендуют разделять сервера, в которых хранится постоянная информация и те, что используются в качестве кэша (чтобы не убивать нужную информацию). Но там есть такая опция «volatile-lru» — удаляет по алгоритму LRU только ключи с TTL, поэтому можно в принципе кэш писать с TTL, и не разделять логически с постоянной информацией?

B7W 15 мая 2013 в 12:14

Я думаю все зависит от целей. Если как у ребят из Moot это основное хранилище — лучше разделять, и тюнить конфиги отдельно для кеша и данных. Если небольшое приложение и не очень важные данных, почему бы и не совместить.
Хотя мне кажется первое решение более правильное.

FSA 14 мая 2013 в 20:24

Буквально вчера думал, что в своём велосипеде попробовать redis в связке с mysql. Много данных есть, которые не требуют постоянной связки с другими данными. Можно, конечно, сохранять в обычном текстовом файле, но, скорее всего, проще будет нужные данные извлекать по необходимости по ключу. В частности, у меня есть логи действий пользователей. Ни к чему там реляционная база данных.

Qualab 14 мая 2013 в 23:06

Мне кажется, или Moot слишком уж бесплатным получился, учитывая проделанную работу?..

Dale 15 мая 2013 в 11:40

Я вот подумываю использовать Redis как базу данных для десктопного приложения. В основном там будут хранится логи самого приложения, плюс некая достаточно однородная информация, которая поступает примерно раз в секунду. То есть час работы приложения съест в районе 10-20 мегов.

Приложение не для общего пользования, поэтому никто не будет запускать его на машине с 512 мегами оперативки, но сомнения у меня всё-таки есть. Из плюсов можно отметить удобство работы с хранилищем и, действительно, высокую скорость выборки. Так же удобно то, что ничего не надо устанавливать при деплойменте, достаточно запустить процесс сервера.

Если у кого есть опыт подобного применения, пожалуйста отпишитесь.

-1

guyfawkes 19 мая 2014 в 17:36

Было бы интересно узнать, как у них со всеми валидациями и генерацией JSON получилось 2 миллисекунды в среднем на ответ.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Redis — главное хранилище? Что за хрень?!

Комментарии 31

Публикации

Истории