MGorkov 30 апр 2020 в 09:04

Хеш+кэш: оптимизация «потоковой» обработки

6 мин

4.7K

Блог компании ТензорВысокая производительность*JavaScript*Серверная оптимизация*Node.JS*

Комментарии 8

nin-jin 30 апр 2020 в 09:58

Не думали в сторону фильтра Блума?
Почему для такой задачи вообще выбран JS?

Kilor 30 апр 2020 в 10:16

Не думали в сторону фильтра Блума?

Блум ближе к поискам все-таки, а вот насколько для нашей задачи будет быстрой его генерация — вопрос. Поэтому пока остановились на простом хэшировании.

Почему для такой задачи вообще выбран JS?

Много сетевых потоков, асинхронности и работы со строками (регекспы, парсинг, ...) — NodeJS удобен в этих аспектах.

nin-jin 30 апр 2020 в 10:30

Блум — это set с ненулевой вероятностью ложноположительного срабатывания.

Kilor 30 апр 2020 в 10:40

Я имел в виду, что поиск в нем — быстр, но насколько эффективно он модифицируем при добавлении нового элемента.

nin-jin 30 апр 2020 в 10:49

Добавление и чтение одинаковы по стоимости. А вот удалять нельзя.

НЛО прилетело и опубликовало эту надпись здесь

Kilor 30 апр 2020 в 17:28

Что такое «произвольный контекст»?
Нас uuid как значение просто устроил своими характеристиками — как с точки зрения длины/вероятности коллизий, так и эффективного хранения на стороне БД.

BD9 1 мая 2020 в 00:24

Intel SHA extensions

Зарегистрируйтесь на Хабре, чтобы оставить комментарий