Открыть список
Как стать автором
Обновить

«Представь, что ты нашел решение, про которое можешь сказать: оно лучшее в мире» — интервью с создателем ClickHouse

Блог компании РебреинOpen sourceПрограммированиеАдминистрирование баз данныхИнтервью
Всего голосов 49: ↑45 и ↓4 +41
Просмотры12.2K
Комментарии 13

Комментарии 13

Есть два человека которым я бы памятники при жизни поставил за ClickHouse: Алексею Миловидову, как автору и идейному двигателю, Денису Журавлёву (den_crane) — за поддержку и консультации в группе ClickHouse телеге.
О, да! Не могу не присоединиться.
den_crane действительно очень помогает и терпеливо отвечает даже на глупые вопросы. Респект!
Алексей уже себя увековечил. На памятник скинусь из сэкономленных с помощью clickhouse денег.

С нетерпением жду Алексея и КликХаус в очередном издании The Architecture of Open Source Applications: https://www.aosabook.org/en/index.html
Мне кажется, что КликХаус более чем достойный пример для книги.

Алексей упоминал, что Метрика была третьей в мире в веб-аналитике. Если первый—это Google Analytics, то кто тогда второй?

Рад услышать поддержку подробных комментариев кода и спокойное отношение к большим файлам с исходниками.

Вот, все же, до сих пор не понимаю, почему раз в КХ все работает столь быстро, в нем столь убоги джойны. Broadcast join вообще отсутствует как таковой.
Почему все проприетарные конкуренты (BigQuery, Redshift, Vertica) с похожими принципами и подходами вопрос решили, а Clickhouse way — городить велосипеды из костылей с применением внешних in-memory кешей и смотрящего на них словаря просто, чтобы, например, посчитать
group by account_id, когда факты льются с кукой, а связка кука-> account может прийти после записи факта.

Как говорится, пулл-реквесты приветствуются, исторически сложилось, и другое. Проект развивается, 5 лет назад джойнов не было совсем.

А есть принципиальная причина? Более, чем уверен, что если бы не было мощного глубоко запрятанного блокера, давно уже или в Яндексе реализовали б, или кто-то бы Альтинити задонатил за это.

Я вот уже долгое время не сотрудник компании, так что могу только поделиться ощущениями.


По мне, задача звучит как улучшение, то есть уже существуют пути решения проблемы. А раз так, то и приоритет не самый высокий.


Но всё меняется, как только приносят PR, где оно реализовано. А принимаются изменения в КХ очень охотно, так что стесняться и бояться этого не стоит.

На сколько я помню Алексей не хотел добавлять join потому что это медленно а clickhouse не тормозит. Если выбрать между join и скоростью я бы тоже выбрал второе.

Ясно, спасибо
И в итоге и джойн есть, и кликхаус тормозит (на джойне). Хотя, та же вертика, с которой, по сути, КХ скопирован по идеям, и которую по бенчмаркам (не использующим джойн) уделывает в разы, с джойном справляется неплохо, и даже имеет высокоэффективный merge join, который обгоняет hash.

Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.