Articles / Profile of Kilor / Habr

How to become an author

Боровиков Кирилл @Kilor

Архитектура ИС: PostgreSQL, Node.js и highload

Profile Publications 142Comments 607Bookmarks

Kilor Jan 31 2022 at 18:00

PostgreSQL Antipatterns: делаем группировку быстрее от 0.1 до 5 раз

2 min

12K

Тензор corporate blogPostgreSQL*Programming*SQL*Database Administration*

Примитивный запрос - простой джойн и группировка. Традиционные методы оптимизации - казалось бы, что могло пойти не так?..

Небольшой эксперимент, на тему необходимости проверки любых гипотез в конкретных условиях.

Читать далее

+13

Kilor Jan 19 2022 at 16:11

SQL HowTo: считаем «уников» на интервале

4 min

9.1K

Тензор corporate blogPostgreSQL*SQL*Database Administration*CRM systems*

Для систем управления бизнесом часто приходится решать очень похожий класс задач по вычислению количества уникальных объектов на произвольном временном интервале. В контексте CRM это могут быть "пользователи, обращавшиеся на горячую линию на прошлой неделе", "контрагенты, оплатившие за последние 30 дней" или "потенциальные клиенты, с кем был контакт в этом квартале".

Искать в большом количестве фактов «уники» — всегда сложно и долго, если их достаточно много. Если интервалы фиксированы (календарные месяц/квартал/год), можно материализовывать такие агрегаты заранее. А если интервал — произвольный, как тогда эффективно найти ответ?

Читать далее

+10

Kilor Jan 17 2022 at 17:55

Реверс-инжинирим структуру БД PostgreSQL по плану запроса к ней

4 min

5.3K

Тензор corporate blogPostgreSQL*System Analysis and Design*Database Administration*Data visualization*

Большая часть оптимизаций запросов к базам PostgreSQL может выполняться "механически", следуя разного рода маркерам в плане выполнения запроса, которые подскажут, что и как можно ускорить. Но "глубинные" переработки алгоритма, вроде описанных в статье про DBA-детектив, требуют от разработчика детального понимания используемой структуры логических связей.

И хорошо, когда эта структура уже где-то описана и детально задокументирована. Но плохо, когда такая документация ничтожно мала, избыточно велика, сложно доступна...

А ведь она уже и так находится "под ногами" в момент анализа плана запроса - надо только лишь удобно увидеть ее!

Читать далее

+16

Kilor Nov 25 2021 at 08:30

PostgreSQL в «Тензоре» — публикации за год (#2)

4 min

3K

Тензор corporate blogHigh performance*PostgreSQL*SQL*Database Administration*

Добро пожаловать под кат, если вдруг вы пропустили какие-то из наших статей за прошедший год об интересных и полезных возможностях PostgreSQL, которые мы узнаем при разработке нашей системы полного цикла управления бизнесом СБИС — от кадрового учета, бухгалтерии, делопроизводства и налоговой отчетности, до таск-менеджмента, корпоративного портала и видеокоммуникаций.

Если не видели дайджест за первый год — время наверстать упущенное!

Читать далее

+8

Kilor Nov 22 2021 at 08:40

SQL HowTo: генерируем лабиринты (алгоритм Прима и геометрические типы)

7 min

6.2K

Тензор corporate blogEntertaining tasksPostgreSQL*SQL*Algorithms*

SQL является мощным инструментом для обработки множеств, а функционал PostgreSQL позволяет делать многие вещи еще проще, поэтому идеально подходит для реализации некоторых алгоритмов на графах.

Причем работа с графами - это не просто разминка для ума, а вполне себе прикладная задача. Например, в прошлой статье мы сделали "из мухи - слона" волновым алгоритмом Ли, аналогичным используемому у нас в СБИС при расчете себестоимости в многокомпонентных актах выпуска.

А сегодня мы научимся генерации случайных лабиринтов алгоритмом Прима с использованием геометрических типов данных.

Читать далее

+33

Kilor Nov 16 2021 at 14:00

SQL HowTo: делаем из мухи слона (алгоритм Ли)

4 min

7K

Тензор corporate blogEntertaining tasksPostgreSQL*SQL*Algorithms*

Правила игры очень просты: надо построить цепочку слов от начального (МУХА) до конечного (СЛОН), на каждом шаге меняя только одну букву. При этом могут использоваться только русские 4-буквенные нарицательные существительные в начальной форме: например, слова БАЗА, НОЧЬ, САНИ допускаются, а слова ЛИТЬ, ХОТЯ, РУКУ, НОЧИ, САНЯ, ОСЛО, АБВГ, ФЦНМ — нет.

Эта игра под названием «Дублеты» приобрела известность благодаря Льюису Кэрроллу — не только автору книг про Алису, но ещё и замечательному математику. В марте 1879 года он начал раз в неделю публиковать в журнале «Ярмарка тщеславия» по три задания в форме броских фраз: «Turn POOR into RICH» — «Преврати бедного в богатого», «Evolve MAN from APE» — «Выведи человека из обезьяны», «Make TEA HOT» — «Сделай чай горячим». В том же году он выпустил брошюру «Дублеты», подробно описал в ней правила и предложил читателям попрактиковаться на нескольких десятках примеров.

Александр Пиперски, "Из мухи — слона", «Квантик» №2, 2019 и №3, 2019

Сегодня мы научимся реализовывать на SQL волновой алгоритм, решив заодно классический пример из этой игры для конкретного словаря.

Читать далее

+20

Kilor Sep 13 2021 at 17:10

Кластеризуем миллионы планов PostgreSQL

4 min

4.5K

Тензор corporate blogPostgreSQL*Algorithms*Database Administration*Data visualization*

Как найти самые "горячие" запросы на вашем PostgreSQL-сервере? Поискать их в логе и проанализировать план или воспользоваться расширением pg_stat_statements.

А если в лог попадает миллион запросов за сутки?.. Тогда любое значение лимита pg_stat_statements.max окажется недостаточно велико, чтобы собрать правдивую статистику. Так давайте собирать эту статистику прямо с планов!

Но для некоторых сервисов СБИС нам в "Тензоре" производительность запросов к базе настолько важна, что auto_explain.log_min_duration приходится выставлять в единицы миллисекунд - и вот они, миллионы планов... Как не потеряться в них?

Читать далее

+9

Kilor Sep 8 2021 at 17:00

SQL HowTo: три WHERE в одном запросе

3 min

9.5K

Тензор corporate blogAbnormal programming*PostgreSQL*SQL*Database Administration*

При реализации некоторых прикладных задач в рамках экосистемы СБИС случается сталкиваться с неочевидными возможностями PostgreSQL, которые позволяют вместо сложной логики создать решение "в один ход".

Сегодня на примере вполне реальной задачи рассмотрим такие возможности оператора INSERT ... ON CONFLICT.

Читать далее

+8

Kilor Sep 2 2021 at 11:20

КЛАДРируем адреса произвольной формы (ч.2 — подстрочный поиск)

12 min

3.1K

Тензор corporate blogHigh performance*PostgreSQL*SQL*ERP-systems*

Tutorial

В первой части серии статей про работу с адресами по КЛАДР мы научились импортировать данные этого справочника к себе в базу и превращать их во что-то более удобное для дальнейшей работы.

Сегодня же займемся реализацией конкретных прикладных алгоритмов на этой структуре и рассмотрим, как можно реализовать мгновенную помощь пользователю при вводе адреса, используя возможности префиксного поиска в PostgreSQL.

Читать далее

+7

Kilor Aug 24 2021 at 16:10

PostgreSQL Antipatterns: «где-то я тебя уже видел...»

4 min

17K

Тензор corporate blogHigh performance*PostgreSQL*SQL*Database Administration*

Иногда при анализе производительности запроса на предмет "куда ушло все время" возникает стойкое ощущение deja vu, что вот ровно этот же кусок плана ты уже где-то раньше видел...

Пролистываешь выше - и таки-да, вот он рядом - но почему он там оказался, и как выйти из Матрицы самому и помочь коллегам?

Читать далее

+16

Kilor Aug 19 2021 at 08:35

КЛАДРируем адреса произвольной формы (ч.1 — импорт)

25 min

6.6K

Тензор corporate blogSystem administration*PostgreSQL*SQL*ERP-systems*

Tutorial

Достаточно часто при работе с вводимыми пользователем адресными данными возникает необходимость сначала подсказать ему, как правильно свой адрес указать, а потом - полученную строку адреса привести в некоторый машинно-читаемый вид.

Таким видом у нас в стране можно считать код по справочникам КЛАДР или ФИАС.

Первый из них уже несколько лет считается устаревающим, но отличается более простой структурой и исторически продолжает использоваться во множестве систем, поскольку вполне подходит для большинства задач.

Давайте научимся разбирать строку адреса "туда и обратно", а заодно познакомимся с некоторыми алгоритмическими подходами и их реализацией на SQL.

Читать далее

+9

Kilor Aug 17 2021 at 12:10

PostgreSQL Antipatterns: «слишком много золота»

6 min

11K

Тензор corporate blogHigh performance*PostgreSQL*SQL*Database Administration*

Иногда мы пишем SQL-запросы, мало задумываясь над тем фактом, что сначала они должны быть по сети как-то доставлены до сервера, а затем их результат - обратно в клиентское приложение. Если при этом на пути до сервера присутствует еще и пулер соединений типа pgbouncer, дополнительно "перекладывающий" байты между входящими и исходящими коннектами, ситуация становится еще тяжелее...

Поэтому сегодня рассмотрим некоторые типичные ситуации, в которых разработчики иногда принимают не самые оптимальные решения, гоняя по сети мегабайты трафика при общении с сервером PostgreSQL - а заодно посмотрим, как можно увидеть такую ситуацию в плане с помощью explain.tensor.ru и подумаем над вариантами, как сделать подобное взаимодействие более эффективным.

Читать далее

+27

Kilor Jul 13 2021 at 17:00

Борем deadlock при пакетных UPDATE

3 min

16K

Тензор corporate blogHigh performance*PostgreSQL*SQL*Database Administration*

Однажды при выполнении достаточно тривиального запроса:

UPDATE tbl SET val = val + 1 WHERE id IN (1, 2, 3)

... вы получаете ошибку ERROR: deadlock detected

Но почему? Ведь еще вчера все успешно работало!

И что с этим теперь делать? Давайте разбираться.

Читать далее

+25

Kilor Jun 15 2021 at 13:25

Анализируем «слона» вместе с коллегами

2 min

4.7K

Тензор corporate blogPostgreSQL*SQL*Database Administration*Data visualization*

Если ваша жизнь DBA, сопровождающего PostgreSQL, наполнена вопросами "а почему так медленно?" и "как сделать, чтобы запрос не тормозил?", наш сервис анализа и визуализации планов запросов explain.tensor.ru сделает ее немного легче за счет привлечения коллег и обновленных подсказок.

Читать далее

+7

Kilor May 25 2021 at 11:25

Множественные источники данных в интерфейсе — client-side «SQL»

4 min

3.1K

Тензор corporate blogProgramming*SQL*Algorithms*ERP-systems*

Иногда в интерфейсе наших приложений СБИС возникает необходимость "сгруппировать" часть записей в некотором списке (например, служебные сообщения в чате, контакты и телефонные звонки).

Хорошо, если все эти записи приходят с одного источника, а вот если из разных сервисов, да с навигацией по курсору - алгоритм реализации становится весьма нетривиальным.

Читать далее

+10

Kilor May 12 2021 at 17:30

DBA: прибираем «мертвые души»

4 min

12K

Тензор corporate blogSystem administration*PostgreSQL*SQL*Database Administration*

Иногда при выполнении длительных или плохо написанных запросов в PostgreSQL происходят разные неприятные вещи типа внезапного сбоя процесса или краша всего сервера.

В таких случаях на носителе могут остаться "мертвые души" - файлы (иногда совсем немаленькие, а вполне сравнимые по объему со всей остальной базой), которые были созданы во время работы процесса в качестве временного хранилища промежуточных данных.

Эти данные уже никому не нужны, никем не могут быть использованы, но сервер не торопится избавиться от них как Плюшкин.

Читать далее

+17

Kilor Apr 26 2021 at 10:10

Чего «энтерпрайзу» в PostgreSQL не хватает

6 min

16K

Тензор corporate blogHigh performance*PostgreSQL*SQL*Database Administration*

Technotext 2021

В конце прошлого года Иван Панченко предложил мне рассказать на внутреннем семинаре Postgres Pro, чего, по нашему опыту использования PostgreSQL в "кровавом энтерпрайзе" "Тензора", не хватает в этой СУБД.

С докладом пока так и не сложилось, зато появилась эта статья, в которой я постарался собрать наиболее показательные вещи, которые вызывают "напряги" при активном использовании PostgreSQL в реальном бизнесе.

Читать далее

+31

Kilor Apr 20 2021 at 13:15

SQL HowTo: решаем головоломку «Небоскрёбы» почти без перебора

20 min

8.8K

Тензор corporate blogAbnormal programming*Entertaining tasksPostgreSQL*SQL*

Многие знают правила этой головоломки (Skyscrapers):

"Перед вами вид сверху на городской квартал. В каждой клетке стоит "небоскреб" высотой, равной числу в этой клетке. Числа с боков сетки означают количество "небоскребов", видимых из соответствующей строки или столбца, если смотреть от этого числа.

Задача: заполнить сетку числами так, чтобы в каждой строке и в каждом столбце каждое число использовалось лишь единожды."

Понятно, что алгоритмом полного перебора можно решить что угодно, но - за экспоненциальное время. Поэтому мы попробуем написать такой SQL-запрос, который решит нам такую головоломку за приемлемое время.

Зачем же делать это на SQL? Потому что можем! А заодно потому что это позволит научиться конструировать "очень сложные запросы", что может пригодиться и в обычной работе.

Сломать голову, вывихнуть мозг

+32

Kilor Apr 5 2021 at 12:00

DBA: меняем «слонов» на переправе

3 min

3.2K

Тензор corporate blogHigh performance*PostgreSQL*SQL*Database Administration*

Tutorial

Как нормальные DBA, мы подождали выпуск пары минорных версий к PostgreSQL 13, который должен порадовать нас многими полезными вещами, и теперь готовы перенести базу нашего сервиса мониторинга этой СУБД с 12-й версии на 13-ю.

Но как это сделать с минимальным простоем, а лучше вообще без него? На помощь придет функционал Foreign Data Wrappers, а точнее - postgres_fdw.

Читать далее

+10

Kilor Apr 1 2021 at 08:30

Энтерпрайз-домино. 0x13 вредных советов для ниндзя-разработчика

6 min

8.2K

Тензор corporate blogHigh performance*PostgreSQL*Programming*System Analysis and Design*

Практически любая enterprise-система (под которой мы будем подразумевать некоторое ПО, где пользователи работают постоянно в течение всего рабочего дня) в современном мире стремится вырасти вместе с управляемым ей бизнесом в высоконагруженное web-решение вроде нашего СБИС.

Оно и понятно: доступность с любого устройства, где есть браузер, минимальные вложения "на старте" - все, что бизнес так любит. Но с развитием системы растет не только ее размер, но и сложность архитектуры решения, а с ней - и цена любой ошибки, вызывающей сразу каскад возможных проблем и "эффект домино".

Когда, где и как их может вызвать затаившийся до поры диверсант?

Читать далее

+21

3