Leono Oct 6 2020 at 10:59

Базы данных: большой обзор типов и подходов. Доклад Яндекса

28 min

79K

Яндекс corporate blogSystem Analysis and Design*SQL*Database Administration*Data storage*

+33

Comments 15

Yo1 Oct 6 2020 at 11:44

Read committed, чтение фиксированных данных. Этот уровень изоляции используется по умолчанию в большинстве реляционных баз, в том числе и в PostgreSQL, и в Oracle. Он гарантирует, что вы никогда не прочитаете «грязные» данные. То есть другая транзакция никогда не видит промежуточных этапов первой транзакции. Преимущество в том, что это очень хорошо подходит для маленьких коротких запросов. Мы гарантируем, что у нас никогда не будет ситуации, когда мы видим какие-то части данных, недописанные данные. Например, увеличиваем зарплату целому отделу и не видим, когда только часть людей получили прибавку, а вторая часть сидит с неиндексированной зарплатой. Потому что если у нас будет такая ситуация, логично, что наша аналитика сразу «поедет».

в целом написана ерунда. read committed из стандарта ANSI не гарантирует консистентность данных на момент старта запроса. такие гарантии дают оракл и постгрес т.к. на самом деле у них более строгий read committed, чем требует стандарт. тот же mssql на read committed может прочесть одну и ту же запись несколько раз, если по мере чтения запись куда-то переезжала (например из одной партиции в другую). по той же причине может пропустить запись. и такая лажа, как минимум по мнению майкрософт, соответствует стандарту.
sqlperformance.com/2014/04/t-sql-queries/the-read-committed-isolation-level

tdenisova Oct 8 2020 at 00:07

Полезный комментарий и спасибо за ссылку! Пометила в комментариях к лекции.
Этот случай как нельзя лучше подсвечивает, что общие лекции показывают направления, которые нужно иметь в виду и в которые можно копать. Каждый продукт имеет свои особенности, и путь к успеху — не смотреть слепо на стандарты, а, берясь за то или иное решение, изучать как именно оно устроено изнутри.

zby Oct 8 2020 at 00:07

Не говорите ерунды, S-блокировка не даст этого сделать в рамках одного чтения

Yo1 Oct 8 2020 at 09:12

блокировочный read committed ставит shared блокировку лишь на одну единственную запись из огромной выборки необходимой для чтения, соответственно параллельным транзакциям ничего не мешает апдейтить записи, что уже были считаны.
ознакомьтесь с основами.

zby Oct 8 2020 at 09:17

Ладно-ладно, признаю, может такое быть в принципе, но на практике ни разу с таким не сталкивался, да и блокировку стараюсь держать до конца транзакции, где это необходимо

sshikov Oct 6 2020 at 18:22

>Самые популярные столбцовые — это, наверное, Cassandra, HBase и ClickHouse.
Вы забыли про Hive. Берем паркет, и опа — получаем столбцовую БД, вообще говоря. Ну, может не совсем — но таки почти.

Ivan22 Oct 8 2020 at 16:49

Вообще как-то их называют больше Колоночные БД aka «Columnstore». И их очень много — я бы самыми популярными Snowflake и Redshift назвал.

sshikov Oct 8 2020 at 17:40

Ну, тут написано самые популярные, мне сложно оценить, на самом ли деле так для всех. Я просто к тому что в мире BigData самая популярная точно Hive, и она на выбор — хочешь по строкам храни, хочешь — по колонкам.

oxff Oct 7 2020 at 07:01

Это что ещё за "No lock" в Postgres выдумали? Уровень изоляции "Read uncommitted" там не поддерживается.

Про эскалацию блокировок на уровень таблицы тоже очень расплывчато написано. Будто бы так делают все РСУБД. Это неправда.

leventov Oct 7 2020 at 10:28

Cassandra и HBase это не столбцовые БД, если брать определение из вашей же лекции. Это "wide column store", которые по сути являются key-value БД c небольшим сахаром поверх.

sshikov Oct 8 2020 at 17:42

Ну, хранят в HBase вроде все-таки в порядке column group, насколько я помню (хотя могу ошибаться)? Скорее всего эти понятия могут перемешиваться, на уровне API — key-value, на уровне физического хранения — по колонкам.

funny_falcon Aug 6 2021 at 18:14

Нет. Cassandra (ScyllaDB) и HBase реализуют одинаковую идеалогию двух-уровневого key-value: partition key + clustering key. Отличие: в Cassandra partition key распределяется в distributed hash table, а в HBase он тоже "сортирован".

Каждый ((pk, ck), value) - это отдельная запись в сторадже с временем вставки и возможным маркером удаления. В HBase даже можно использовать время вставки как третий ключ, и получать историю изменения одного value.

Колоночными их назвали по ошибке, потому что в английском они использовали понятие wide column : в одной Row (которая есть value для partition key) может быть огромное множество полей (field) с не фиксированными именами.

https://en.wikipedia.org/wiki/Wide-column_store

Wide-column stores such as Bigtable and Apache Cassandra are not column stores

Вот ClickHouse - истинно колоночная база данных. А также Amazon RedShift, Greenplum, Sybase IQ (SAP IQ), KDB и другие

https://en.wikipedia.org/wiki/List_of_column-oriented_DBMSes

Так же можно считать "колоночными базами" различные Hadoop/BigData движки запросов (Presto, Hive, Spark) поверх специальных форматов файлов (Parquet, ORC).

sshikov Aug 6 2021 at 18:22

>Так же можно считать «колоночными базами» различные Hadoop/BigData движки запросов (Presto, Hive, Spark) поверх специальных форматов файлов (Parquet, ORC).
Ну да, наверное. Только надо понимать, что умение читать из паркета одну или две колонки из 100 — это не совсем неотъемлемое свойство движка, т.е. это делает оптимизатор, а он не факт что безгрешен в этом плане. Вполне могу представить ситуацию, когда оптимизатору спарке не хватит информации для принятия решения, что можно выбрать всего одну колонку.

Vadem Oct 7 2020 at 15:11

Спасибо за статью.
Можно ещё порекомендовать пару книг на эту тему для тех кто хочет копнуть немного поглубже:
Database Internals и Designing Data-Intensive Applications.
Отзывы у обеих, ИМО, немного завышены, но они стоят прочтения.

Ivan22 Oct 8 2020 at 17:04

Добавлю про кейс «Блокирование переговорки» — это классическая задача имеющая классических же 2 подхода — «оптимистическую» и «пессимистическую» типы блокировки.
При оптимистическом — переговорка не блокируется пока юзер (процесс обновления)
думает. И параллельный процесс может ее взять и забронировать пока первый все еще думает. Первый додумав и решившись таки — получит ошибку вида «упс, кто-то уже забронировал вы не успели». Оптимизм в том что мы думаем что никто другой не успеет взять наш ресурс.
При пессимистической блокировке — переговорка блокируется на запись сразу же как первый юзер ее открыл и начал думать. Понятно конкуренты могут ее видеть но сделать ничего с ней ничего не могут, пока первый не или не закоммитится или тайм-аут блокировки не пройдет. Пессимизм в том что мы сразу думаем что мы тут не одни, и обязательно кто-то нашу переговорку захватить захочет.

Плюсы оптимистической стратегии блокировок — нет захвата ресурсов, и конкурентам не надо ждать конца тайм-аута пока освободится ресурс. Хорошо подходит там где все заходят «я только посмотреть», а % реальных броней переговорок мал.
Плюсы пессимистической стратегии — не надо пытаться успеть, если ты уже нашел свободный ресурс. Думай свои 15 минут, переговорку не уведут. Подходит там где люди не толпятся чисто посмотреть, а заходят реально забронировать ресурс и % ресурсов разблокирующихся по таймауту мал.