7workers 19 июл 2009 в 09:21

Краткий обзор движков таблиц MySQL

3 мин

77K

MySQL*

+93

Комментарии 73

НЛО прилетело и опубликовало эту надпись здесь

evgenyk 19 июл 2009 в 10:33

Нужная статья, таких надо больше. Коротко и по делу.

GarretUA 19 июл 2009 в 11:16

Ничего полезного в статье нет. Это для тех что ли, кто не знает английский и не может прочитать сухие технические данные из документации?

А нужные статьи с подходом «практика» и сравнением движков уже написаны.

-3

evgenyk 19 июл 2009 в 11:30

Все уже где-то когда-то написано. Мне полезно было ознакомиться с сегодняшним состоянием дел с MySQL. А в документацию лезть некогда. Кто знает — читает заголовок и пропускает.

dex7er 20 июл 2009 в 20:43

Разве не удобно когда у тебя на одной странице описаны основные характеристики движков мускула? Или легче для этого перерыть десяток отдельных страниц документации?

ashmind 21 июл 2009 в 02:43

Я согласен. Это неплохо, но в целом вместо перевода/пересказа/etc было бы гораздо интереснее прочитать личный опыт (это касается всех тем, не только MySQL).

DeMeN 21 июл 2009 в 10:26

Отличная шпаргалка, в закладки.

errd 21 июл 2009 в 11:47

Очень содержательный комментарий, надо таких больше. Коротко и по делу.

3em 20 июл 2009 в 02:18

А минусы-то забыли…

ipod 20 июл 2009 в 22:24

Дак и плюсов нет — они все в пуктах перечислены.
Есть рекомендации и советы.

fStrange 20 июл 2009 в 22:25

за подборку спасибо

Движек. реплекация, улучшеный
ДвижОк реплИкация, улучшенНый поправьте в статье, режет глаз.

Вообще с орфографией не очень :(, проверить бы текст хотя бы Вордом.

MaxxArts 20 июл 2009 в 22:55

Присоединяюсь. Если переводите, то, пожалуйста, на русский.

НЛО прилетело и опубликовало эту надпись здесь

Holy_Cheater 20 июл 2009 в 23:31

Пустые заявления. Аргументируйте, или еще лучше напишите запись в блоге. Мне искренне интересно.

НЛО прилетело и опубликовало эту надпись здесь

OdobenusRosmarus 21 июл 2009 в 02:47

collations? кластер? partitioning? raw disk? memory engine?

Rulin 21 июл 2009 в 07:33

По аналогии с этим топиком habrahabr.ru/blogs/linux/64957/ захотелось создать тему «Мифы и заблуждения, касающиеся MySQL» (спешл фор постгре юсерс)

nekt 21 июл 2009 в 07:19

Я люблю постгресс за возможность поиска по массивам и хэшам, хранящихся в ячейках таблиц.
Это позволяет гораздо удобнее работать с объектами — сохранять и восстанавливать их в/из БД.

ddakapoh 28 авг 2009 в 16:15

Потому что нет проблем с ibdata.

dewil 21 июл 2009 в 00:35

Пользую обе базы.
MY — простая база, есть на всех хостингах. Часто заказывается клиентом при разработках.
PG — для серьезных проектов. И работать мне с ним на порядок приятней, один только CLI чего стоит по удобству. (работаю в шеле)

ashmind 21 июл 2009 в 02:40

Юзайте DB2 Express-C! (он намного быстрее, чем MySQL и фишек больше).

indapublic 21 июл 2009 в 03:26

Тогда уж Oracle, он удобней в администрировании, да и спецов на поддержку больше

ibnteo 21 июл 2009 в 06:27

Хорошо что хоть не MSSQL предлагаете. И вообще, чего по реляционным базам всё, давайте переходить на объектные :)

ashmind 21 июл 2009 в 11:34

Ну во первых MSSQL круче DB2 на порядки по простоте, удобству и кое-где по скорости (с Oracle не сравнивал).
Я его не предлагаю только потому, что он Win-only (и лимита на размер бесплатной базы).

ashmind 21 июл 2009 в 11:37

Что касается object и document DB — напишите статью, будет оч. интересно, особенно если с опытом на большом объёме.
Выглядят они неплохо, но сам не пробовал.

Помню статью «давайте откажемся от реляционных баз», которую писали замучанные MySQL авторы какого-то стартапа.
У них индексы создавались несколько часов, локи, etc. Ну да, от такой базы мы и сами отказались.

silverwind 22 июл 2009 в 00:01

Поищите здесь же на хабре «db4o» — должна быть статья про объектную базу данных.

ibnteo 21 июл 2009 в 06:27

Хорошо что хоть не MSSQL предлагаете. И вообще, чего по реляционным базам всё, давайте переходить на объектные :)

ashmind 21 июл 2009 в 11:31

4 Gb ограничение на размер бесплатной базы и 1 Gb на память.

indapublic 22 июл 2009 в 02:24

Ах да, забыл что с ограничениями либеральней у DB2, sorry :)

ZloeSabo 20 июл 2009 в 23:02

медленная при чтение по ключу
Исправьте пожалуйста.

django 20 июл 2009 в 23:51

Чего ж про falcon так мало? А federated? Руки устали копировать?
Да и вообще практической ценности никакой, кто бы там что не говорил про «удобство», любой может это за 10 минут накопировать из мануала. Про механизмы надо читать подробно, понимать их сущность, как они работают, а не по этим столбикам выбирать «при проектировании». Ладно бы ещё полная таблица была, а тут и то, незаконченные огрызки.

Aco 21 июл 2009 в 00:04

webiteam.ru/2009/03/mysql-storage-engines/

alergi 21 июл 2009 в 00:12

Я бы не сказал, что InnoDB — самый лучший для больших таблиц и самый быстрый.
Особенность механизма хранения индексов в InnoDB может как ускорить работу с базой, так и подвесить намертво самоё мощное железо.
Вот пример, как упал сервис Яндекса из-за InnoDB — softwaremaniacs.org/blog/2008/02/22/why-offline-crashed/

Дело в том, что он перестраивает индексы по порядку, собственно это и даёт скорость. Но если у вас вставляется множество данных с случайным ключом, те же сессии, это подвешивает жёсткий диск намертво.
И не говорите, что это ошибка конкретно этих программистов, многие из популярных скриптов, CMS, форумов и пр. тоже стартуют сессию на каждого посетителя.

P.S. вообщем, к выбору движка надо подходить с умом и для каждого проекта решать этот вопрос индивидуально.
У MyISAM есть уникальные преимущества (тот же полнотекстовый поиск), а дополнительные возможности более мощной InnoDB и тем более PostgreSQL, Microsoft Server, Oracle, DB2 далеко не всегда нужны.

alkhankhel 21 июл 2009 в 05:58

Иногда имеет смысл некоторые таблицы переводить в MyISAM.

recoilme 21 июл 2009 в 09:30

>> Вот пример, как упал сервис Яндекса из-за InnoDB — softwaremaniacs.org/blog/2008/02/22/why-offline-crashed/

Сервис упал не из-за ИнноДб, а из-за криворукости программистов.
1. Primary key — md5-хеш — иначе как долбоебизмом это я назвать не могу
2. На индексе была одна выборка с join'ом четырех таблиц, одна из которых — самая здоровенная таблица базы

Кстати, собственно Салагаев ни в чём ИнноДб не обвиняет, а пишет о своих косяках и к чему они привели.

alergi 21 июл 2009 в 10:14

1. Да все использует md5 или что-то подобное для генерации идентификатора сессии. А что Вы предлагаете? Автоинкрементный ключ? Так это потенциальная дыра в безопасности. Ключ обязательно должен быть случайным.
2. База упала не из-за сложной выборки, а из-за множественных вставок записей в БД.

И повторюсь это не ошибка конкретных программистов, например, вся тройка форумов рунета PHPbb, IPB, vBulletin стартует сессию на каждого гостя и их разработчики не считают это решение криворуким.

recoilme 21 июл 2009 в 12:37

Стартовать сессии для гостей хранящиеся_в_БД — простите бред.

Тем более — на главной Яндекса. Насколько я понял — Салагаев просто не ожидал такого поведения (сохранения сессий в БД) от Джанго.

ИнноДб — здесь не причём абсолютно. Хватит уже распространять мифы. Для кластерных индексов в любой_бд — будет строиться дерево.

Как готовить сессии:

1. если необходимо хранить какую то временную информацию для гостей — целесообразно сохранять данные сессии в куки.

Зачем это нужно? Вот пример:

Допустим, что пользователь залогинился на вашем сайте. После авторизации вы можете добавить его username и email в cookies сессии, что сделает эту информацию доступной везде — без необходимости подключения к базе данных.

2. Сохранение данных о сессии в базу данных

Пока информация хранящаяся в cookies пользователя содержит ID сессии, вы не имеете возможности проверить его, в отличие от варианта когда данные сессии хранятся в базе данных. Для приложений, которые не требуют высокого уровня безопасности, проверка ID сессии не является обязательной, однако, если ваше приложение требует высокого уровня безопасности, то проверка становится обязательной.

Если данные сессии находятся в базе данных, то каждый раз, когда в cookies пользователя обнаруживается рабочая сессия, осуществляется запрос к базе данных — с целью сравнить ID сессий. Если ID сессии не совпадают, то сессия разрушается. ID сессии никогда не обновляется, он может быть лишь сгенерированным, когда сессия создается.

recoilme 21 июл 2009 в 12:47

Другими словами хранение сессий в БД необходимо там, и только там, где необходима высокая безопасность. Для того, чтобы злоумышленник — укравший кукис пользователя не мог, например, списать средства со счета пользователя.

Для этого и сохраняются сессии в бд и сверяются с кукис. И если, изменился айпи и, опционально, браузер — запрашивается дополнительная авторизация.

Более того, данную информацию целесообразно шифровать.

Рекомендую посмотреть на реализацию класса сессий в движке codeigniter (PHP): www.code-igniter.ru/user_guide/libraries/sessions.html

Там есть и шифрование, и опциональное сохранение в БД с синхронизацией и flashsdata для временных данных.

MD5 для ключа — кстати, вполне оправдано. Здесь я был не прав.

alergi 21 июл 2009 в 14:32

Миф говорите, прочтите документацию по InnoDB:

… and new rows are inserted in the ascending order of the primary key.

… и новые строки вставляются отсортированными по первичному ключу.

Т.е. при вставки записи со случайным ключом, БД будет перестраивать файл, при этом если файл большой, то движок активно будет использовать swap. В отличие от MyISAM, который новые записи просто добавляет в конец файла. В каком случае нагрузка на жёсткий диск будет больше вообщем понятно.

И это касается всех таблиц, где в качестве Primary Key используется случайное (неавтоинкрементное) число, а не только сессий, их просто для примера привел.

recoilme 21 июл 2009 в 14:59

Это абсолютно верное поведение кластерных индексов, соответствующее стандарту SQL.
Кластерные индексы медленнее на вставке и быстрее на селектах.
Если разработчик этого не знает — это не проблема движка, это проблема разработчика.

Если необходимо избежать данного поведения достаточно было сделать автоинкрементное поле integer — primary, а значения хэша хранить в отдельном поле, по которому построить уникальный secondary index.

Именно это написано в мануале — Clustered and Secondary Indexes: www.dev.mysql.com/doc/refman/5.1/en/innodb-index-types.html

Какая то неинтересная дискуссия. Предлагаю закрыть.

Aco 22 июл 2009 в 18:16

crc32(md5("..."))

kashey 21 июл 2009 в 10:45

пару лет назад таблицы с авторизацией\сессиями перевел с MyISAM на InnoDB
работать стали раза в два быстрее, так как убрались локи…

пару месяцев назад таблицы с авторизацией\сессиями перевел с и InnoDB на Memory
итого полумертвый сервер(load 600%/800%) стал почти что idle ( 100%/800% )
а полгига памяти мне не жалко

xvoland 21 июл 2009 в 01:34

Мой опыт:

MyISAM (~150Гб). 5 лет жёсткой эксплуатации, проблем — нет. Ничего не ломалось и не падало.

alergi 21 июл 2009 в 01:52

Вы понимаете, что Вы лишили аргументов всех фанатов InnoDB и PostgreSQL :)

xvoland 21 июл 2009 в 02:58

Это только мой опыт.
Думаю, что у тех кто использует InnoDB, PostgreSQL, Microsoft Server, Oracle, DB2 и т.д. — свой :-)

ibnteo 21 июл 2009 в 06:30

Почему-то пишут что MyISAM упадёт обязательно, и что надо в кроне держать команду проверки целостности.

OdobenusRosmarus 21 июл 2009 в 06:48

А у вас лично какой опыт?
у вас лично, как он, myisam. Падает?

ibnteo 21 июл 2009 в 06:57

У меня опыт InnoDB, а об этой особенности MyISAM читал в интернете. Не хочется учиться на своих ошибках. Хотя MyISAM скорее всего придется использовать для полнотекстового поиска.

recoilme 21 июл 2009 в 09:18

На заборе тоже написано…

ibnteo 21 июл 2009 в 12:01

Напишите статью по этому поводу, что мол MyISAM отличный движок. А то пока видел обратное — MyISAM не любит отключения питания, временами портится без видимых причин, восстановить не сложно, но требует ручного вмешательства. Не буду же я проверять на себе, лучше доверюсь чужому опыту. И поверю тем, кто написал об этом, а не кто промолчал :)

xvoland 21 июл 2009 в 20:05

MyISAM — не лучше и не хуже :) там просто другие принципы.

Это всёравно, что сравнивать BMW, Audi и т.д. у них есть что-то общее, но разные технологии. Где-то нужна скорость, а где-то проходимость… Высокий или низкий клиренс…

Все стремятся к чему-то оптимальному, вот и технологии разные. Ещё нужно учитывать разные войны патентов и т.д.

ibnteo 21 июл 2009 в 20:13

Это понятно, иначе бы не существовало столько движков.

OdobenusRosmarus 22 июл 2009 в 18:07

Прямо видели как портится без видимых причин? Вам повезло, мне за 10 лет работы с myisam не удалось это увидеть.

Номер бага можете привести, я хочу посмотреть?

ibnteo 22 июл 2009 в 18:10

Я ничего не видел, прочитал об этом в интернете, когда выбирал движок для своей первой мускульной базы.

OdobenusRosmarus 21 июл 2009 в 03:01

>макс. записей: 2^32

Из документации

There is a limit of 2^32 (~4.295E+09) rows in a MyISAM table. If you build MySQL with the --with-big-tables option, the row limitation is increased to (2^32)^2 (1.844E+19) rows. Binary distributions for Unix and Linux are built with this option.

xvoland 21 июл 2009 в 03:24

Помню, что в версии 3.23 можно создавать таблицы до 8 миллионов терабайтов (2 ^ 63 bytes)!
А, сейчас уже 5 версия!!!

progit 21 июл 2009 в 08:03

ну так 2^32 это же не объем данных, а кол-во записей.
Да и врядли где-то будет использоваться база с объемом в 8 миллионов террабайтов :-D

Xaljava 21 июл 2009 в 09:47

Когда-то и гигабайт казался фантастикой :) А сегодня терабайт уже повседненая реальность. Разработчики далеко вперед заглядывают (и правильно делают).

progit 21 июл 2009 в 10:51

Ну… если грамотно заглядывать (как в Sun), то это конечно хорошо =)
Но бывают случаи… когда незнаешь — то ли плакать, то ли смеяться :(

sfghelios 21 июл 2009 в 11:31

А информация о всех жителях и их телефонных разговорах, информация систем глобального фото-видеонаблюдения Вы думаете, где хранится? :-)

progit 21 июл 2009 в 11:49

Ну я не думаю, что в базе MySQL ;)

xvoland 21 июл 2009 в 19:59

почему нет?
видео поток и фотки, конечно, не стоит пихать в БД, а вот всё остальное…

progit 21 июл 2009 в 11:57

А может вообще все это дело пишется в один такой бАльшой файлик? Типа как squid =)
* на правах шутки

phoinixrw 21 июл 2009 в 10:05

Статья ни о чем.
Перевод документации, причем неполный, а в конце, так вообще абзац на каждый тип.
А подводные камни? И вообще:

Например тип MERGE:
1. Только на основе таблиц MyISAM — про это — ни слова. Разве это не важно? А почему только на основе такого типа?
2. цитирую: «не отслеживаются изменения в структуре исходных таблиц (таблица будет поломана)» — Что значит поломана? Что значит не отслеживаются? К чему это приводит? Как это исправить?
3. цитирую: «Рекомендации: «удобная» (ре)организация таблиц» — если честно, данная рекомендация ставит в тупик.

Тема «сисек» — не раскрыта.

-1

DmitryKoterov 21 июл 2009 в 16:04

> InnoDB — самый быстрый из всех известных движков для БД
> основанных на дисках
Можно источник цитатов?

Мои тесты НА ЗАПИСЬ показывают прямо противоположный результат. InnoDB отстает от того же PostgreSQL 8.3 при большом потоке параллельных записей (в том числе — проводимых пачками) в несколько раз. Кроме того, в InnoDB в зачаточном состоянии управление sync-ами, да и просто процессом сброса страниц на диск. Даже Percona Patches тут мало помогает.

Что касается чтения, то, возможно, на чтение по первичному ключу InnoDB и правда несколько быстрее, чем тот же Постгрес (это я не проверял), однако мне кажется, что для подобных целей все же лучше использовать нереляционные СУБД. На сложных запросах (всякая там статистика и т.д.) планировщик MySQL попросту не справляется, тут уже движок таблиц мало влияет.

OdobenusRosmarus 22 июл 2009 в 18:13

Ссылку на тесты дайте, я хочу посмотреть.

pwlnw 24 июл 2009 в 02:46

А вы заметили что innodb для соблюдения стандарта ACID при каждой фиксации транзакции записывает на диск и не возвращает ответ до завершения этой операции? Пробовали изменять innodb_flush_log_at_trx_commit?

goran 21 июл 2009 в 16:45

# двоичные логи пишуться

// исправьте, что-ли

edhell 21 июл 2009 в 17:15

# SELECT (*) FROM table работает гораздо медленнее, чем MyISAM — создавайте триггеры если нужно

имелся ввиду COUNT?

# бэкап простым копирование файлов невозможен

Буквально на днях восстанавливал из бэкапа такую БД: был полный бэкап каталога с данными mysql. Скопировал каталог на свою девелоперскую машину. Начал запускать mysql — ругается на размер чего-то (походу файлов innodb), поменял конфиг — запустился. Сделал дамп и восстановил на серваке.

pwlnw 24 июл 2009 в 02:51

Видимо, хотели предостеречь от копирования файлов в случае если каждая таблица innodb в отдельном файле. Некоторые по незнанию бекапят эти файлы, а толку не будет.

НЛО прилетело и опубликовало эту надпись здесь

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Краткий обзор движков таблиц MySQL

Комментарии 73

Публикации

Истории