samokhvalov Feb 5 2008 at 00:07

Слоны уже тут. Быстрые, надёжные, мощные. PostgreSQL 8.3!

2 min

PostgreSQL*

+41

Comments 97

UFO just landed and posted this here

samokhvalov Feb 5 2008 at 00:38

тип данных xml, правильная сериализация/десериализация, ну и да функции экспорта (XMLELEMENT, XMLAGG и т.д.) по стандарту

zolotukhin Feb 5 2008 at 00:43

В частности, это возможность хранить данные в специальном XML-типе (теперь встроен в ядро PostgreSQL), возможность выполнять xpath-запросы по таким колонкам (даже используя индексы!), куча функций для т.н. публикации XML и еще много чего интересного...

samokhvalov Feb 5 2008 at 00:44

ну, индексы использовать можно не для выполнения xpath-запросов, а, скорее, для избежания их выполнения %-)

zolotukhin Feb 5 2008 at 00:48

верно, но факт остается фактом: легко можно добиться очень быстрого выполнения запросов вроде SELECT * FROM table WHERE xml_column = xpath('/company/employee/firstname') = 'John'; (ну синтакс не точный, ну приблизительно).

zolotukhin Feb 5 2008 at 00:51

блин, чушь написал, конечно
правильнее так:
SELECT * FROM table WHERE xpath(xml_column,'//company/employee/firstname')[0] = 'John';

UFO just landed and posted this here

zolotukhin Feb 5 2008 at 00:55

да, если ваши запросы смогут использовать функциональный индекс, скорость будет превосходна. уже существуют production-системы с сотнями тысяч (не супер объем, но все же) XML-документов, которые используют именно эту функциональность в PostgreSQL.

samokhvalov Feb 5 2008 at 00:58

Скорость конечно на уровне, ибо легко в таком случае заюзать обычный функциональный btree-индекс ;-)

А реляционные БД давным-давно в прошлом, смотрите стандарт, другие СУБД. Всякие там анонимные строчные типы, массивы и тд и тп. В Постгресе это intarray, hstore с нормальными GiST/GIN-индексами от Олега и Фёдора. Слабоструктурированные данные в реляционке хранить теперь просто и приятно. EAV во многих случаях уходит на второй план, т.к. проигрывает в гибкости разработки и прозводительности.

samokhvalov Feb 5 2008 at 00:59

Кстати, система тэгов и всякие там специализированные каталоги в соц. сетях (типа школ, вузов, компаний и т.п.) это вот как раз такие случаи.

Постараюсь рассказать об этом подробнее в ближайших заметках.

DorBer Feb 5 2008 at 01:00

Интересно, это каким же образом b-tree индекс ускорит xpath? Неужели каждый узел dom-модели xml отдельно в индекс суется? Бредятина, сэр!

-2

samokhvalov Feb 5 2008 at 01:03

Для упомянутого SELECT-a:

CREATE INDEX i_zzz ON table1 USING btree((xpath(xml_column,'//company/employee/firstname')[0]));

DorBer Feb 5 2008 at 01:30

Не вижу смысла в этом. Зачем делать индекс на запрос xpath? В таком случае гораздо быстрее будет данные не в xml хранить. А что делать в случае, если запрос xpath генерится в процессе работы? Индексировать каждый? Я все к тому, что производительность при использовании xpath к полю xml будет не очень... Хотя не могу отрицать полезность этого дела в частных случаях.

zolotukhin Feb 5 2008 at 01:35

да, вы правы. именно об этом и речь. просто я лично именно с таким счастливым случаем и сталкивался: модель данных предполагала хранение исключительно в XML; наиболее распространенными выборками при этом были запросы на сравнение значений определенных узлов XML-деревьев. конечно, можно распарсить эти значения и хранить их в varchar-колонках, к примеру. но куда приятнее использовать встроенные возможности, функциональный индекс и дополнительные XML-фильтры, когда запрос по индексу уменьшил кол-во возвращаемых записей до нескольких десятков, согласитесь.

khim Feb 5 2008 at 07:11

К одной неработающей модели добавили другую неработающую модель - в чём проблема ?

Если честно, то дальше BDB API (запрос данных по ключу плюс транзакции) всё абстракции "протекают", причём очень сильно. По хорошему - их лучше бы вообще не пользовать (все абстракции "протекают", но когда масштаб "протечек" превышает определённый рубеж, то борьба с ними превышает выигрыш об абстракций), но столько рекламы здравому смыслу никогда не перебить...

maximkr Feb 5 2008 at 08:58

7 лет ковыряний с одним продуктом запросто справляются с рекламой :-) Мы именно до этого уровня (запрос по ключу + транзакции) и добрались в итоге, но борьба с протечками заняла в самом деле очень много времени:
http://maximkr.livejournal.com/12147.htm…

Причем транзакции тоже под вопросом: если приложение достает данные из СУБД не каждый раз, а вынуждено что-то хранить в памяти, то эти данные в памяти СУБД-шными транзакциями уже не охватываются и приходится блокировки, их репликацию между узлами кластера и т.п. писать вручную.

Timosha Feb 11 2008 at 15:46

только этта
SELECT (xpath('/value/text()',data))[1] FROM xmltable where cast((xpath('/value/text()',xml_column))[1] as text) like '%ab%';
и индекс соответсвенно:
CREATE INDEX i_zzz ON xmltable USING btree(cast((xpath('/value/text()',xml_column))[1] as text));
только это никак не помогает в like запросах

ignatov Feb 5 2008 at 00:39

— Слон полосатый, редкий, очень любит рыбий жир, при звуках флейты — теряет волю… ©

DorBer Feb 5 2008 at 00:48

Сколько можно об одном и том же? Уже как минимум третий пост про постгрю.

samokhvalov Feb 5 2008 at 00:49

а где первые два?

DorBer Feb 5 2008 at 00:56

Один пост автор убрал, потому что был вторым и его начали жестоко минусовать. Второй вот. Вот тут про справочник для 8.3.

Надоело читать повторы, уже в помойку Хабр превратили. Пользуйтесь поиском.

-1

samokhvalov Feb 5 2008 at 01:01

ну, блог "я умный", видимо, не лучшее место.

а справочник не в тему, это не объявление о выходе.

моя статья о новинках 8.3 тут была ещё в октябре, её вы почему не вспомнили? ;-)

DorBer Feb 5 2008 at 01:26

Потому что она ваша :)

samokhvalov Feb 5 2008 at 01:06

Автору того поста подкинул кармы. Подкиньте кто-нибудь ещё, чтобы в будущем постил в правильные блоги и дублей становилось меньше ;-)

beskov Feb 5 2008 at 01:14

какое неприкрытое лобби, ай-яй-яй! )

beskov Feb 5 2008 at 01:13

Справочник, как и этот пост, опубликован в соответствующем сообществе. Если вам не нравится, как работает хабр в смысле вывода на главную тематических сообществ - жалуйтесь создателям.

DorBer Feb 5 2008 at 01:32

Всё, сдаюсь :)

dmach Feb 5 2008 at 01:37

А LINQ они планируют поддерживать?

vittore Feb 5 2008 at 10:17

животрепещущий вопрос, но это скорее к мелкомягким)

dmach Feb 5 2008 at 10:59

Почему же? Им нужно самостоятельно реализовать необходимые интерфейсы. Никто не будет это делать за них, тем более Microsoft.

DorBer Feb 5 2008 at 01:48

Товарищи Самохвалов и Бесков проведите нам семинар по новым функциям, производительности и т.п.

0x62ash Feb 5 2008 at 05:06

Господа, а кто-нибудь может доступно обрисовать сравнение PostgreSQL vs MySQL?

kronos Feb 5 2008 at 07:32

http://wiki.sysfaq.ru/wiki/MySQL_vs_Post…
http://tweakers.net/reviews/657/6
http://www-css.fnal.gov/dsg/external/fre…

0x62ash Feb 5 2008 at 07:42

1 - значит на маленько-средних проектах MySQL выигрывает (хотя возможно, что более глубокий тюнинг позволит выигрывать и на больших проектах с большими нагрузками)
2 - аналогично
3 - outdate

norguhtar Feb 5 2008 at 09:51

Не будет он выигрывать на больших проектах с большими нагрузками на одной СУБД.

WoZ Feb 5 2008 at 11:39

если смотреть на второй тест, то непонятно как "глубокий тюнинг позволит выигрывать".
более чем в 10 раз разогнать не получится)

0x62ash Feb 5 2008 at 12:03

Там разница всего в 2 раза при максильном конкуренси.
Опять же, тесту больше 1 года уже...

WoZ Feb 5 2008 at 12:10

ой. извиняюсь. я о первом
http://wiki.sysfaq.ru/wiki/MySQL_vs_PostgreSQL

5.0.32-Debian_3-log vs PostgreSQL 8.1.8 on i486-pc-linux-gnu
в PostgreSQL может и есть изменения, но в MySQL я не замечаю никаких изменений в сторону увеличения производительности (з.ы. сам пока юзаю MySQL)

0x62ash Feb 5 2008 at 12:23

Этот тест у меня вызывает сомнения если честно.
Я вот тоже нашел "MySQL Beats Sybase and PostgreSQL in Throughput and Power Efficiency", но к сожалению будут перетестровать, так как из Sybase пожаловались =)

http://www.worlds-fastest.com/wfz988.html

zolotukhin Feb 5 2008 at 13:00

Могу здесь сказать только одно: в постгресе с времен 8.1.8 произошли без преувеличения гигантские изменения в сторону улучшения производительности, читайте хотя бы описание этого релиза, даже опуская новшества версии 8.2.

zolotukhin Feb 5 2008 at 11:41

Если в проекте нужны транзакции (практически в любом проекте с ненулевой надежностью они нужны), то PostgreSQL обгоняет MySQL по скорости на любых размерах, начиная с небольших проектов и кончая гигантскими вроде Skype.

corp Feb 5 2008 at 13:31

imho, не так всё просто. хватает примеров огромных проектов, отлично чувствующих себя на MySQL (те же гугл, яху).

zolotukhin Feb 5 2008 at 13:56

да, конечно, вы правы.
полно вполне нормальных ситуаций, когда даже и транзакции-то не нужны: например каунтеры li.ru работают на MySQL, потому что ценности в информации об одном из сотен миллионов кликов в сутки нет никакой. но если нужна mission critical запись в БД, с MySQL не все так радужно по общему мнению.

kashey Feb 5 2008 at 08:39

А правдо ли что с мускула можно безболезнено перейти на постгрес?
А вот на ораклы и другие сайбезы точно низя( нету оператора LIMIT, то да се, так да сяк )

samokhvalov Feb 5 2008 at 10:01

Истинная правда
http://www.postgresql.org/docs/techdocs.…

glebofff Feb 5 2008 at 10:33

Если есть уже готовый проект, "заточенный" под MySQL, то безболезненно - не получится.
Взять всё те же ENUM, SET, inet_aton/inet_ntoa, INSERT DELAYED, password, etc, etc.

zolotukhin Feb 5 2008 at 11:36

совсем безболезненно не получится, но усилия стоят того проверено на личном опыте, мигрировали живую production-систему.

glebofff Feb 5 2008 at 12:36

Опыт и у меня есть, благодаря ему я дождусь 8.3.4, прежде чем что-то предпринимать. :-) А усилия действительно стоят того.

samokhvalov Feb 5 2008 at 12:08

всё, что перечислено в этом небольшом списке, — не проблема, всё делается легко

glebofff Feb 5 2008 at 12:31

Также, как и здесь? :-)

-1

zolotukhin Feb 5 2008 at 12:51

не совсем понятно, причем здесь дискуссия на sql.ru о том, как правильно пиарить PostgreSQL и решения на его основе?

glebofff Feb 5 2008 at 12:58

PostgreSQL или postgresmen?

-1

zolotukhin Feb 5 2008 at 13:08

PostgreSQL. Причем здесь вообще Постгресмен?

glebofff Feb 5 2008 at 14:13

При том, кто есть samokhvalov, и его "всё делается легко". Видимо, по ссылочке вы бегло прочитали.

zolotukhin Feb 5 2008 at 15:40

если что, то в той дискуссии iz это я :)

glebofff Feb 5 2008 at 17:31

Нет привычки в профайлы смотреть. Тогда, конечно, всё решительно меняет дело. :-)

davojan Feb 5 2008 at 13:53

ENUM в 8.3 как раз сделали.
INSERT DELAYED можно заменить на использование асинхронных транзакций достаточно безболезненно.

glebofff Feb 5 2008 at 14:19

ENUM, несмотря на его очевидные преимущества, мягко говоря, не совсем тот, к которому привыкли пользователи MySQL.

Речь всё-таки о:
» А правдо ли что с мускула можно безболезнено перейти на постгрес?

А теперь представьте, что по старой привычке у Вас полмиллиона запросов, разбросанных по многочисленным клиентским и т.п. приложениям выбирает enum-значения по их целочисленному индексу.

davojan Feb 5 2008 at 14:47

Насчёт реализации ENUM'а не вникал, спасибо за инфу - посмотрим.
А насчёт запросов enum по целочисленному значению, да ещё и по всему проекту - редкостное извращение - зачем енум-то в таком случае :)

oisee Feb 5 2008 at 08:47

давно мучаюсь. как невыговариваемое название PostgreSQL принято произносить по-русски? =)

ProRunner Feb 5 2008 at 09:50

ПоустгрэЭсКьюЭл?

samokhvalov Feb 5 2008 at 10:02

неправильно

Постгрес-Ку-Эл

а лучше просто Постгрес

0x62ash Feb 5 2008 at 10:20

http://www.postgresql.org/files/postgresql.mp3

oisee Feb 5 2008 at 13:27

это транскрибирование с английского, всё также невыговариваемое по-русски :)

остановился на: "постгр'ескул" ^_^ (post-grEs-cool)

simonoff Feb 5 2008 at 10:54

такс... Энто хорошо... бум обновлять сервак :)

neochapay Feb 5 2008 at 11:38

Все приемущества слона грубо обрываются на том что его мало где найдёшь на хостингах да и движки в бОльшем случае юзают мускуль :)

zolotukhin Feb 5 2008 at 11:44

Хорошие движки поддерживают PostgreSQL, потому что поддерживать его легко. Что касается хостинга то да, с ним есть проблемы. Но ситуация меняется в лучшую сторону, потому как спрос на постгрес растет неуклонно.

UFO just landed and posted this here

neochapay Feb 5 2008 at 12:33

Вопрос - какие CMS используют постгрис - особенно про OpenSource интересует

zolotukhin Feb 5 2008 at 13:05

На чем должна быть написана CMS? Сходу назову не CMS, но тоже "движки" на постгресе: MediaWiki (см. wikipedia.org), Serendipity (blog engine), CakePHP (CMF)

maxcom Feb 5 2008 at 13:33

drupal, mediawiki

neochapay Feb 5 2008 at 13:51

маловато... тем более DB инджил прикрутили в 5,2 пора бы его уже поприменять

zolotukhin Feb 5 2008 at 13:58

скажите, что вам нужно и решение найдется. если гуглить, продуктов будет более чем достаточно даже для предвзятого пользователя.

neochapay Feb 5 2008 at 14:24

Вы меня не правильно поняли , я просто сказать хотел что при всей своей крутости и тд база используется маловато :( интересны причины

zolotukhin Feb 5 2008 at 14:57

Причины: миф о легкости и лучшей производительности MySQL, за которой стоит коммерческая компания с ее рекламными бюджетами, способствует тому, что новички с их нетребовательными приложениями на нее подсаживаются, не подозревая о том, что есть лучшая альтернатива. Вот и юзают 80% малоопытных пользователей MySQL, создавая много шума по этому поводу. Оно может для них и лучше, спорить не буду, но если вы считаете, что попадаете в 20% более продвинутых, то по крайней мере необходимо осознавать, что к чему в мире СУБД. Впрочем, и для новичков, изучающих SQL, лучше начинать не с диалекта MySQL и не ACID-совместимого продукта, а с гораздо более стандартного и ACID-совместимого PostgreSQL.

neochapay Feb 5 2008 at 17:03

А что же постгрис ? что за ним кроме крутости ? Многие проекты были лучшее чем что то но канули в лету

alrond Feb 5 2008 at 14:04

Не CMS, но поддерживается Django-й

neochapay Feb 5 2008 at 14:31

Тогда и qt ;)

kronos Feb 5 2008 at 17:46

и RoR-ом

andreyurich Feb 5 2008 at 18:36

Интересно было бы найти желающих провести собственное тестирование. Например у меня есть Mysql на таком то сервере, у кого то есть Postgre. Давайте составим проверочную структуру данных и потестим.

WoZ Feb 5 2008 at 20:43

сильно грубо будет. нужно на одном и том же сервере тестить.
с одним и тем же наполнением БД

andreyurich Feb 5 2008 at 20:51

Именно такой ответ и ожидал :) Думаю не скоро мы найдём желающего, с двумя обеими установленными БД (и временем для тестов). Можно пробовать и на разных (однозначно с одинаковой структурой и наполнением ДБ). Если до сих пор сохраняется такая "разительная" разница в производительности как в старых сравнительных тестах, то это и так будет понятно, а если получим что-то схожее будем делать поправку на аппаратное обеспечение или может и не прийдётся ;)

samokhvalov Feb 5 2008 at 21:33

Результаты подобных тестов (с различающимся оборудованием, но с одинаковыми схемами БД и данными) были опубликованы летом 2007-го. Причём очень на высоком уровне, тестировали инженеры Sun на протяжении многих месяцев.

http://postgresmen.ru/news/view/44

Это самое лучшее, самое серьёзное сравнение различных СУБД на сегодняшний день. Даже с учётом того, что оборудование было разным.

andreyurich Feb 5 2008 at 22:18

Дельная ссылка. Спасибо.
Вопрос само собой разумеется закрыт.

norguhtar Feb 14 2008 at 12:24

http://wiki.sysfaq.ru/w/index.php/MySQL_…

andreyurich Feb 14 2008 at 12:45

Я не считаю это тестирование правильным и точным.

norguhtar Feb 14 2008 at 12:52

Тока укажите критерии тестирования. Я работал и с MySQL и с PostgreSQL. Из моего опыта работы следует, что PostgreSQL работает стабильнее и быстрее на больших объемах данных и при количестве операций ввода-вывода с двадцати и более. Кроме этого PostgreSQL тюнить надо существенно меньше по сравнению с MySQL. Стабильная работа MySQL наблюдается только на InnoDB. MyISAM будет более менее работать только при распределении профиля нагрузки между двумя серверами (один на чтение, второй на запись).

andreyurich Feb 14 2008 at 13:03

MyISAM - сам по себе формат не предполагает одновременную запись и чтение (ввиду отсутствия в нем транзакций). Чтобы использовать сервер баз данных на полную
, нужно хорошо разбираться в принципах его функционирования (думаю это касается любого сервера БД).
P.S. обратите внимание на http://blogs.ittoolbox.com/database/soup/archives/postgresql-publishes-first-real-benchmark-17470
"This publication shows that a properly tuned PostgreSQL is not only as fast or faster than MySQL"
Люди не кричат что наше сервер БД быстрее всех, а весьма осторожно - "не медленнее, а может и быстрее"

norguhtar Feb 14 2008 at 13:57

MyISAM - сам по себе формат не предполагает одновременную запись и чтение (ввиду отсутствия в нем транзакций).

Вообще СУБД как раз таки подразумевает наличие одновременного чтения и записи.

Чтобы использовать сервер баз данных на полную, нужно хорошо разбираться в принципах его функционирования

Я вполне разбираюсь как работает MySQL, но от этого он быстрее и стабильнее чем PostgreSQL вести себя не начинает.

Люди не кричат что наше сервер БД быстрее всех, а весьма осторожно - "не медленнее, а может и быстрее

Я вообще-то указывал при каких условиях MySQL менее производителен. В тесте так же указано как и что тестировалось. Можете проверить результаты.

andreyurich Feb 14 2008 at 14:05

Я вовсе не собирался спорить и утверждать, что MySQL лучше или хуже PostgreSQL. Просто считаю, что не имеет сравнивать производительность плоско (одни и те же структуры данных одни и те же запросы). К этому нужно подходить более гибко, то есть ставить задачу: такой то набор данных, такая то задача по выборке и обновлению. После чего уже писать под каждую БД свою структуру и свои запросы, и уже тогда сравнивать производительность по скорости выполнения самой постановочной задачи. Так ИМХО будет более точно (недаром инженеры сан потратили на тестирование несколько месяцев, а не дней), и результаты будут не такими однозначными.

norguhtar Feb 14 2008 at 14:43

Просто считаю, что не имеет сравнивать производительность плоско (одни и те же структуры данных одни и те же запросы). К этому нужно подходить более гибко, то есть ставить задачу: такой то набор данных, такая то задача по выборке и обновлению.

Описаная в тесте задача, вообщем-то не является синтетической, такого рода структуры часто встречаются. Дополнительно можно добавить индексы, но ситуацию это кардинально не исправит. Если у вас есть предложения как вот на конкретно разобранной задаче увеличить производительность, то опишите как это сделать.

После чего уже писать под каждую БД свою структуру и свои запросы, и уже тогда сравнивать производительность по скорости выполнения самой постановочной задачи.

В случае больших проектов это не имеет смысла. По сути вы можете сделать двойную работу.

PS Да MySQL может дать большую производительность при определенных условиях. Но это обычно требует дополнительных шаманств.

tsabu Feb 7 2008 at 16:25

немного занудства: всегда думал что СУБД мужского рода - все-таки сервер, а не женского

samokhvalov Feb 7 2008 at 21:42

Ошибаетесь. Система.

eZzo Feb 14 2008 at 11:13

После безапелляционной фразы "... лучшей СУБД в мире ..." остальное читать даже не хочется. Хоть бы улыбочку какую поставили. Детский сад, штаны на лямках, ей Богу!

samokhvalov Feb 14 2008 at 12:00

По многим показателям действительно лучшая. Вам сюда: http://www.postgresql.org/about/
А мою заметку, конечно, не читайте, если нет желания.

eZzo Feb 15 2008 at 06:02

С учётом инфы по ссылке "лучшей СУБД для Линукс" (особенно с самой ссылкой в сноске) звучало бы уже вполне корректно.
В целом статья полезная, но вот такое вступление ИМХО вызывает отторжение у людей с другими предпочтениями. Вы ведь не хотите, чтобы PostgreSQL стала закрытым фан-клубом? :)

easyman Feb 14 2008 at 12:17

-1

Show the best of all time