al_indigo 28 ноя 2011 в 20:35

Релиз XML-СУБД Sedna 3.5

2 мин

3.2K

Open source*

+30

Комментарии 28

mentatxx 28 ноя 2011 в 20:40

А на бенчмарки по сравнению с другими документориентированными базами посмотреть можно?

al_indigo 28 ноя 2011 в 20:49

Актуальных, к сожалению, нет, но мы этим займёмся в ближайшее время.
В сети есть бенчмарки на очень устаревшие версии, но может быть, я найду. Сами мы сравнениями производительности не занимаемся. Могу показать результаты нашей внутренней ежедневной time-testing системы и результаты прохождения W3C XQuery Test Suite, если это представляет интерес. Но что-то я не думаю, что эти цифры скажут Вам что-то определенное :)

al_indigo 28 ноя 2011 в 23:24

Можете, кстати, попробовать её в действии прямо сейчас. Я совсем забыл, что у нас есть демо-версия на примере Википедии как раз для таких целей: wikixmldb.org/

mejedi 29 ноя 2011 в 10:37

Когда я последней раз разговаривал с авторами, ситуация с производительностью выглядела следующим образом — все «очевидные» оптимизации сделаны, чтобы ускорять дальше нужно находить и убирать узкие места на конкретных задачах. Например там ниже ссылка на демо с данными из википедии (wikixmldb.org) — для этого демо специально делали оптимизацию загрузки больших документов (суммарно там десятки ГиБ).

Tonik 28 ноя 2011 в 21:00

Выглядит интересно. А можно примеров на каких проектах такая СУБД имеет смысл? Мне приходит в голову только вариант, если откуда то приходит большие XML, которые проще напрямую включить в базу, чем предварительно обрабатывать. Но что это может быть в реальности, затрудняюсь сказать.

al_indigo 28 ноя 2011 в 21:07

Вот тут один из основателей проекта пишет о предпосылках к использованию XML-СУБД: citforum.urc.ac.ru/database/articles/sedna/glava06.shtml

Статья написана довольно давно, но с тех пор мало что изменилось.

Psih 28 ноя 2011 в 21:12

Читал я как-то людям из нашего Латвийского гос. архива спец-курс по XML, в том числе использовали Senda для живых примеров. Несмотря на то что я работаю в WEB, XML произвёл впечатление, в том числе и возможности Sedna — хорошая база, интересная :)

al_indigo 28 ноя 2011 в 21:13

Спасибо :)

xtra 28 ноя 2011 в 22:51

Документация отвалилась — wikixmldb.org/

al_indigo 28 ноя 2011 в 23:22

Это не сайт с документацией, но хорошо, что Вы заметили. Это сайт-демо, где можно потрогать руками, как это работает на примере Википедии.
Сейчас уже всё в порядке и работает. Разве что, неизвестно, продержится ли сайт под нагрузкой — канал не очень широкий. Но попробовать стоит

mentatxx 28 ноя 2011 в 23:45

Общее пожелание — обратите внимание на лучшую поддержку Linux-систем
1) Пути. Нужно полностью пересмотреть структуру файлов при установке.
2) Обратите внимание на тучу варнингов при компиляции под линуксом. Они очень настораживают, и сеют сомнения в качестве кода.
3) Неплохо бы иметь ppa-репозиторий, deb-пакеты, rpm-ы. Скомпилировать самому в принципе не проблема, но хочется иметь все готовое.

Пока же откомпилил себе под Ubuntu 11.10 / 64bit (для компиляции ставил build-essential
cmake libncurses5 libncurses5-dev libedit-dev flex bison libmm14 libmm-dev expat )

al_indigo 29 ноя 2011 в 00:03

Спасибо за отзыв.
Да, мы в общем-то полностью согласны с этими замечаниями и работаем над этим как раз сейчас — мы сейчас занимаемся переработкой внешней архитектуры.
Так что с путями, с репозиториями, с установкой и с полноценным режимом работы в качестве службы (в винде) мы справимся к версии 4.0, которая будет гораздо меньше, чем через год. Во всяком случае, очень хочется в это верить верить)

По поводу второго — вопрос спорный. Мы же, разумеется, смотрим на всё это по ходу работы и проверяем. С одной стороны, да — нужно избавляться вообще от любых ворнингов. С другой стороны, большая часть этих ворнингов компиляторо-зависимы, причём не только в смысле разных платформ, но и в смысле разных версий одного и того же компилятора. При том, что существующие недостатки не связаны с ворнингами, а ворнинги по большей части чисто формальные, тратить время на ну часть, которая не является критической, кажется нерациональным.

Если не секрет — Вы уже использовали Седну? Если да, то для чего?

mentatxx 29 ноя 2011 в 07:55

Нет, пока просто присматриваюсь к новой системе.

Кстати, необходимость тюнить sysctl.conf для работы sedna — это не очень хорошее условие.

afi 29 ноя 2011 в 12:06

Где она используется? Не нашел ни одного проекта.

al_indigo 29 ноя 2011 в 15:54

ответ чуть ниже, промахнулся кнопкой

al_indigo 29 ноя 2011 в 15:54

Седна используется в отделе проверки фактов Большой Российской Энциклопедии, например.
Есть ещё довольно крупный проект blog.matfyz.sk/, который тоже использует Седну.

И есть ещё довольно много непубличных закрытых разработок, но мы о них знаем только то, что они сами пишут нам в поддержку, и вряд ли мы можем об этом сильно распространяться.

Ну, и довольно очевидно, что мы знаем далеко не обо всех проектах — только о тех, которые сами нам заявляли о своём существовании. Именно поэтому я попросил написать уже использующих Седну людей, о том, зачем она им нужна — нам же тоже интересно.

dustalov 30 ноя 2011 в 00:11

Буквально вчера пришлось поднимать DEBVisDic, использующий Sedna. Радует, что привязка к Ruby не поломалась за столько времени.

Как успехи с грантами на разработку?

al_indigo 30 ноя 2011 в 02:03

Вот яркий пример того, как мы можем не знать о том, как и кто использует Седну :) Например, о DEBVisDic мы даже не слышали. Во всяком случае, я точно не слышал

Если не секрет, как Вы её используете?

По поводу грантов мне нечего сказать — я просто не в курсе того, как у нас устроено финансирование подобных проектов. Ну, точнее, я никогда не интересовался, наверняка кто-нибудь из нашей команды должен это знать, просто этот человек не я :)

dustalov 30 ноя 2011 в 09:31

DEBVisDic — это редактор тезауруса в формате WordNet, который работает как Web-приложение на Ruby, а хранит свои данные в Sedna. Увы, написан он давно и не очень элегантно, но в определённых узких кругах применяется достаточно широко. ☺

Редактор используется проектом RussNet. Мы сейчас развернули IaaS-облако у себя в ИММ УрО РАН и предлагаем им работать с DEBVisDic на нашей инфраструктуре.

Inq 30 ноя 2011 в 20:29

Скажите, планируется ли embedded версия базы данных?

al_indigo 30 ноя 2011 в 20:41

Нет, не планируется.

Inq 30 ноя 2011 в 21:44

Благодарю за ответ. Жаль.

al_indigo 30 ноя 2011 в 21:50

Дело в том, что в рамках существующей архитектуры это сделать очень сложно по целому ряду причин. В новой архитектуре, которую можно будет увидеть в следующем релизе, это тоже представляется очень сложной задачей. Понятно, что было бы удобно, если бы можно было так сделать, но увы, это явно не приоритетная задача

Inq 30 ноя 2011 в 22:06

Нет-нет, не обижайтесь.
Благодарю за объяснения, но я, в общем-то, не хотел вынуждать Вас объяснять что-либо.

Просто подумалось, что это было бы удобно, для встраивания в свои продукты.
В любом случае, буду ждать (не к спеху) подобной системы от отечественного производителя.
Это должно быть крайне интересно.

Спасибо :)

sokol_pet 14 янв 2014 в 03:39

Не подскажете, проект Седна уже закрыт, или работа над четвёртой версией всё ещё продолжается?

И один глупый вопрос. Как откомпилировать исходный код базы данных под Windows?
Я скачал вот этот релиз: www.modis.ispras.ru/FTPContent/sedna/development/sedna-3.6.248-src-win-x86.tar.gz

al_indigo 14 янв 2014 в 14:48

Не закрыт, но, увы, заморожен на неопределенное время. Мы были близки к выпуску стабильной версии 3.6 (там довольно много приятный нововведений), но нашли ошибку в работе BST-индексов, и пока я ее не исправлю, мы не выпустим даже 3.6.
Работа над версией 4.0 пока приостановлена, т.к не хватает ресурсов, но работа над ней все еще ведется, просто очень медленно.

Для сборки под Виндой мы используем Cygwin (хотя, возможно, можно было бы обойтись без него), т.к у Седны есть зависимость от GNU Flex и GNU Bison. Выбор компилятора за вами — соберется под любым.

Собственно, порядок сборки примерно такой:
1) Ставите Cygwin
2) В Cygwin требуются пакеты cmake, bison, flex (надеюсь, ничего не забыл)
3) Скачиваете и распаковываете исходники Седны
4) Создаете папку, в которой будете собирать
5) Заходите в нее из Cygwin
6*) Выполняете cmake -G «Visual Studio 9 2008 Win64» <путь к распакованным исходникам>
7) Открываете в меню пуск командную строку вижуал студии, компилятор из которой вы будете использовать
8) Запускаете nmake
9) Когда nmake закончит работу, бинарники будут в этой папке.

* В качестве генератора в 6м пункте можете выбрать все, что угодно (т.е любую версию студии, битность или вообще Unix Makefiles, если будете собирать с помощью Mingw или gcc) — главное, чтобы дальше вы запускали сборку тем же инструментом, который отвечает за генератор (nmake/make) с проставленными переменными окружения. В случае вижуал студии, ее командная строка запускает специальный bat файл, который проставляет нужные переменные.

Правда, я не очень понимаю, зачем вам собирать исходники вручную? Если правок кода не предполагается, отличий от распространяемых бинарников вы не увидите.

sokol_pet 14 янв 2014 в 15:05

Благодарю, буду пробовать. Собрать исходники Седны планировал в учебных целях, чтобы потом, возможно, переписать её datasourse с XML на NoSQL хранилище от Microsoft (Windows Azure Table).

al_indigo 14 янв 2014 в 15:13

Боюсь, задача очень непростая — вся система внутреннего хранения очень жестко завязана на xml.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Релиз XML-СУБД Sedna 3.5

Комментарии 28

Публикации

Истории