Как стать автором
Обновить

Комментарии 28

А на бенчмарки по сравнению с другими документориентированными базами посмотреть можно?
Актуальных, к сожалению, нет, но мы этим займёмся в ближайшее время.
В сети есть бенчмарки на очень устаревшие версии, но может быть, я найду. Сами мы сравнениями производительности не занимаемся. Могу показать результаты нашей внутренней ежедневной time-testing системы и результаты прохождения W3C XQuery Test Suite, если это представляет интерес. Но что-то я не думаю, что эти цифры скажут Вам что-то определенное :)
Можете, кстати, попробовать её в действии прямо сейчас. Я совсем забыл, что у нас есть демо-версия на примере Википедии как раз для таких целей: wikixmldb.org/
Когда я последней раз разговаривал с авторами, ситуация с производительностью выглядела следующим образом — все «очевидные» оптимизации сделаны, чтобы ускорять дальше нужно находить и убирать узкие места на конкретных задачах. Например там ниже ссылка на демо с данными из википедии (wikixmldb.org) — для этого демо специально делали оптимизацию загрузки больших документов (суммарно там десятки ГиБ).
Выглядит интересно. А можно примеров на каких проектах такая СУБД имеет смысл? Мне приходит в голову только вариант, если откуда то приходит большие XML, которые проще напрямую включить в базу, чем предварительно обрабатывать. Но что это может быть в реальности, затрудняюсь сказать.
Вот тут один из основателей проекта пишет о предпосылках к использованию XML-СУБД: citforum.urc.ac.ru/database/articles/sedna/glava06.shtml

Статья написана довольно давно, но с тех пор мало что изменилось.
Читал я как-то людям из нашего Латвийского гос. архива спец-курс по XML, в том числе использовали Senda для живых примеров. Несмотря на то что я работаю в WEB, XML произвёл впечатление, в том числе и возможности Sedna — хорошая база, интересная :)
Спасибо :)
Это не сайт с документацией, но хорошо, что Вы заметили. Это сайт-демо, где можно потрогать руками, как это работает на примере Википедии.
Сейчас уже всё в порядке и работает. Разве что, неизвестно, продержится ли сайт под нагрузкой — канал не очень широкий. Но попробовать стоит
Общее пожелание — обратите внимание на лучшую поддержку Linux-систем
1) Пути. Нужно полностью пересмотреть структуру файлов при установке.
2) Обратите внимание на тучу варнингов при компиляции под линуксом. Они очень настораживают, и сеют сомнения в качестве кода.
3) Неплохо бы иметь ppa-репозиторий, deb-пакеты, rpm-ы. Скомпилировать самому в принципе не проблема, но хочется иметь все готовое.

Пока же откомпилил себе под Ubuntu 11.10 / 64bit (для компиляции ставил build-essential
cmake libncurses5 libncurses5-dev libedit-dev flex bison libmm14 libmm-dev expat )
Спасибо за отзыв.
Да, мы в общем-то полностью согласны с этими замечаниями и работаем над этим как раз сейчас — мы сейчас занимаемся переработкой внешней архитектуры.
Так что с путями, с репозиториями, с установкой и с полноценным режимом работы в качестве службы (в винде) мы справимся к версии 4.0, которая будет гораздо меньше, чем через год. Во всяком случае, очень хочется в это верить верить)

По поводу второго — вопрос спорный. Мы же, разумеется, смотрим на всё это по ходу работы и проверяем. С одной стороны, да — нужно избавляться вообще от любых ворнингов. С другой стороны, большая часть этих ворнингов компиляторо-зависимы, причём не только в смысле разных платформ, но и в смысле разных версий одного и того же компилятора. При том, что существующие недостатки не связаны с ворнингами, а ворнинги по большей части чисто формальные, тратить время на ну часть, которая не является критической, кажется нерациональным.

Если не секрет — Вы уже использовали Седну? Если да, то для чего?
Нет, пока просто присматриваюсь к новой системе.

Кстати, необходимость тюнить sysctl.conf для работы sedna — это не очень хорошее условие.
Где она используется? Не нашел ни одного проекта.
ответ чуть ниже, промахнулся кнопкой
Седна используется в отделе проверки фактов Большой Российской Энциклопедии, например.
Есть ещё довольно крупный проект blog.matfyz.sk/, который тоже использует Седну.

И есть ещё довольно много непубличных закрытых разработок, но мы о них знаем только то, что они сами пишут нам в поддержку, и вряд ли мы можем об этом сильно распространяться.

Ну, и довольно очевидно, что мы знаем далеко не обо всех проектах — только о тех, которые сами нам заявляли о своём существовании. Именно поэтому я попросил написать уже использующих Седну людей, о том, зачем она им нужна — нам же тоже интересно.
Буквально вчера пришлось поднимать DEBVisDic, использующий Sedna. Радует, что привязка к Ruby не поломалась за столько времени.

Как успехи с грантами на разработку?
Вот яркий пример того, как мы можем не знать о том, как и кто использует Седну :) Например, о DEBVisDic мы даже не слышали. Во всяком случае, я точно не слышал

Если не секрет, как Вы её используете?

По поводу грантов мне нечего сказать — я просто не в курсе того, как у нас устроено финансирование подобных проектов. Ну, точнее, я никогда не интересовался, наверняка кто-нибудь из нашей команды должен это знать, просто этот человек не я :)
DEBVisDic — это редактор тезауруса в формате WordNet, который работает как Web-приложение на Ruby, а хранит свои данные в Sedna. Увы, написан он давно и не очень элегантно, но в определённых узких кругах применяется достаточно широко. ☺

Редактор используется проектом RussNet. Мы сейчас развернули IaaS-облако у себя в ИММ УрО РАН и предлагаем им работать с DEBVisDic на нашей инфраструктуре.
Скажите, планируется ли embedded версия базы данных?
Нет, не планируется.
Благодарю за ответ. Жаль.
Дело в том, что в рамках существующей архитектуры это сделать очень сложно по целому ряду причин. В новой архитектуре, которую можно будет увидеть в следующем релизе, это тоже представляется очень сложной задачей. Понятно, что было бы удобно, если бы можно было так сделать, но увы, это явно не приоритетная задача
Нет-нет, не обижайтесь.
Благодарю за объяснения, но я, в общем-то, не хотел вынуждать Вас объяснять что-либо.

Просто подумалось, что это было бы удобно, для встраивания в свои продукты.
В любом случае, буду ждать (не к спеху) подобной системы от отечественного производителя.
Это должно быть крайне интересно.

Спасибо :)
Не подскажете, проект Седна уже закрыт, или работа над четвёртой версией всё ещё продолжается?

И один глупый вопрос. Как откомпилировать исходный код базы данных под Windows?
Я скачал вот этот релиз: www.modis.ispras.ru/FTPContent/sedna/development/sedna-3.6.248-src-win-x86.tar.gz
Не закрыт, но, увы, заморожен на неопределенное время. Мы были близки к выпуску стабильной версии 3.6 (там довольно много приятный нововведений), но нашли ошибку в работе BST-индексов, и пока я ее не исправлю, мы не выпустим даже 3.6.
Работа над версией 4.0 пока приостановлена, т.к не хватает ресурсов, но работа над ней все еще ведется, просто очень медленно.

Для сборки под Виндой мы используем Cygwin (хотя, возможно, можно было бы обойтись без него), т.к у Седны есть зависимость от GNU Flex и GNU Bison. Выбор компилятора за вами — соберется под любым.

Собственно, порядок сборки примерно такой:
1) Ставите Cygwin
2) В Cygwin требуются пакеты cmake, bison, flex (надеюсь, ничего не забыл)
3) Скачиваете и распаковываете исходники Седны
4) Создаете папку, в которой будете собирать
5) Заходите в нее из Cygwin
6*) Выполняете cmake -G «Visual Studio 9 2008 Win64» <путь к распакованным исходникам>
7) Открываете в меню пуск командную строку вижуал студии, компилятор из которой вы будете использовать
8) Запускаете nmake
9) Когда nmake закончит работу, бинарники будут в этой папке.

* В качестве генератора в 6м пункте можете выбрать все, что угодно (т.е любую версию студии, битность или вообще Unix Makefiles, если будете собирать с помощью Mingw или gcc) — главное, чтобы дальше вы запускали сборку тем же инструментом, который отвечает за генератор (nmake/make) с проставленными переменными окружения. В случае вижуал студии, ее командная строка запускает специальный bat файл, который проставляет нужные переменные.

Правда, я не очень понимаю, зачем вам собирать исходники вручную? Если правок кода не предполагается, отличий от распространяемых бинарников вы не увидите.
Благодарю, буду пробовать. Собрать исходники Седны планировал в учебных целях, чтобы потом, возможно, переписать её datasourse с XML на NoSQL хранилище от Microsoft (Windows Azure Table).
Боюсь, задача очень непростая — вся система внутреннего хранения очень жестко завязана на xml.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации