Pac3man Dec 31 2015 at 13:07

Графовые базы данных: святой Грааль для разработчиков?

5 min

89K

SQL*NoSQL*

+23

Comments 38

UFO just landed and posted this here

ColorPrint Dec 31 2015 at 18:25

Еще SWRL ;) хотя там все достаточно просто

Nashev Jan 4 2016 at 08:54

Каких пять?

ru7701 Jan 5 2019 at 23:31

Подлежащее-сказуемое-дополнение… а где тогда обстоятельства с определениями?! Я серьезно. Чем добавлять конкретные сказуемые, лучше бы добили «естественность» модели.

vintage Jan 5 2019 at 23:54

Нет там никаких сказуемых. Есть объект-свойство-значение. Этими триплетами можно описать всё, что угодно.

UFO just landed and posted this here

vintage Jan 6 2019 at 11:03

ru.wikipedia.org/wiki/Resource_Description_Framework

ru7701 Jan 6 2019 at 17:33

В обычных языках обстоятельства и определения тоже не обязательны. Ни в одном из случаев. «Маша села в машину. Эта машина отражается красным цветом.»… Все только за счет подлежащих, сказуемых и дополнений, или, будь по Вашему, за счет связок объект-свойство-значение. Но в реальности мы просто скажем «Маша села в красную машину». Применяем определение. Тоже самое с обстоятельствами.

В этом и претензия к RDF. Эта штука действительно то необходимое, что нужно для описания чего угодно. Но в реальности, как и в случае с языками, нужно не минимальное, а удобное. Ученым это не надо, а всем остальным надо.

Что интересно, сообщество SemanticWeb, не смотря на свою академическую природу, таки пытается сделать RDF чем-то удобным. Думаю, так появился RDFS — попытка реализовать обстоятельства. Аналогично туда попали именованные графы — шаг в сторону реализации определений. Но это все костыли. Прилепляются сбоку и соответствующим образом воспринимаются.

RDF — хорош как идея, но кажется эту идею нужно переписывать с нуля.

vintage Jan 6 2019 at 18:38

Думаю, так появился RDFS — попытка реализовать обстоятельства.

Я не понял при чём тут обстоятельства. RDFS — просто набор терминов для описания схем через RDF. Как и любой другой набор терминов любой другой предметной области.

Аналогично туда попали именованные графы — шаг в сторону реализации определений.

Это скорее шаг к децентрализации, чтобы понятно было где лежат те или иные триплеты.

ru7701 Jan 8 2019 at 02:56

Думается автор заглавного коммента имел ввиду, что среди терминов RDFS главным был rdf:type который цепляет экземпляры к классам. Отсюда, если в подлежащем трипла оказывается какой-то из классифицированных экземпляров, то соответствующий класс становится там обстоятельством. А по поводу именованных графов общепринято мнение, что это способ учесть контексты предложений, чем в языке часто занимаются определения.

На самом деле, не столь уж и важно верны ли эти догадки насчет нововведений RDF. Основной посыл другой: модель изначально не пыталась реализовать что-то вроде определений и обстоятельств, чем обрекла себя на статус академической игрушки.

Есть планы сие исправить.

vintage Jan 8 2019 at 10:20

RDF не про любые выражения, а про описание мира. Соответственно там нет и не нужно много чего из естественных языков. В частности, там нет "подлежащих", "сказуемых" и тп. Есть объекты и их свойства. Да, свойства могут быть записаны как глаголы, существительные и даже целыми предложениями. В RDFS решили использовать короткое type, вместо isTypeOf. Это не потому, что тут требуется "обстоятельство", а просто всё это подражание естественному языку тут не нужно.

ru7701 Jan 8 2019 at 12:18

Ок. Возможно такая критика RDF не обоснована и модель жизнеспособна для своих, в том числе бизнес-целей. Надо признать, впечатляет и то как активно энтузиасты продвигают RDF-СУБД наподобие GraphDB. Плюс, конечно нужно вспомнить, что «графовая семья» включает в себя не только RDF, но и LPG — моделью данных Neo4j. У второй тоже своя востребованная на рынке правда. Просто очень надеюсь, что в семье найдется место и для чего-то нового.

nicuini Dec 31 2015 at 16:18

Есть ещё атомарные базы данных, такие как Datomic. Она, кстати, ближе графовым, хотя язык запросов очень похож на реляционный.

vintage Dec 31 2015 at 20:38

Какой-то устаревший пост. На RDF уже давно все забили, ибо это сложный XML. SPARQL стандартизирован, но это не даёт какого-либо толчка популярности графовых субд. Кромето SPARQL есть Gremlin и тот же SQL с графовыми расширениями. Ну и OrientDB не плохо поддерживает кластеризацию.

Nashev Jan 4 2016 at 08:55

RDF это не XML

vintage Jan 4 2016 at 12:27

Я знаю, но у многих он ассоциируется именно с XML из-за RSS.

beduin01 Dec 31 2015 at 20:41

http://arangodb.com/ кстати очень приятная штука, а главное графы умеет.

tumikosha Jan 1 2016 at 02:56

Вот если бы кто-то прикрутил к монге SPARQL движок, то мне бы больше ничего бы не надо было. Никаких там хадупов-шмадупов

-1

KeepYourMind Jan 1 2016 at 13:59

У Neo4j есть шикарный язык запросов под названием Cypher.

SleepwalkerOne Jan 1 2016 at 20:56

Он может как отдельный сервер работать или как его можно масштабировать?

KeepYourMind Jan 1 2016 at 21:00

Может и как отдельный. Для больших инсталляций есть коммерческая версия.

SleepwalkerOne Jan 1 2016 at 21:05

Извиняюсь, но не дадите ссылочку где про это почитать можно? А то я не найду. Спасибо.

KeepYourMind Jan 1 2016 at 21:23

neo4j.com/neo4j-scales-web-enterprise
neo4j.com/editions
neo4j.com/licensing

SleepwalkerOne Jan 1 2016 at 21:07

Может кто-нибудь что-нибудь сказать про эту БД: Titan (http://thinkaurelius.github.io/titan/)

potapuff Jan 2 2016 at 12:21

Как альтернатива базам данных SQL где-то с начала 2000-х развивается направление NoSQL. В эту категорию объединяют все подряд – от иерархических и сетевых БД

Berkeley DB — 1986
IMS — 1968
Все было с точностью до наоборот, сперва были иерархические и сетевые БД, а потом появились реляционные.

Nashev Jan 4 2016 at 07:51

К тому же, реляционные БД это не только про таблички, это главным образом про relation, про внешние ключи и связь табличек!

DbLogs Jan 3 2016 at 08:02

Весьма и весьма неоднозначная статья: вроде и есть полезное, а вроде и уйма пробелов. Производительность графовых БД для отдельных случаев даже лучше чем у релационных, так как поиск вершины на другом конце ребра это операция O(1), что значительно лучше чем поиск по FK. Да и насчет деления NoSQL: та же OrientDB является мультипрадигмной: хочешь Graph — без проблем, хочешь документную БД — элементарно, хочешь реляционную — тоже здесь (правда SQL далек от SQL92), ну а так же Key-Value. А если к этому добавить обертку типа Orienteer, то и бэкэенд для мобильного приложения или сайта без единого кода готов.

Я это к тому, что реляционные БД уходят на второй план так как не могут предоставить разработчикам «полный стэк» в сравнении с NoSQL разработками.

Nashev Jan 4 2016 at 07:56

Поиск по FK это отнюдь не поиск вершины на другом конце ребра, это же поиск всех данных, связанных с той вершиной.

DbLogs Jan 4 2016 at 19:30

Не совсем так… Представьте, что вы делаете блог: у вас есть «таблица» с POSTS и COMMENTS. В реляционной БД у вас будет колонка COMMENTS.POST_ID ссылающаеся на соответствующий пост в POSTS. А в графовой БД у вас будет ребро связывающее комментарий и родительский пост. Ну так вот: в реляционной БД вам придется «перебрать» все посты (пусть даже если и по индексу) чтобы найти нужный с нужным POST_ID для данного комментария, а в графовой достаточно взять вершину на другом конце нужного ребра.

UFO just landed and posted this here

vintage Jan 5 2016 at 13:00

Также как и в реляционной — по индексам. Индекс может быть как автоматическим по комбинации класс+список_полей, так и ручным, когда создаются перелинкованные узлы вида «год», «месяц», «день», «час» и комментарий линкуется к часу.

UFO just landed and posted this here

vintage Jan 5 2016 at 22:45

В наличие прямых связей между сущностями. В полиморфности этих связей. Например, заменяем «комментарий за последний час» на «новые посты, видео, и комментарии (к постам и видео) за последний час» — в реляционной субд для этого потребуется 3 запроса по трём отдельным индексам с последующей сортировкой по времени, в графовой достаточно одного запроса по общему суперклассу и выдача будет уже отсортирована. А если к комментариям нужно вытянуть ещё и посты/видео к которым они даны и комментарии, на которые они являются ответами, то это совсем печально в реляционной субд. С графовой достаточно указать fetchplan и получить все связанные данные.

UFO just landed and posted this here

vintage Jan 6 2016 at 01:17

А вы исходные коды хабрахабра видели? На сколько экранов там запросы? Сколько человекомесяцев убито на реализацию и оптимизацию знаете? Сколько серверов всё это обслуживает в курсе? Как он периодически по ночам закрывается «на переучёт» не замечали? У меня лента (http://habrahabr.ru/feed/) формируется 600мс (при этом на ней почти ничего не меняется и часть данных подгружается асинхронно) — это быстро?

scumware Jan 10 2016 at 12:19

так как поиск вершины на другом конце ребра это операция O(1), что значительно лучше чем поиск по FK.

Поиск не по FK и не по графу, а по индексу (если он определён, конечно, для FK), т.е. по структуре данных. Индексов существует великое множество, и для всех их различная сложность поиска и обновления. Ты, говоря об FK, какой индекс имеешь ввиду?

Nashev Jan 4 2016 at 08:59

Графовые СУБД (триплсторы) потому не особо взлетели, что там нет практически никаких заходов на оптимизацию, отличающихся от возможностей реляционные БД. А заходы реляционных применимы чрезвычайно ограниченно.

vintage Jan 4 2016 at 12:32

Графовые СУБД — это не хранилища триплетов, которые являются не более чем ограниченными табличными СУБД. Основной заход для оптимизации в графовых СУБД — хранение прямых ссылок на другие записи, вместо хранения FK с последующим поиском по индексу.

Show the best of all time