gasya 11 фев 2011 в 18:44

Персистентные структуры, часть 1: персистентный стек

3 мин

37K

Алгоритмы*

Из песочницы

+43

Комментарии 42

khizhaster 11 фев 2011 в 19:34

> Заключение. Сегодня мы рассмотрели

Откуда это вот берётся? :) Уже в куче статей в последнее время видел. Вы ж не лабораторную сдаёте и не курсовой, дык зачем этот официоз? В конце-концов, резюме, конечно, нужно, но чаще всего оно в таком виде подаётся, что ощущаешь себя преподом, принимающим списанную лабу.

gasya 11 фев 2011 в 19:44

Да, пожалуй вы правы. Видимо это от чрезмерного старания — как-никак первый раз пробую себя на хабре =)

Bas1l 11 фев 2011 в 23:42

Это полезная штука.

Есть стандартная структура статей: вступление, основная часть и заключение.

Вступление нужно для того, чтобы дать высокоуровненвый обзор; чтобы читатель знал, на что обращать внимание.

А заключение нужно для того, чтобы еще раз напомнить основную идею, чтобы у вас сложилась цельная картина.

Кроме того, повторение--мать учения. Кажется, чтобы информация запомнилась, ее надо повторять через 20 минут, через пару чаов и через пару дней. Заключение как раз и соответствует первому повторению.

khizhaster 11 фев 2011 в 23:44

А я и не говорил, что заключение не нужно. Нужно, конечно же. Но вот стиль подачи у многих очень попахивает университетской банальностью. «Мы рассмотрели бла-бла-бла, из чего сделали вывод бла-бла-бла».
Мы ж на хабре, а не на сдаче курсовой, да? К чему все эти ненужности? Можно простым языком написать, а не используя этот банальный штамп, вбитый всем нам в голову в институтах.

sharikov 11 фев 2011 в 19:55

А в какой литературе с этими структурами данных можно познакомиться поподробнее?

borisko 11 фев 2011 в 20:02

Насколько я знаю, это направление возникло относительно недавно, и в больших книжках (да и в маленьких тоже) о нём не прочитать.

P.S. о_О Ваш первый комментарий за последние почти 4 года.

gasya 11 фев 2011 в 20:16

Относительно недавно это стало модно на олимпиадах использовать, насколько я знаю.

Jabberwok 11 фев 2011 в 20:49

модно это стало в том числе в свете многопоточности

Jabberwok 12 фев 2011 в 23:59

Вот описание в точности такого же стека. Дата публикации: 15 December 1983.

gasya 11 фев 2011 в 20:11

Если не ошибаюсь, можно поискать что-нибудь Тарьяна

Jabberwok 13 фев 2011 в 00:00

да, да, тоже на него наткнулся www.cs.cmu.edu/~sleator/papers/making-data-structures-persistent.pdf

НЛО прилетело и опубликовало эту надпись здесь

borisko 11 фев 2011 в 20:02

Jabberwok 11 фев 2011 в 20:40

очень похоже все это на immutable stack из блога Эрика Липперта. Там только упор делается не на возможность получения любой версии, а на неизменяемость объекта. Впрочем, по-моему получилось тоже самое. кстати там целый цикл великолепный статей про неизменяемость (immutability)

free0u 11 фев 2011 в 21:26

На ВКОШПе последнем была задачка, которая решалась в том числе персистентным деревом отрезков.

gasya 11 фев 2011 в 21:35

Ну не обязательно деревом отрезков, когда я ее решал (к сожалению уже после олимпиады =)), я использовал декартово дерево по неявному ключу.

Вообще я как раз планировал разобрать ее, когда речь будет идти о декартовом дереве.

EaS 11 фев 2011 в 21:51

> Очевидно, что один запрос работает за O(1)
Мне не очевидно :) Вы не заострили внимание, что это зависит от того, как мы ищем i-й элемент. На вскидку массив даст константный доступ, но или нужно зарезервировать достаточно места, либо его расширять динамически. Хотя в алгоритмах я не разбираюсь, и буду рад, если укажите, где я ошибся :)

gasya 11 фев 2011 в 22:07

Да, пожалуй стоило упомянуть, что речь идет о структуре типа массив.

Насчет динамического расширенияВ данном случае можно зарезервировать изначально массив из 1-го элемента. Далее при каждом добавлении количество элементов растет, и когда оно становится равным зарезервированному количеству мы расширяем его в два раза. Каждое расширение работает за O от количества элементов на момент расширения.

Если мы добавили n элементов (округлим n вверх так, чтобы n = 2 ^ k), то суммируя количество операций расширения получим: 1 + 2 + 4 + 8 +… + 2 ^ k = 2 ^ (k + 1) = 2 * n, откуда получаем O(n). Таким образом количество операций, потраченных на расширение имеет тот же порядок, что и количество операций добавления, что не может не радовать.

gasya 11 фев 2011 в 22:07

Ах жаль, с тегом промазал =(

borisko 11 фев 2011 в 22:10

Ну и стоит упомянуть, что vector в c++ делает именно это.

gasya 11 фев 2011 в 22:27

Стоит упомянуть, что он еще умеет освобождать память, о чем речь пока не идет.

EaS 11 фев 2011 в 22:12

Какое суммирование, вы о чем? Я нахожусь на n-ом шаге и до этого только добавлял, и мне нужно целиком скопировать весь массив. Это O(n)! В худшем случае, добавление займет O(n). Понятно, что в среднем, особенно если я буду часто удалять, это будет O(1), но это совсем не гарантировано.

Я правильно понял, что вы пытались усреднить?

gasya 11 фев 2011 в 22:26

Формально — да, но…

Пусть вас не пугает то, что нужно скопировать весь массив. Выше я написал, почему если просуммировать все операции после добавления n элементов мы получим O(n) операций (кстати с небольшой константой), т.е. O(1) на одно добавление.

Кстати удаление на эту оценку никак не влияет.

EaS 11 фев 2011 в 22:27

Как раз встал с кровати, осознав, что удаление не влияет, и уведомление пришло :)

EvilPartisan 11 фев 2011 в 23:36

А у понятия персистентная структура есть русское название?

gasya 11 фев 2011 в 23:55

Никогда не встречал, мне кажется что нет =)

vgrichina 12 фев 2011 в 04:00

«Неизменяемая» (хотя это скорее immutable), «сохраняемая», не? Хотя вообще отличеие persistent jn immutable лишь в хранении указателей на старые версии насколько я понимаю.

EaS 12 фев 2011 в 08:35

Вообще, мне казалось, что персистентный означает сохраняемый между запусками программы. Так что для таких структур, ИМХО, immutable лучше подходит.

Jabberwok 12 фев 2011 в 23:48

Прочитав статью автора мне показалось, что его персистентный стек не что иное как immutable стэк. Беглое гугление привело меня в википедию, где написано «Persistent data structures are effectively immutable». То есть всякая persistent data structure является immutable. Но там не говорится, являются ли эти классы эквивалентными, то есть immutable -> persistent. Беглое гугление на этот вопрос ответа уже не дало, придумать immutable, но не persistent структуру мне не удалось. Поэтому я бы не стал утверждать, что «immutable лучше подходит» без должного обоснования.

EaS 12 фев 2011 в 23:50

«Persistence in computer science refers to the characteristic of state that outlives the process that created it» — с вики

Jabberwok 13 фев 2011 в 01:04

у нас прямо конкурс цитат :) из статьи по моей ссылке: «A persistent data structure is not a data structure committed to persistent storage, such as a disk; this is a different and unrelated sense of the word „persistent.“» То есть слово одно, а значений два (минимум).

EaS 13 фев 2011 в 08:46

Спасибо, почитаю повнимательнее :)

linuxoid 12 фев 2011 в 11:20

По прочтении статьи возникло стойкое желание прочитать кого-нибудь авторитетного по этим структурам данных. Гугл мямлит что-то о модуле для Перла. Не более.

На мой скорый взгляд, тут описано некий намек на реализацию дерева с числовым индексом в виде идентификатора узла.

Меня гложат большие сомнения по поводу адекватности производительности поиска по несбалансированному дереву по цифровому индексу (в статье — номер ревизии стека) для обращения к элементам дерева\стека.

Непонятен вопрос, как собрать все конечные состояния стека (а их может быть список)?

Как держать актуальный список головных ревизий? /Головная ревизия — последнее на текущий момент изменение всех веток развития стека/

linuxoid 12 фев 2011 в 11:24

~~Головная ревизия — <… бла-бла...>~~: перемудрил, простите. :)

Головная ревизия — набор всех изменений одной ветки развития стека.

linuxoid 12 фев 2011 в 11:51

Чего-то не проснусь никак… Зачеркните мой предыдущий пост. :)

Головная ревизия — это последнее на текущий момент изменение в одной ветке развития.

Разрисована оранжевым фоном.

Состояние стека в одной из веток может быть получен, как я понимаю, проходом через все узлы соответствующей ветки (помечена красной окантовкой)

linuxoid 12 фев 2011 в 11:52

НЛО прилетело и опубликовало эту надпись здесь

gasya 12 фев 2011 в 16:25

Все это дело можно хранить на массиве (например vector в с++). Выше я писал почему это работает достаточно быстро. Никаких деревьев не нужно.

elw00d 12 фев 2011 в 13:17

Классная задача и элегантный метод решения, супер. Интересно, каким способом можно реализовать персистентность произвольного графа.

gasya 12 фев 2011 в 16:28

Я в подробностях рассмотрю для деревьев в одной из следующих статей

alexeygrigorev 12 фев 2011 в 17:27

Спасибо, полезная статья!
Можно привести еще несколько задач на эту структуру данных? И, если возможно, с контестером — чтобы можно было проверить решение.

yeputons 13 фев 2011 в 00:00

Конкретно на стэк — не знаю. Это достаточно простая структура. Есть задача на персистентное дерево отрезков с ВКОШП-2010 (I, «Откаты»). Но она довольно сложная.
Условия и тесты

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Персистентные структуры, часть 1: персистентный стек

Комментарии 42

Публикации

Истории