Skiminok Sep 24 2010 at 10:33

Система непересекающихся множеств и её применения

10 min

70K

Algorithms*

+104

Comments 29

Arion Sep 24 2010 at 11:10

Жму вашу сильную руку, уже на условие крепко задумался.

ignar Sep 24 2010 at 11:51

Серьезно так. Спасибо за проделанную работу, вы заставили мой мозг задуматься и дали ему пищу на ближайшие пару дней.

loginex Sep 24 2010 at 12:18

Как говорил Альберт Эйнштейн:«Сделай настолько просто, насколько это возможно, но не проще.»
Хорошо, когда используют такой подход

loginex Sep 24 2010 at 12:34

однако я пока так и не понял необходимости хранить множества в виде дерева. Этого требуют дополнительные какие-то условия?

Skiminok Sep 24 2010 at 13:22

Нет, просто именно такой способ обеспечивает наилучшую скорость работы. Можно хранить списками, можно настоящими множествами (set<T>), но тогда в любом случае какая-нибудь из операций окажется O(log₂ N), O(N) и т.д. — слишком медленно.

loginex Sep 24 2010 at 14:23

Вам виднее какую в вашем случае операцию стоит оптимизировать. Но если операций чтения(поиска) будет меньше, чем операций создания(слияния), то алгоритмы стоит применять уже другие, которые так же имеют время работы О(1), но при этом используют меньше функций.
А еще я не могу понять как в теории это работает:
>Достаточно выбирать корень для переподвешивания случайным образом
можно поподробнее на русском языке?

Skiminok Sep 24 2010 at 16:00

В принципе там есть исходник, однако я не против объяснить и здесь.

У вас есть два элемента, X и Y. Вы стандартными операциями Find нашли корни их деревьев: пускай это R_X и R_Y. Чтобы слить два дерева, достаточно один из корней подвесить к другому непосредственным сыном, то есть сделать просто либо P[R_X] = Y, либо P[R_Y] = X. Встает вопрос, какой из двух вариантов выбирать?

В стандартной реализации для этого используется массив рангов, и мы выбираем вариант из принципа «дерево меньшей высоты подвешивать к дереву большей высоты». Однако можно обойтись и без этого. Просто принимаем решение случайно: каждый раз генерируем местным rand() случайное целое число от 0 до 1. Если это 0, подвешиваем R_Y к R_X, если же 1 — то R_X к R_Y.

Время работы такой реализации в среднем оценить достаточно проблемно. Однако если её действительно написать и протестировать на многих разнообразных данных, окажется, что она почти не уступает варианту с рангами.

loginex Sep 24 2010 at 16:10

а что мы делаем с рангами? Они какую роль играют в таком случае?

Skiminok Sep 24 2010 at 16:11

Никакую, они в такой реализации вообще не нужны, их можно не считать и не хранить.

loginex Sep 24 2010 at 16:18

Я малость запутался уже, так что буду уточнять. Т.е. дерево у вас хранится в виде одномерного массива? И все?

Skiminok Sep 24 2010 at 16:19

Да именно так. И все.

loginex Sep 24 2010 at 16:34

Но ведь вы так же писали
>Будем хранить помимо предков еще один массив Rank.
Он уже стал не нужен?

Skiminok Sep 24 2010 at 16:37

Вот именно!
Это два разных варианта реализации одной и той же функции Unite.
В одной нам нужно хранить массив Rank — мы пользуемся им при принятии решения о переподвешивании.
В другой мы принимаем это решение случайным образом, а значит, массив Rank в ней нам не нужен.

Я привел обе реализации, потому что первая является классической, для неё доказана оценка скорости O(α(N)), а вторую проще писать, а на практике она работает почти так же быстро.

loginex Sep 24 2010 at 17:12

пока не могу понять, завтра на свежую голову еще раз прочту

galaxy Sep 24 2010 at 12:57

За дальнейшими техническими подробностями отсылаю читателей к <a href=''file///E:/Informatic@NeXT/10.1.1.79.8494.pdf''>оригинальной статье</a>.

спасибо, как-нибудь к вам заедем :)

Skiminok Sep 24 2010 at 13:19

Сорри. Походу, топики надо дописывать в более выспавшемся состоянии :) Исправил.

dax Sep 24 2010 at 13:04

Периодически использую этот алгоритм. Подробный анализ временной оценки сложности можно найти у самого Тарьяна в его замечательной книге Data Structures and Network Algorithms, отрывки из которой разбросаны по всей сети.

Shablonarium Sep 24 2010 at 15:01

Автор, Вы разбираетесь в математике, да? Можете разъяснить, что такое многомерные множества?

Zlogrom Sep 24 2010 at 19:25

Множество, имеющее размерность n (имеется ввиду размерность Хаусдорфа). Например, множество всех точек прямой одномерно, множество всех точек квадрата двумерно и т.д.
Разумеется, разговор о размерности множества в метрическом пространстве. Метрическое пространство — всего лишь множество, на котором определено расстояние между двумя соседними элементами.

fader44 Sep 28 2010 at 23:21

В случае векторных пространств, множество имеет размерность n если в нем существует базис (максимальный набор линейно независимых векторов) размера n.
Но не каждое множество имеет размерность.

malkolm Sep 24 2010 at 17:05

За иллюстрации спасибо. Все равно большинство забудет через пару дней текст, а вот картинки вспомнят и через неделю, может и смутно.

multik Sep 24 2010 at 19:48

Спасибо огромное, особенно за популяризацию деревьев!

Продолжайте!

UFO just landed and posted this here

Skiminok Sep 26 2010 at 14:55

Ну это в комментах обсуждалось. Для рандомизированной версии вообще трудно указать оценку сложности, можно ориентироваться только на практические тесты. А они хорошие.

UFO just landed and posted this here

Skiminok Sep 26 2010 at 20:04

Порядка 10⁵-10⁶.

UFO just landed and posted this here

Skiminok Sep 26 2010 at 21:26

Могу протестить на 10⁸. Все равно не думаю, что результаты будут сильно отличаться.

Ves Sep 29 2010 at 02:59

наконец смогу написать быстрое решение задачки 1003 с тимуса :-)

Show the best of all time