claustrofob Oct 3 2008 at 00:46

Bit Mask Resurrection

3 min

5.5K

Website development*

+10

Comments 36

sergonavt Oct 3 2008 at 07:56

Извините, но это классическая демагогия — сначала создать себе трудности, а потом успешно с ними побороться. Кто Вам мешал вычитывать список допустимых функций при «авторизации на сайте» (а не делать select каждый раз), не храня их при этом в базе в виде бинарной строки, которую сложнее обновлять и которую нельзя использовать в сложных запросах (а значит, если такие запросы нужны, параллельно придётся поддерживать не-bitmask структуру)?

И ещё — скажите, а что станет с системой прав, организованной таким образом, если приложение попросит базу отдавать данные в другой кодировке?

claustrofob Oct 3 2008 at 13:57

Кто Вам мешал вычитывать список допустимых функций при «авторизации на сайте»
Я про это написал, список может может сосотоять из нескольких сот функций или тысяч. Вместо хранения массива, я храню строку, которая в 8 раз меньше кол-ва функций.

И ещё — скажите, а что станет с системой прав, организованной таким образом, если приложение попросит базу отдавать данные в другой кодировке?
При чём тут кодировка, если я храню бинарную строку.

sergonavt Oct 4 2008 at 08:35

Вместо хранения массива, я храню строку, которая в 8 раз меньше кол-ва функций
В памяти — ради бога. Вопрос в том, зачем нужны такие фокусы в базе, если список допустимых функций вычитывается для пользователя 1 раз.

При чём тут кодировка, если я храню бинарную строку
В поле какого типа Вы её храните? как выглядит соответствующий фрагмент в create table?

claustrofob Oct 4 2008 at 17:31

Фокусов в базе нет. Я не делаю хитрых запросов с битовыми операциями в базе. В данном случае хранилище не имеет никакого значения.

список допустимых функций высчитывается для пользователя 1 раз.
Давайте возьмём не 1000, а 1000000 функций. Что лучше загнать в память, массив из миллиона элементов или строку размером 125 kB?

sergonavt Oct 4 2008 at 22:55

Загоняйте в память всё, что угодно. Хоть с помощью acb сжимайте этот битмаск. Повторюсь, вопрос именно в том, в каком виде данные хранятся в БД — Вы же именно с этого начали, и именно это вызывает споры и возражения.
Жду ответа на вопрос о типе поля с битовой маской.

claustrofob Oct 4 2008 at 23:11

В mysql — blob, binary varchar.
Можно в файлах хранить. Храните где и как удобней, это не важно.

sergonavt Oct 4 2008 at 23:28

Спасибо за пояснения. Цензурного ответа у меня нет, извините. Но могу сообщить, что в некоторых распространённых СУБД (например, в Oracle) работа с BLOB — далеко не самые высокопроизводительные и удобные для реализации операции.

claustrofob Oct 4 2008 at 23:50

Не понимаю чего вы хотите добиться этим разговором. Я описал метод упаковки данных. Если вы не видите других проблем, кроме типа BLOB в БД, и ваша БД ну очень тормозит с BLOB, то храните в файлах или прямо в памяти. Надеюсь в вашей операционной системе не тормозят операции чтения/записи файов.
Не нужно вытягивать слова, которые конкретно не касаются топика, а потом искать цензурный ответ.

sergonavt Oct 5 2008 at 00:11

Вы заявили, что собираетесь реабилитировать хранение bitmask-структур в БД. Попытка была неубедительной, о чём было сказано. В ответ Вы предложили хранить данные в файлах.
Цель разговора — выявить недостатки подхода и не позволить Вам убедить кого-то создать в БД структуру, за котороую этого человека потом проклянут все, кто с ней будет работать.

claustrofob Oct 5 2008 at 00:25

Ох, тяжело=(
Главной идеей топика не было «Давайте-ка всё упакуем и будем хранить это именно в БД в BLOB, и больше нигде нильзя, только так». Я писал не ГДЕ хранить, а ЧТО хранить. Битовую маску.
Можно по-другому придраться:
— На чём вы это написали?
— На PHP
— Нет, php тормозит. Битовые маски говно. Вот если бы на C++…

Давайте лучше поговорим непосредственно про недостатки и скорость работы непосредственно самой маски и операций над ней.

sergonavt Oct 5 2008 at 09:24

Да, тяжело. Ладно, давайте попробуем ещё раз.
Вы заявили, что куча селектов хуже одного вычитывания битовой маски. Если оставить в стороне соображения по поводу BLOB, то спорить с этим сложно — дцать операций медленнее одной. Однако всё равно остаётся вопрос из самого первого комментария к этому посту — ЗАЧЕМ (а не «что» и «где») хранить в БД непригодные к использованию в других запросах, тяжеломодифицируемые и трудноотлаживаемые данные?

Подумайте, что будет, если одновременно, но независимо друг от друга произойдут два или более изменений в списке групп пользователя или функций, закреплённых за группами. В лучшем случае время внесения изменений заметно возрастёт из-за постоянных блокировок. В худшем какие-то изменения будут потеряны.

Кучу селектов можно было заменить и на однократный select, но обычных неупакованных данных — Вы сами предлагали это в числе прочего. Но вот о том, что после вычитывания можно в памяти перевести список идентификаторов функций в битовую маску, с которой потом быстро работать — почему-то не подумали.

Может быть, есть другой пример, в котором хранение битовой маски в БД является лучшим решением. Но это явно не тот случай — здесь можно оптимизировать запросы, менять схему работы (проверять права не перед выполнением операции, а при логине/обращении к странице), наконец, поставить рядом in-memory db и при проверке прав обращаться к ней.

-1

claustrofob Oct 5 2008 at 16:01

ЗАЧЕМ (а не «что» и «где») хранить в БД непригодные к использованию в других запросах, тяжеломодифицируемые и трудноотлаживаемые данные?
Вы правы, незачем. Хранить данные в БД опасно. Особенно, если кол-во записей в таблице не превысит ста.

В лучшем случае время внесения изменений заметно возрастёт из-за постоянных блокировок. В худшем какие-то изменения будут потеряны.
Да, внесение изменений в базу — это беда. Лучше данные в БД вообще не изменять. Согласен.

Но вот о том, что после вычитывания можно в памяти перевести список идентификаторов функций в битовую маску, с которой потом быстро работать — почему-то не подумали.
Да, я правда не подумал, что можно высчитать миллионный массив, а потом прогнать миллионный цикл и создать битовую маску. Респект.

Может быть, есть другой пример, в котором хранение битовой маски в БД является лучшим решением.
К сожалению, у меня не хватит жизни описать примеры, которые каждый хабраюзер считает лучшим решением. Если вы нашли лучшее применение, пожалуйста. Это буду счастлив, если моя статья хоть чуть-чуть вам помогла. И буду рад, если вы приведёте лучшее решение.

Описанный способ, работы с битовой маской с успехом использую в своих проектах. Хранить битмаску в BLOB полях в таблице, кол-во записей в которой не превисит даже 50, я не считаю злом. Но это не тема моего топика. Кэширование я тоже не считаю злом, но, простите, про кэширование на хабре уже писали.

sergonavt Oct 5 2008 at 17:57

Ваш сарказм противоречит сам себе. То миллионные массивы, то 50 записей в таблице.

Пожалуйста, попробуйте абстрагироваться от своего кода и понять простую, но выстраданную сединами многих программистов (и моими в том числе) мысль: если программист хочет странного — он что-то делает неправильно, и это потом аукнется.
Хранить упакованные до битовых полей данные в БД — это странное. Хотя бы потому, что никаких средств для работы с такими данными в стандарте SQL не предусмотрено.
Вы правда считаете себя умнее и дальновиднее авторов стандарта?

-1

claustrofob Oct 5 2008 at 19:37

То миллионные массивы, то 50 записей в таблице.
50 записей в таблице groups. Вы не следите за темой, а опять цепляетесь за возбуждающие вас слова=)

Вы, действительно, кроме страдания никаких чувств не вызываете.

никаких средств для работы с такими данными в стандарте SQL не предусмотрено
БД в данном случае ничто иное как просто хранилище. БД вообще не вкурсе, что я туда записал. Неужели вы пишете запросы на чистом ANSI SQL? И храните в БД только целочисленные данные?

И на предложение хранить данные в файле, всегда отвечаете: в БД это хранить нельзя.
— Едьте на поезде.
— Спасибо. Но я боюсь высоты.

Хранить упакованные до битовых полей данные в БД — это странное.
=))) Это настолько же странно, как хранить в БД email, имя или фамилию. Вротмненоги.

ZEGO Oct 6 2008 at 14:28

Полностью согласен. «Замечательная идея», в очередной раз описаная в данной теме, «была похоронена» именно в связи с тем что показала свою полную недееспособность. А данная статья, лично для меня, нечто вроде «в очередной раз на те же грабли».

shx Oct 3 2008 at 11:39

Мдя…
Строки в БД — зло! Они очень медленные в обработке. И в сложном запросе точно ничего не проверишь! Логику доступа к функциям обычно и очень правильно прописывают в приложении, а права доступа к ним регламентируют по групам доступа, которых редко бывает больше 10 (только в очень сложных проектах).
Давайте не будем усложнять себе жизнь.

claustrofob Oct 3 2008 at 14:01

В данном случае я НЕ использую выборку по бинарной строке.

а права доступа к ним регламентируют по групам доступа
именно об этом я и писал.

kibizoidus Oct 4 2008 at 10:35

Нужно начинать с того, что зло — это запросы вида "… `group_id` in (" .implode(",", $user_groups). ") ..."

claustrofob Oct 4 2008 at 17:24

Ну тогда нужно начинать с того, что все запросы — зло.

zupernintendo Oct 3 2008 at 12:24

откройте для себя ENUM
dev.mysql.com/doc/refman/5.0/en/enum.html

-3

claustrofob Oct 3 2008 at 14:02

Давайте попробуем применить в данном примере, только что открытый мною ENUM.

sotakone Oct 3 2008 at 14:12

ENUM поддерживает только мускуль.

claustrofob Oct 3 2008 at 14:20

В топике я привёл пример использования длинных битовых масок. Есть ещё куча вариантов решения этого примера. Но как использовать тут ENUM или SET, я совершенно не понимаю.

zupernintendo Oct 6 2008 at 17:07

ну так покурите мануал по ссылке и поймете

-1

dimants Oct 3 2008 at 14:12

Господа, больше позитива! :)

galev Oct 3 2008 at 14:26

Я вот не пойму, кто мешает сделать каждой «функции» свой столбец. Или кол-во функций не ограничено? Тогда уже речь об объектах доступа.

-2

nooze Oct 3 2008 at 14:29

1000 столбцов?

galev Oct 6 2008 at 03:18

Что это за объект, где нужно присваивать полномочия 1000 функциям?

nooze Oct 6 2008 at 10:37

Даже если сто — это не такая большая цифра для большой системы. Будете делать 100 столбцов?

oowl Oct 3 2008 at 14:38

Решение удачное и используется мной уже давно. Особенно актуально в highload проектах.

l_nagash Oct 3 2008 at 23:28

хорошее решение. Мы использовали подобное для хранения набора прав. Надо будет попробовать и ваше решение )

pixx Oct 4 2008 at 00:59

Скажите, а будет ли работать подобное решение, если количество возможных функций сайта — число переменное и может постоянно изменяться? Можно ли как-то модифицировать этот метод для варьируемого количества функций без перестройки всех наборов прав при изменении количества функций сайта?

claustrofob Oct 4 2008 at 17:20

Можно даже ничего не модифицировать. Единственное, что можно добавить, это при уменьшении ко-ва функций отрубить лишние символы во всех сформированных бинарных строках, чтобы не хранить лишние данные.

WayBe Oct 4 2008 at 14:07

использовал подобную по замыслу систему в магазине игрушек.
используем инт, каждый бит отвечает за свой тип.
16 возможных типов «развития» способностей, включать можно несколько, при вставке — сборка:
$razvitie=0;
for ($z=0;$z<count($razv);$z++)
{
$razvitie=$razvitie|$razv[$z];
}

и вывод в товаре:
$bit=1;
for ($z=0;$z<16;$z++)
{
if ((int)($line['razvitie']&$bit)!=0)
echo тип категории такой-то
$bit=$bit<<1;
}
для данных целей — самое то, думаю. предел — лишь количество бит в типе…
ЗЫ: привет z80 ;)

WayBe Oct 4 2008 at 14:12

да, $razv[$z] — массив типов, в цыкле вывод:
и $bit=$bit<<1;
они и собираются ;)

claustrofob Oct 4 2008 at 17:22

Это было описано в двух предыдущих топиках на эту тему (см. выше). Integer имеет ограничение в 32 бита. Я описал метод работы с гораздо большими наборами.

Show the best of all time