Scratch Jul 26 2010 at 09:36

Замедление хеширования паролей. Зачем?

7 min

15K

Cryptography*

+67

107

Comments 107

Ueasley Jul 26 2010 at 09:43

Допустим, надо сменить всем пароли на высоконагруженном сайте. Или сохранить его с другой солью.

Админы будут в ярости

-15

Scratch Jul 26 2010 at 09:47

В основном это используется на клиентских машинах для шифрования различной инфы (архивы\документы и.т.д)

Vladson Jul 26 2010 at 11:00

И часто вы практикуете массовую смену паролей?

+13

Ueasley Jul 26 2010 at 11:30

Я – нет.

-4

kovyrlo Jul 26 2010 at 12:48

А кто тогда практикует?

Ueasley Jul 26 2010 at 13:06

Ну, я видел проекты, в которых сначала пароли вообще в открытом виде хранились (~4 000 000). Пересчет занял день, вроде.

-3

kovyrlo Jul 26 2010 at 13:08

Это ужасно!

Ueasley Jul 26 2010 at 13:20

Кто спорит?

-2

Vladson Jul 26 2010 at 16:20

Вопрос в другом, каким макаром неправильный подход к хранению паролей является виной алгоритма хеширования?

Ueasley Jul 26 2010 at 16:33

В том, что долгое массовое хеширование выльется в ад. Уверен, такая ситуация может возникнуть.

-5

silentroach Jul 26 2010 at 11:06

а не получится — вы же умный мальчик не храните пароли в открытом виде, а пользователи одновременно все не смогут сменить пароль.

FractalizeR Jul 26 2010 at 11:27

Как это — сохранить пароль с другой солью? Без участия пользователя, знающего пароль, это должно быть невозможно, как вы понимаете. Иначе зачем вообще тогда соль?

Ueasley Jul 26 2010 at 11:51

Понял позже.

dohlik Jul 26 2010 at 10:15

Гм… может, просто sleep($period) воткнуть, где $period — величина замедления (может быть передана в хеширующий метод)? Например, для разовой смены паролей у всех юзеров данный параметр можно выставить в 0, дабы не тормозить зря систему.

Навряд ли многократное хеширование так уж усилит криптостойкость, получается основная задача — усложнить брутфорс…

-11

superhabra Jul 26 2010 at 10:23

Вы не поняли сути — создаётся не медленный код, а медленный алгоритм, который при любой реализации будет медленным.

+17

dohlik Jul 26 2010 at 10:25

Объясните, пожалуйста, разницу :) Пока мне видится, что «при любой реализации будет медленным» это скорее минус, чем плюс.

-9

barker Jul 26 2010 at 10:25

Плюс в том, что при подборе он тоже будет медленным.

dohlik Jul 26 2010 at 10:27

А что, при переборе паролей мой вариант ( sleep() ) почему-то не сработает? :)

-10

barker Jul 26 2010 at 10:30

Потому, что подбирать будут не этим кодом со sleep-ом, а совершенно другим кодом, реализующим данный алгоритм. О чём выше и сказали, или до сих пор не понимаете разницу?)

dohlik Jul 26 2010 at 10:39

Ну хрен с ним, с алгоритмом — пускай он известен. А как можно соль узнать, чтобы реализовать хеширование по-своему?

-1

dohlik Jul 26 2010 at 11:02

Т.е. все все знают, просто коммент написать лень — легче плюнуть, так? Замечательное решение.

Я спрашиваю не чтобы поспорить, а чтобы разобраться в предложенной схеме, а в ответ — типичный для Хабра средний палец. Мдя

+10

shai_hulud Jul 26 2010 at 11:06

вас картинка приманила в топик?

+13

dohlik Jul 26 2010 at 11:11

Вы только что честно заработали минус. Я задал конкретный вопрос по теме топика. Вы на него не ответили, стеб не осилил.

-6

shai_hulud Jul 26 2010 at 11:17

вам выше всё объяснили, а вы продолжаете слоупочить. Теперь еще и обижаетесь. Может лучше фишки будете читать, там народ попроще :)

dohlik Jul 26 2010 at 11:22

Если я продолжаю спрашивать, значит не все мне понятно. Вопросы вроде как задаю достаточно конкретные. В чем проблема? Хочется поострить?
Вы лично ничего по теме топика не написали, только зачем-то г** подбрасываете. Ведь очень интересно смотреть на других свысока, правда?

ЗЫ. На Фишки не хожу, да и не надо — Хабр к ним потихоньку приходит.

binom248 Jul 26 2010 at 11:25

Народ обижается, что вы не хотите почитать / изучить теорию типа www.intuit.ru/department/security/networksec/
А хотите получить всё «разжеванное на блюдечке».

dohlik Jul 26 2010 at 11:38

Я знаком со многими общими понятиями из этой теории, спасибо. И вопросы задаю, как мне кажется, не откровенно тупые (разубедите меня, но аргументами, а не минусами).
Ниже есть комментарии с нормальными ответами. Почему-то люди не гнушаются снизойти до разговора с непонимающими, вот за это я все еще люблю Хабр.

-2

nikita2206 Jul 26 2010 at 12:06

Предположим у тебя есть сайт. Злоумышленник решил его взломать. Он раздобыл алгоритм шифрования, который ты используешь и хеш пароля админа. Алгоритм прост: md5($passw); Злоумышленник воспользуется брутфорсом пароля по твоему алгоритму, и найдет его максимум часа за два.

А теперь предположим, что алгоритм шифрования такой:
$hash = '';
for($i = 0; $i < 10000; $i++){
$hash .= sha1($passw).md5($passw);

if(!($i%10)){
$hash = md5(sin((int) $hash).$hash);
}
}

С таким алгоритмом подбор будет вестись не один день.

Scratch Jul 26 2010 at 13:07

прикольный вариант ) не сразу сообразил как работает

dohlik Jul 26 2010 at 13:28

Да, это я понимаю :) Вопрос был в том, что обычно в веб-приложениях как минимум соль будет неизвестна. Правда, получается, что если известен правильный хэш, то соль можно извлечь (зная алгоритм).

А если речь идет об архиваторе, то дизассемблировать — и вперед, тут все ясно.

el_gato Jul 10 2012 at 14:20

Представьте, что у вас есть алгоритм с вставками sleep, которые замедляют его работу, алгоритм открыт и известен, злоумышленник крадет базу хешей, берет алгоритм, удаляет из него все замедляторы и вуаля, алгоритм становится быстрый. А здесь же имея алгоритм и даже соль все равно придется прогонять 50000 итераций для каждого варианта пароля, что замедлит время подбора во сколько тысяч раз? Как ни крутись, а упростить алгоритм и следовательно сократить время его выполнения не получится.

-1

Scratch Jul 10 2012 at 14:21

топику год ) расслабьтесь

ixSci Jul 26 2010 at 13:32

Злоумышленник воспользуется брутфорсом пароля по твоему алгоритму, и найдет его максимум часа за два.

Интересное утверждение, а если у меня пароль длиной в 40 символов, он тоже за 2 часа забрутит его? ;)

mx2000 Jul 26 2010 at 13:46

больше интересен момент добычи хеша пароля одмина =) Очевидно, что в куке он не хранится, а хранится, допустим, в базе. Как кулхацкер выцепит хэш из бд?

Получается, что, чтобы взломать сайт, нужно сначала взломать сервер ;)

matich Jul 26 2010 at 14:57

sql injection.

mx2000 Jul 27 2010 at 17:48

sql injection для чтения инфы? что-то новое :)

XaosSintez Jul 26 2010 at 20:01

sql-инъекции пока никто не отменял

-2

VenomBlood Jul 26 2010 at 19:22

Длина пароля значения не имеет, если у злоумышленника есть хеш — ему достаточно найти любой пароль имеющий тот же хеш, а будет он вашим или вдруг какая коллизия — без разницы.

sic Jul 26 2010 at 20:34

Вы про коллизии? только и займет это O(2^64), O(2^80)… (подставить нужное) времени. а короткие пароли ломаются посимвольно за O(x^N), где N — длина пароля.

alisey Jul 26 2010 at 11:07

Брутфорсом или дизассемблированием.

dohlik Jul 26 2010 at 11:14

Но ведь брутфорс соли (я так понимаю, тут по-любому будет использован алгоритм сервера) будет получать задержки?

PS. Можно перейти в личку, чтобы не замусоривать данный топик

-1

FractalizeR Jul 26 2010 at 11:29

С какой стати брутфорс будет использовать алгоритм сервера? Я сливаю себе базу данных сервера с паролями и брутфорсю на своем домашнем Cray. Теперь понятно?

dohlik Jul 26 2010 at 11:33

Ого! Доступ к БД сервера? Это что-то новое. А зачем тогда брутфорс, если можно тогда прямо в БД что-то править?

Вообще-то я имел в виду случаи, когда у злоумышленника нет доступа к внутренностям сайта (это ведь самый распространенный вариант?).

alisey Jul 26 2010 at 11:44

Давайте определимся. Это алгоритм не предназначен для препятсвия подбору паролей на сайт, там sleep как раз подойдет. А это алгоритм для того чтобы замедлить подбор пароля к шифрованному документу (например rar-архиву). Злоумышленнику известен алгоритм хеширования, так как он имеет доступ к бинарникам архиватора и может их дизассемблировать.

dohlik Jul 26 2010 at 11:47

Да, спасибо. Внизу уже тоже указали на такие случаи. Я рассматривал алгоритм со своей колокольни.

Спасибо за конструктив, приятно что-то полезное из статей извлекать.

TheShock Jul 26 2010 at 20:36

не подойдет sleep на сайтах. там можно в 1000 потоков запустить подбор пароля. подойдет разве что добавление в базу последнего обращения. например, если логинились к пользователю в 1234567890 юникс-секунд, то след раз можно логинится только в 1234567895 секунд, иначе выдаст ошибку

alisey Aug 1 2010 at 00:53

Это само собой, не хотелось разжевывать. Счетчики на аккаунты, на IP. Но sleep никуда не девается, он как замедляет атаку с серии IP на один аккаунт.

steck Jul 26 2010 at 10:35

Потому что при подборе при помощи средств (к сожалению не знаю какие они для джавы) вытащит код, который генерит хеш, уберёт оттуда все слипы и получит существенно более быструю реализацию.
Или, если алгоритм известен то просто напишет его сам, без слипов.
После чего будет брутфорсить в своё удовольствие.

С медленным же алгоритмом скорее всего не получится придумать ничего более умного чем просто медленно его выполнять.
Такие дела.

UFO just landed and posted this here

dohlik Jul 26 2010 at 11:36

Ну, я предполагаю, что у злоумышленника нет своей лопаты, и он нанимает человека у владельца пароля :) Это все к тому, что у механизма шифрования имеются секретные части (соль, алгоритм хеширования и т.д.), к которым вроде как доступа у простого пользователя нет.

Или я коренным образом в чем-то ошибаюсь?

-2

Scratch Jul 26 2010 at 11:38

мы не рассматриваем ситуацию когда надо еще что то достать (соль, кстати, ни разу не секретная часть)
Мы рассматриваем ситуацию когда у нас уже всё есть кроме пароля

dohlik Jul 26 2010 at 11:43

Просто удар по почкам :) Я всегда полагал соль секретной частью… Это все меняет, хотя вопросы еще остаются, спасибо!

Scratch Jul 26 2010 at 12:03

генерируем хеш (соль+пароль). Соль хранится отдельно. Чтобы проверить верен ли пароль, мы обязаны провторить процесс как хеш(соль+проверяемый пароль) и если они совпадут то ок.
Отсюда вывод — соль хранится отдельно и ни от кого не прячется

Roder Jul 26 2010 at 11:40

В критографии считается алгоритм полностью известным злоумышленнику. Соль в том числе является не секретной частью алгоритма.

gadgetgeek Jul 26 2010 at 11:18

Подскажите, почему нельзя просто увеличить значение FAIL_DELAY?

-1

DorBer Jul 26 2010 at 11:31

Потому что по заранее известному алгоритму злоумышленник может подбирать пароль на своей машине.

gadgetgeek Jul 26 2010 at 11:40

Если я не ошибаюсь, для PAM нету разницы, с какой машины в пытаетесь осуществить подбор пароля — локальной или удаленной.

Roder Jul 26 2010 at 11:43

Речь идет о подборе пароля не прибегая к стандартным интефейсам проверки.
Например, подбор пароля к архиву.

DorBer Jul 26 2010 at 11:46

До тех пор, пока нет хэша. Если хэш есть, то для его брутфорса уже не нужен целевой сервак.
А в топике автор как раз и приводит алгоритм, который даже при его знании и владении хэшем не позволит быстро его подобрать.

Oblitus Jul 26 2010 at 11:19

>в java нет unsigned типов! Совсем!
А char?

FractalizeR Jul 26 2010 at 11:31

Char — строковый тип. С таким же успехом string можно назвать универсальным типом данных произвольной длинны с произвольной точностью.

Scratch Jul 26 2010 at 11:31

Я имел в виду типы для работы с числами. Про двухбайтовый char в курсе.

grobitto Jul 26 2010 at 11:46

byte?!?!

Scratch Jul 26 2010 at 11:50

только signed

geka Jul 26 2010 at 11:28

похожая идея используется в unix md5, где стандартный md5 вызывается 1000 раз

Nakilon Jul 26 2010 at 11:43

А еще наверное можно отсрочить момент понимания, что пароль не валиден? Например, он может «подойти», но на выходе будет кашица, которую идентифицировать автоматически будет «сложно».

Roder Jul 26 2010 at 11:48

И как мне понять, что мой бинарник не запускается из-за неправильного пароля, а не из-за того что он битый еще до архивирования?

Scratch Jul 26 2010 at 11:50

Говоря о шифровании, можно не добавлять к исходному сообщению никаких специальных данных (Padding), по которым можно узнать зашифрованы данные или нет. Тогда если данные, например, пожаты хорошим алгоритмом (без сигнатур, опять же) или обфусцированы как в скайпе, то на выходе даже с верным паролем данные не будут отличимы от случайных.

hooey Jul 26 2010 at 12:07

В то время как космические корабли бороздят просторы вселенной, на некоторых сайтах по-прежнему используется MD5 пароля в чистом виде, без всякой соли, что позволяет весело и радостно пользоваться радужными таблицами.

antanubis Jul 26 2010 at 13:13

А где там используется md5 от пароля в чистом виде? В куках на основном домене уже давным давно хранится псевдосессия, зависящая от IP и пароля, в куках на login.vk.com хранится парольный хеш, однако совсем не md5 от пароля в чистом виде. Или речь про еще какое-то использование?

mrThe Jul 26 2010 at 12:09

Кажется, именно так хешируется пароль в некоторых *nix системах.

А ещё, я тоже писал об этом в своём блоге почти год назад. Всё-таки, хорошие идеи достаточно часто приходят в голову разным людям)
Там даже небольшая дискуссия в комментариях развернулась.

Цитата оттуда:

Перебор 1000 паролей на компьютере средней мощности должен занимать больше 1 секунды.

У вас, даже лучше получилось. К слову, всё, за исключением модуля, описанное в моём посте — успешно используется на реальном проекте.

ExxY Jul 26 2010 at 12:09

Чем результат принципиально отличается от результата использования более длинной соли? Я так понимаю что ничем, кроме того что будет дико грузить процессор на сервере при каждой проверке пароля.
Вывод — на серверных приложения такие решения неприемлимы.

kblcuk Jul 26 2010 at 12:11

А что за число 0x20000? Никогда не видел.

-2

Scratch Jul 26 2010 at 12:19

0x означает, что используется 16ричная кодировка

kblcuk Jul 26 2010 at 12:22

Ларчик просто открывался. Спасибо (:

divan0 Jul 26 2010 at 12:37

Судя по комментариям, слово «медленный» многих запутало. :)

А идея здравая на самом деле.

tenshi Jul 26 2010 at 13:15

как бы только это шаманство не увеличило число коллизий настолько, чтобы подобрать пароль стало даже проще х)

Scratch Jul 26 2010 at 13:22

для успокоения души можно провести тесты генерируемой соли на случайность )

tenshi Jul 26 2010 at 13:49

а толку? соль и так хранится в открытом виде. а коллизии от секретного ключа при заданной соли будут только увеличиваться

Scratch Jul 26 2010 at 14:10

на самом деле первый дельный комментарий к топику ) Я пока не знаю что ответить, надо почитать литературу

Vasily_Pupkin Jul 26 2010 at 13:17

Действительно, зачем? Если от брутфорса перехваченных данных — Just use SASL. Если от брута сграбленой базы — от rainbow спасет салт, который и так есть. От онлайн брута — задержки собственно в процессе инициализации. Вообще, строго говоря, не совсем ясно как будут меняться коллизионные свойства результирующего хеша от вводимых вами дополнительных шагов. А вообще, как по мне, самое слабое звено — канал связи :] Я бы предпочел отдельную инфраструктуру аутентификации с паролями в открытом виде + SASL этой схеме. Впрочем каждой задаче своё решение.

Scratch Jul 26 2010 at 13:26

кому надо могут сгенерить таблицы и для определенного saltа, если подбирается лишь определенный пароль. Я правда не знаю будет ли это быстрее чем голый брут

Vasily_Pupkin Jul 26 2010 at 13:31

Конечно нет. Это и есть — голый брут :] Просто rainbow — это брут оптом, где кто-то уже делал эту работу.

По моему мнению, тут решается не та проблема. Надо защищать канал связи и доступ к данным аутентификации, способ аутентификации, а не сами данные.

Zibx Jul 26 2010 at 14:28

Кто объяснит почему все используют md5 ( pass + salt )?
Почему не завести в бд поле, в котором будет жить то что находится в куке у конкретного пользователя? При генерации этого значения можно использовать, например: md5( рэндом + пароль + положение луны на небе ).

-1

Vasily_Pupkin Jul 26 2010 at 16:08

А если сессий несколько? Обычно хранят ключевую информацию. Хранить каждый сессионный ключ чревато ДоСом. Использовать всегда один сессионный ключ… Ну можно конечно, но тогда кража сессионного ключа автоматически позволяет получать доступ к аккаунту на все его время жизни. Причем не совсем прозрачно, сколько это время жизни будет составлять. Впрочем, как показывает практика, этот аспект никого не парит. Так что может быть и можно (% Но в любом случае, нужно хранить мастер ключ где-нибудь, на случай новой сессии. Если хранить эти данные в той же базе, то ничего по сути не меняется.

Вообще, хранение данных аутентификации не на отдельном логическом юните имхо — безответственное решение

Zibx Jul 26 2010 at 19:22

А не, я туплю. Я не о той задаче мысли привёл. Я про кражу куки и брутфорс её написал.

IlyaPodkopaev Jul 26 2010 at 14:28

в маршрутизаторах Cisco уже более 8ми лет используется тысячекратный хеш. так что идея весьма не нова.

0leGG Jul 26 2010 at 15:11

Проблема тысячекратного применения хэширования, например, в том, что каждый шаг уменьшает возможное пространство значений (в лучшем случае — оставляет той же размерности), исходя из этого может получиться более простым подбор коллизии. Ведь злоумышленнику, по сути, не так важен сам пароль, как то, что хэш от результата брутфорса совпадает с хэшем оригинального пароля.

Scratch Jul 26 2010 at 16:02

всякие пермутации призваны усложнить как раз таки их поиск… Хотя с удовольствием почитаю о безитеративном замедлении

Vasily_Pupkin Jul 26 2010 at 16:18

Это не совсем так.

Не суть ясно, уменьшается ли возможное пространство значений.

Злоумышленнику нужно подобрать то, что будучи поданным на вход ф-ии аутентификации в результате имеет то же значение, что и значение, с которым будет производиться сравнение. Если туда подается пароль, а внутри модуля аутентификации сравниваются значения вот иэтих 100500 проходов, то, как не крути, все равно придется искать коллизию (атака экзистенциальной подделки). Скорее всего сложность этой атаки будет такой же, как и в случае одного хеширования (Если нет фильтра входных данных, если он есть, то не каждый результат подойдет).

0leGG Jul 26 2010 at 19:07

Ну увеличиваться оно явно не будет, в силу того, что хэш — это отображение. Уменьшаться может запросто: пусть у нас пароль — это число от 0 до 2^32 — 1 и дурацкая хэширующая функция — правый сдвиг. Тогда после первого применения хэша у нас пространство значений сократится вдвое (и значения 0 и 1, например, будут давать одинаковый хэш — 0). И так далее, после 32 применений хэша в любом случае получится у нас 0.
Вы, конечно, возразите мне, что хэш придумывают не такой разрушительный обычно, а умный и со всякими классными штуками. Но, опять же, есть ещё одна проблема. Если у нас есть функция, применённая несколько раз последовательно, то у неё может быть и какой-нибудь плохой эффект от циклического применения, который с удовольствием могут найти и использовать криптоаналитики. Грубо говоря, отчасти на этом построена циклическая атака на RSA. Конечно, можно подбирать хорошо функции и соль, чтобы избегать уязвимостей, но это уже более глубокая алхимия.

Vasily_Pupkin Jul 26 2010 at 19:53

Вы всё правильно говорите, но стандартизированные криптографические хеш функции обычно рассчитаны для такого использования (всякие PRNG/MGF/KDF преобразования) [если интересно, можно поплясать по ссылкам от требований NIST SHA-3, раздел 2.2.1]. Вообще, конечно, имхо в данной ситуации это решение какое то леваковое, и «лечит симптомы, а не проблему» :)

Scratch Jul 27 2010 at 07:48

Можете кинуть такой ссылкой? Чет я по SHA-3 requirements никак не найду доку в которой был бы пункт 2.2.1 )

sic Jul 26 2010 at 20:25

Для SHA будет строго уменьшаться,

sic Jul 26 2010 at 20:27

прошу прощения, ссылка сорвалась, а вот и она.

то есть, в нашем-то как раз случае, эта проблема существенна.

Vasily_Pupkin Jul 26 2010 at 20:49

В случае ТС SHA-1 1) не используется 2) нельзя сказать что случай ТС эквивалентен увеличению раундов ф-ии. То что в случае ТС получается нужно (если это действительно кому то нужно) исследовать отдельно :]

Roder Jul 26 2010 at 22:23

В случае SHA используется не в прямом виде циклическое хеширование.
people.redhat.com/drepper/SHA-crypt.txt

jerom Jul 26 2010 at 23:28

А что скажете о применении гигантской соли? Прегенерённого случайного файла, где функцией от пароля пользователя мы определяем смещение, по которому считываем, скажем 500Mb и используем как соль: на моей машине md5 от 500 Mb считается почти секунду.

sic Jul 27 2010 at 16:38

И эту гигантскую соль тоже придется где-то хранить.

У Вас, кстати, видимо очень быстрый винчестер, у меня за секунду даже 100 мегабайт не считается.

jerom Jul 27 2010 at 17:05

Ну я считаю, что эти 500 Mb уже в файловом кеше лежат.

ArtemPugachev Jul 26 2010 at 17:37

Гм? Поделить базу для брута на несколько частей и запустить брут с нескольких хостов? — Будет быстрее

-1

UFO just landed and posted this here

sic Jul 26 2010 at 20:21

Какой разврат.

0. Где хоть какие-нибудь гарантии, что вместе с усложнением алгоритма хеширования, Вы не увеличите теоретическую вероятность коллизии в пропорциональное (а то и худшее) число раз?

Ну и очевидные ошибки:
1. в RAR успех расшифровки определяется сравнением полученных CRC расшифрованного блока, а он не маленький. Отсюда и скорость такая низкая, а не из-за раундовых солей.

2. Радужные таблицы как раз-таки не эффективны после введения соли. Ключевой момент, почему они еще хоть как-то могут быть применимы — небольшая длина соли. Если сделать соль пропорциональной разрядности хеш-значения, то радужные таблицы полностью теряют смысл; их генерация для каждого конкретного случая занимает существенно большее время, чем прямой перебор (да еще и не будет обладать 100% шансами на успех).

Если же мы надемся на произвольную коллизию, то при фиксированной соли равной по разрядности хеш-значению мы с большущей (назовем ее «100%», лень считать) вероятностью получим коллизию, не содержащую эту соль в качестве части пароля, и такой пароль не примет система:

f(pass. ababababab) = hash = f(test. cdcdcdcdcd)

3. Пропорционально вы уменьшите количество одновременно обрабатываемых авторизаций на предполагаемом сервере, может быть в 10 раз — это не существенно, но в 100000 — серьезная проблема. Для локальных решений это имеет смысл, но для сетевых — абсурд.

-2

Roder Jul 26 2010 at 22:20

не содержащую эту соль в качестве части пароля, и такой пароль не примет система

соль не часть пароля.

их генерация для каждого конкретного случая занимает существенно большее время, чем прямой перебор

Генерация таблиц равна по времени полному перебору. Просто в случае соли на генерить для каждой соли опять полностью весь доступный парольный диапазон. Ничто не мешает сделать заранее радужные таблицы для солей заранее. Да растет объем для хранения, но в наше время не это проблема. Возможно и существует у тех кому надо.

sic Jul 27 2010 at 16:33

Придется проводить очередной ликбез.

Генерация таблиц равна по времени полному перебору.

Это ерунда.
Таблица строится по некоторому диапазону строк X (например = {a..z}^8). И если прямой перебор проверяет каждую строку из X и имеет 100% шанс подобрать пароль для любого хеша, полученного из строки из X (что очевидно), то для радужной таблицы вероятность успешного подбора по нелинейному закону зависит от размера таблицы. И для получения где-то 75% успеха придется применить функцию хеширования по крайней мере в 2 раза больше раз, чем для полного прямого перебора. Для 99.9% покрытия объем вычислений на порядки привышает сложность прямого перебора для аналогичного промежутка. чуть подробнее.

но в наше время не это проблема

Вы считаете, что соль это отдельный параметр алгоритма, а не часть пароля, ладно, исходим из этого… тогда тезис представляет собой абсурд. Пусть мы умеем строить таблицу для конкретной соли, позволяющую восстановить любой пароль с 100% вероятностью (!) и такая таблица будет занимать всего 1 мегабайт (!)… но, вообще говоря входных параметров — различных солей число бесконечное. У кого-то существует бесконечное дисковое хранилище? Мне надо, но у меня нет.

Так вот, к чему это я. Соль — часть пароля.
хеш = MD5( пароль + соль ),
и для построения таблиц возможные соли включаются в диапазон паролей, затем, при подборе пароля по таблице проводится его декомпозиция на часть-соль и часть-пароль-пользователя. Но из-за коллизий (а мы собственно на них и надеемся) часть-соль может не соответствовать (и не будет!) нашей фиксированной соли, для которой мы пытаемся восстановить юзер-пароль по хешу.

А мораль такая, введение соли действительно делает применение таблиц полностью бессмысленным.

Roder Jul 27 2010 at 18:22

Так вот, к чему это я. Соль — часть пароля.

Пароль это то что вводится пользователем. Соль либо является константой в алгоритме, либо генерится случайно при установке/смене пароля и тогда хранится вместе с хэшем.
В случае использования соли при хэшировании пароля, если мы будем устраивать тотальный перебор нам нужно перебрать ровно столько же паролей, сколько и в системе без использования соль. В любом случае это прорва времени.
Внезапно, нам удалось получить доступ к хэшам паролей. Времени на полный перебор у нас мало, но мы-то заранее подготовились. Для того чтобы ускорить процесс мы на досуге строим радужную таблицу для всех возможных паролей, например { MD5('war'), MD5('god'), MD5('sex')}. И теперь нам достаточно проверить какому из хэшей соотвествует наш хэш и спокойно получить доступ. Вариант оценки размера радужных таблиц для разных алфавитов уже был на хабре.
Но оказалось, что создатели системы продвинутые люди и использовали соль при хэшировании пароля. Для каждого конкретного пользователя, соль либо известна и хранится вместе с хэшем, либо ее можно получить из алгоритма зная имя пользователя. И перед нами стоит опять затратная по времени задача перебрать все пароли, но уже с прибавлением этой соли {MD5(salt+'war'),MD5(salt+'god'),MD5(salt+'sex')}. Очевидно, что время и количество вариантов для тотального перебора не изменилось. Но вот наша старая таблица уже не дает нам возможности сэкономить время.
Ничто не мешает нам заранее сделать такие таблицы для солей. Диапазон их допустим 0x00 — 0xFFFF и мы просто штампуем таблицы {MD5(0x00+'war'),MD5(0x00+'god'),MD5(0x00+'sex')}, {MD5(0x01+'war'),MD5(0x01+'god'),MD5(0x01+'sex')},…
Да увеличивается экспоненциально место необходимое для хранения таблиц. Но для коротких размеров солей это уже вполне бюджетное хранилище. И с каждым годом объемы хранилищ все меньше имеют значение.

Scratch Jul 27 2010 at 08:04

Я вообще то не говорил что замедляет хэширование именно раундовая соль, она призвана помочь с коллизиями. А насчет винрара — в исходниках unrar в crypt.cpp есть отличные строки (не зря я его упоминал)
const int HashRounds=0x40000;
for (int I=0;I<HashRounds;I++)
{
hash_process( &c, RawPsw, RawLength, HandsOffHash);
…
можете сами глянуть…

Show the best of all time