m1rko 10 окт 2019 в 13:54

Unix-пароль Кена Томпсона

2 мин

48K

Информационная безопасность**nix*История ITБиографии гиков

Перевод

+121

Комментарии 70

amarao 10 окт 2019 в 14:15

Т.е. хэши паролей разработчиков утекали даже в те времена.

Punk_Joker 10 окт 2019 в 14:17

Раньше об этом особо и не думали

amarao 10 окт 2019 в 14:52

И сейчас тоже не особо думают.

+28

Inanity 10 окт 2019 в 15:38

Утечки были, есть и будут всегда. Как раз именно угрозы утечек баз данных паролей породили подход к хранению хэша пароля с солью. Но от короткого пароля, плохого хэша и соли ничего не защитит.

Aquahawk 10 окт 2019 в 14:17

длиной пароля максимум 8 символов

ZghOT0eRm4U9s:p/q2-q4!

это как?

+19

kmosolov 10 окт 2019 в 14:19

хеш: ZghOT0eRm4U9s
пароль: p/q2-q4!

+61

Aquahawk 10 окт 2019 в 14:35

понял

Wexter 10 окт 2019 в 14:19

это пара хеш: пароль

DCNick3 10 окт 2019 в 14:20

Слева от двоеточия — хэш, после — пароль.
(Я буду обновлять комментарии)

konshyn 10 окт 2019 в 14:25

Как хорошо, что перед отправкой ответа решил обновить страницу:)

+14

GCU 10 окт 2019 в 14:28

Лучше как-то более явно выделить сам пароль: p/q2-q4!.
Я лично тупил смотря на хеш :)

+39

WhiteBlackGoose 10 окт 2019 в 17:39

НЛО прилетело и опубликовало эту надпись здесь

HellKaim 10 окт 2019 в 14:28

Сне интересно: почему ни кто еще не посчитал все возможные хеши для crypt(3)?
Если подбор пароля это 4 дня, то за пару месяцев можно сосчитать все возможные комбинации… А если запараллелить...

time2rfc 10 окт 2019 в 14:33

или запустить в облаке....

-1

DaylightIsBurning 10 окт 2019 в 15:03

Возможно потому, что их быстрее пересчитать, чем загружать с диска/по сети? 930MH/с — это 12*930*10^6 byte/s = 11.16 GBps. Конечно, посчитанные хеши можно отсортировать, что бы их быстрее было искать, но их всё равно придётся где-то хранить, а это 11.16 GB/s * 4*24*60*60s ~= 4 PB.

DistortNeo 11 окт 2019 в 00:14

Просто повезло получить результат за 4 дня (не было заглавных букв, например).
На самом деле, если посчитать общее количество всех возможных хэшей, то их количество будет весьма циклопическим.

DaylightIsBurning 11 окт 2019 в 16:13

Верно. Справедливости ради, rainbow tables позволяют сэкономить место и для 8-байтовых паролей понадобится всего 256^(8*2/3) byte = 7 терабайт. Но даже 10-значный пароль уже потребует rainbow table размером в 11 петабайт…

esaulenka 11 окт 2019 в 19:29

Вы как-то неправильно считаете.
Радужная таблица позволяет «схлопнуть» исходную таблицу в тысячи (сотни тысяч, миллионы) раз. Да, считать перед поиском по таблице придётся, но по сравнению с исходной задачей — расчётов совсем немного потребуется.

DaylightIsBurning 11 окт 2019 в 20:30

Радужная таблица, как я понимаю, позволяет схлопнуть N паролей в N^(2/3) записей. Именно это я и рассчитал. При чём я исходил из того, что понадобится всего 1 байт на запись, а это недооценка. На самом деле для радужной таблицы восьмибайтного пароля понадобится не 7 ТБ, а минимум в 6 раз больше.

esaulenka 11 окт 2019 в 23:06

Хотел было отправить Вас в википедию, а там именно эта ерунда и написана.
Причём а) написана очень давно и б) в английской версии этой странной арифметики нет.

Принцип таблицы очень простой: строится цепочка из N пар пароль-хэш, но сохраняются только «края» — самый первый пароль и самый последний хэш. С учётом того, что N может равняться и миллиону, «степень сжатия» получается довольно большая.

При подборе по этой таблице, правда, перед тем, как искать совпадения по файлу, придётся просчитать все N возможных вариантов (там даже N квадрат получается в итоге). Но посчитать хэш даже миллиард раз — это не 2^8, это сильно быстрее.

DaylightIsBurning 13 окт 2019 в 13:40

Допустим, мы хотим, что бы поиск по радужной таблице занимал не более чем 10 секунд на 1м GPU. При 930MH/с выходит, что максимальная длинна цепочки радужной таблицы — sqrt(10*2*930*10^6)=136382. Для десятибайтового пароля число паролей = 256^10. Одна запись в таблице будет занимать не менее 6 байт. Размер радужной таблицы: 6*256^10/136382 = 53.2 ексабайта. Для 8ми-байтового пароля выходит 811.5 терабайт, для 7ми-байтового — 3.2 терабайта. Если у нас 8ми-байтовый пароль и мы готовы ждать поиска по радужной таблице целый час — её размер будет не менее 42.8 Терабайт.
Я думаю, как-то так и выводится N^(2/3). При более компактных таблицах, наверное, выходит что поиск занимает дольше, чем прямой перебор.

esaulenka 14 окт 2019 в 10:48

У вас несколько ошибок в рассуждениях. Во-первых, вы верите всяким непроверенным данным (что мне, что википедии). В работе изобретателя этих таблиц (ссылка есть в той же википедии, кстати) есть более развёрнутые расчёты (и по определению — правильные) сложности вычислений и размеров таблиц. И да, тем всё несколько сложнее (к тому же, всё зависит от вероятности найти искомый пароль — метод «берём и выбрасываем 99% информации» явно подразумевает потери информации).
А во-вторых, от 8-символьного пароля (кстати, кто-нибудь подскажет — у unix'а времён Кена Томпсона в пароле могли быть символы с кодами >= 0x80 ?) мы как-то незаметно переместились к 100500-байтным паролям.

DaylightIsBurning 14 окт 2019 в 11:40

Я Вам не верю, я с Вами наоборот, не соглашаюсь. А так, если говорите, что у меня в рассчётах ошибки, называйте их, иначе это похоже на уход от темы. По сути давайте. Википедии поверил потому, что интуитивно то, что там написано выглядит правдоподобно, и я не видел смысла самому перепроверять достоверность — это не такой принципиально важный для меня вопрос. Если даже это неверно — я никак не пострадаю. Если в вики ошибка — приведите конкретную правильную оценку, а не пустое «у Вас неправильно, правильно в другом месте».

от 8-символьного пароля… мы как-то незаметно переместились к 100500-байтным паролям

Не надо этих преувеличений, я рассматривал (для примера!) именно 8-10-байтные а не 8-символьные пароли. Для простоты я подразумевал 8-битные байты. Нет никаких проблем подставить в формулы 6-7-битные байты — получится то же самое, что 6-9-байтные пароли с 8ми-битными байтами.
Мои рассчёты — это оценка сверху, на самом деле радужные таблицы, видимо, ещё менее эффективны, т.к. их размер тоже ограничен из-за коллизий, что я не учитывал.

DaylightIsBurning 14 окт 2019 в 14:47

Кстати, сам автор (Philippe Oechslin) и приводит оценку в N^(2/3). Вы сами-то читали приведенную Вами работу, прежде чем обвинять википедию и меня в излишней доверчивости?

esaulenka 14 окт 2019 в 15:43

сам автор (Philippe Oechslin) и приводит оценку

На первой странице он рассказывает о работе Хелмана — там тоже таблица, но из-за особенностей функции редукции у Ошлина получился значительный выигрыш.

Вы сами-то читали

Я, было дело, по основам этой работы софину писал. Табличка для 6-байтового пароля была полсотни гигабайт, считалось за пару минут.
Кажется, спор вышел полезный. Без него Вы бы вряд-ли полезли дальше википедии…

DaylightIsBurning 14 окт 2019 в 15:55

Спор показал пока что лишь то, что Вы так и не привели корректную оценку, но википедию уже попытались дискредитировать. Оценка википедии подтвердилась в статье Philippe Oechslin.

Табличка для 6-байтового пароля была полсотни гигабайт

Вы же понимаете, что такое нелинейная сложность? Philippe Oechslin пишет, что им потребовалось 13.7 секунд что бы найти в таблице один пароль длинной менее 5 байт!
Кроме того для построения rainbow table нужно примерно в 10 раз больше расчетов чем для однократного прямого перебора. Т.е. окупится только если подбирать более чем 10 паролей.

Скажите, какой по вашему минимальный разумный размер raindow-table, если число перебираемых паролей равно N?

esaulenka 14 окт 2019 в 16:25

Перечитал википедию. Окей, беру свои слова обратно. Там сравниваются таблица Ошлина и таблица Хеллмана. И радужная таблица выходит на треть компактнее, всё как и описано у автора.
Проблема только в том, что N вместо размера таблицы (как оно описано в википедии) стало количеством возможных паролей (как оно посчитано у вас, с какими-то невообразимыми результатами).

DaylightIsBurning 14 окт 2019 в 16:26

Похоже, Вам все же нужно ещё раз перечитать ту статью, что Вы привели. Как по-вашему связаны размер таблицы и число возможных паролей? У Philippe Oechslin есть ответ ;).

радужная таблица выходит на треть компактнее

Там не так написано, не на треть. X^1 и X^(2/3) отличаются не на треть.

esaulenka 14 окт 2019 в 16:50

Штука в том, что ещё у Хеллмана таблица не содержала все возможные пароли. Конкретно та таблица Хеллмана, что рассматривает Ошлин в примере, в тысячи раз меньше, чем число возможных паролей.

отличаются не на треть

Тьфу, конечно же. Извините.

DaylightIsBurning 14 окт 2019 в 17:03

Что Вы имеете ввиду под «все возможные»? Что не все символы учитываются? Или что вероятность нахождения пароля не 100%? Если первое, это не меняет сути т.к. просто отнимает 1/8-2/8 от числа байт. Если второе, то это несущественно т.к. в rainbow table этот показатель без особых затруднений доходит до 99% и даже 99.9%.
Вопрос в том, как связан размер таблицы и число паролей, пусть даже угадываемых.

esaulenka 14 окт 2019 в 17:33

Я имею в виду, что в Хеллман придумал способ "составим цепочку хэш -> пароль -> хэш ->… -> хэш -> пароль, и сохраним первый хэш и последний пароль". Но он использовал только одну функцию редукции (это стрелка "хэш->пароль"). Ошлин через 23 года усовершенствовал этот способ, значительно сократив число коллизий: для каждого шага в цепочке была своя функция редукции. Ну и красивый термин попутно придумал.

Вопрос в том, как связан размер таблицы и число паролей, пусть даже угадываемых.

Размер таблицы (в парах хэш-пароль) = число возможных паролей / длину строки (повторюсь, строка 100000 с нынешними вычислителями — совсем не длинная) * коэффициент избыточности (тут начинается тервер, т.к. 100% гарантии нахождения пароля не получается. Возьмём цифру с потолка 5).

DaylightIsBurning 14 окт 2019 в 17:47

Остался последний логический шаг: какие практические ограничения есть на длину строки?

esaulenka 14 окт 2019 в 18:11

Что-то я иронию плохо улавливаю.
В 2003 году практичной длиной строки было 4666 (пруф см. выше). В 2019 году практичной длиной строки можно считать 100000 (придётся верить мне на слово).

DaylightIsBurning 14 окт 2019 в 18:17

Зачем верить Вам на слово, если Ошлин всё посчитал, а вики повторила? Да и длина цепочки 100000 — это мало. При 100000 размер таблицы будет 2^password_bit_length/100000*password_bit_length*const, то есть не менее 2^(7byte*8bit/byte)/100000*7byte*2=10TB для 7-байтного пароля, для 8-байтного — 3 PB.

esaulenka 14 окт 2019 в 18:38

Зачем верить Вам на слово

… и следующей же строчкой — данные, которые я же и предоставил. Ну отлично просто.

Ладно. От идеи "схлопнуть N паролей в N^(2/3) записей" мы, кажется, уже окончательно отдалились, и то хорошо.

DaylightIsBurning 14 окт 2019 в 18:44

это какие? Я эти формулы в первых же рассчётах использовал. Число 100000 я просто подставил, что бы Вы увидели, откуда взялось N^(2/3), а 100000 — это Ваше число с потолка, которое не значит ничего и не имеет смысла.

От идеи «схлопнуть N паролей в N^(2/3) записей» мы, кажется, уже окончательно отдалились, и то хорошо.

Мы — это кто? Ошлин как-то от этой оценки в своей статье не спишит отказываться. Я пожалуй с ним соглашусь.
Снова спрошу, какая Ваша оценка? Как связаны размер таблицы, оптимальная длина цепочки и размер пароля? Формулу пожалуйста, откуда она берётся… Предлагаю начать с оптимальной длины цепочки.

1tuz 10 окт 2019 в 19:37

Именно для таких случаев люди придумали соленые хэши

esaulenka 11 окт 2019 в 14:32

Ещё чуть-чуть, и Вы изобретёте rainbow tables ;-)

trapwalker 10 окт 2019 в 14:44

сорок тысяч обезьян в ж...

+13

achekalin 11 окт 2019 в 00:32

– Значит, вот что… У меня тоже ключ несложный. Но вот какие-то слова тебе могут показаться незнакомыми… если что, так по буквам уточни. И вообще… ты на смысле не фиксируйся.
Чингиз явно настораживается.
– Ну… шутки у меня такие, дурацкие. Сленг, ненормативная лексика… ты парень-то большой…
– Быстрее! – В голосе Темного Дайвера появляется легкая угроза.
– Если что, так потом я тебя к психологу на прием свожу…
– Ты из каких слов ключ составил? – шипит Чингиз.
Падла вздыхает и почему-то понижает голос:
– Короче, слушай… буквы чередуются, первая строчная, вторая прописная, третья строчная и так далее… пробелов нет вообще. Набирай отстраненно…
И он произносит свой ключ.
Секунд десять в библиотеке висит гробовая тишина. Темный Дайвер стоит, застыв как изваяние, и краска заливает его лицо.

mephius 11 окт 2019 в 00:55

Кстати, а пароль Падлы угадали или нет? СЛ же конкурс устраивал по этому поводу, помнится.

Antares19 11 окт 2019 в 01:13

Подписался на комментарии ;)

NillR 11 окт 2019 в 11:32

Насколько я помню автор признавался, что его не существует вообще. Есть только это странное описание

Night_Snake 21 окт 2019 в 11:25

Кажется, ему этот вопрос задают почти на каждой встрече с читателями. Последнее, что я слышал (пару лет назад) — до сих пор варианты присылают, он их показывает своему знакомому (прототипу Падлы), но т.к. в реальности этого ключа никогда не существовало, то пока лучшего не нашлось ;)

samodum 11 окт 2019 в 10:55

Сорок тысяч обезьян в жопу сунули банан

trolley813 10 окт 2019 в 15:13

Дополню (для тех, кто не найдет на шахматной доске вертикаль "q"): это ход, записанный в старой английской описательной нотации (descriptive notation — она была популярна до 80-х годов в англоязычных странах, но сейчас почти не используется), где вертикали обознаались не буквами по порядку, а названиями фигур, которые в начальном положении на них стоят. Соответственно, Q — значит queen, т.е. королева или же ферзь. То есть, в "нашей" современной нотации (т.н. алгебраической — algebraic notation) ход будет записываться как d2-d4 (либо d7-d5, если это ход черных — "у них" каждый игрок нумеровал горизонтали от себя).

+24

WinPooh73 10 окт 2019 в 16:10

Помню, в школьные годы имел дело с шахматной программой (консольной, естественно) для мини-ЭВМ семейства PDP-11. Там ходы полагалось вводить именно в такой вот описательной нотации. Пришлось освоить ;)

trolley813 10 окт 2019 в 21:47

Вообще, если приноровиться, то она особо и не сложнее алгебраической.

razor28 10 окт 2019 в 20:27

А p получается обозначение пешки «Pawn»?!

trolley813 10 окт 2019 в 21:49

Да, именно так.
P – пешка (pawn)
N или Kt – конь (knight, букв. рыцарь)
B – слон (bishop, букв. епископ)
R – ладья (rook)
Q – ферзь (queen, королева)
K – король (king)

a-tk 11 окт 2019 в 11:11

А как быть с парными фигурами? Слон, Ладья, Конь? Как они именовались? Чёрный-белый, левый-правый? Ферзевой-королевский? Или ещё как-то?

math_coder 11 окт 2019 в 11:43

Ферзевой-королевский. KB — вертикаль королевского слона, QB — вертикаль ферзёвого слона и т. п.

a-tk 11 окт 2019 в 12:07

Благодарю

trolley813 11 окт 2019 в 12:21

Но если было и так понятно, то и не писали. Например, вместо Kt-QB3 (ход белым конем на c3 или черным на c6) пишут Kt-B3, если на KB3 (f3 или f6) конем пойти нельзя. Или еще пример: достаточно написать PxP, если пешку пешкой можно съесть только одним способом, если же нет, то указывали вертикаль одной из пешек по типу BPxP (слоновая пешка ест пешку) или PxKKtP (пешка ест коневую пешку на королевском фланге (т.е. пешку "g")).

Lopar 10 окт 2019 в 15:19

Вот и поди пойми все вопросы о сложностях паролей. Восемь символов ради фана брутилось кучей людей с 2014 года, а в результате оказалось, что это не случайный набор символов, а осознанное, имеющее смысл значение, каких все рекомендуют избегать по причине упрощённого их взлома.

+20

technomancer 10 окт 2019 в 15:41

Для человека, далекого от шахмат — вполне себе случайный.

Envek 10 окт 2019 в 16:59

Ну это же классика: https://xkcd.com/936/ (и на русском: https://xkcd.ru/936/)

WinPooh73 10 окт 2019 в 16:05

Хороший способ придумывать запоминающиеся пароли, если вы шахматист.
Несколько первых ходов какого-нибудь дебютного варианта:

e4e5Nf3Nc6Bb5
d4d5c4e6Nf3
f4e6g4?Qh4#!

Хотя, строго говоря, все эти пароли можно рассматривать как словарные.

НЛО прилетело и опубликовало эту надпись здесь

trapwalker 11 окт 2019 в 11:53

Вот кто-то сейчас после этого поста чертыхнулся и добавил-таки в базу паролей все шахматные дебюты (чтоб не забыть как в прошлый раз). И с этого момента плохой идее будет любой шахматный дебют разумной длины использовать.

WinPooh73 11 окт 2019 в 14:30

Подам этому кому-то ещё одну идею: используя буквенные обозначения нот, добавить в базу все существующие музыкальные мелодии. Вперёд и с песней :)

trapwalker 11 окт 2019 в 18:20

Ещё есть аккорды же.
Можно стихи длинными аббревиатурами записывать.
Можно химические формулы юзать.
А есть еще топонимы всякие интересные

zzzzzzzzzzzz 11 окт 2019 в 14:23

Вы их опубликовали — и потому их уже точно можно рассматривать как словарные.

aol-nnov 10 окт 2019 в 17:03

> q2-q4

Тебе снится рыбалка у коралловых рифов,
Неизвестный герой древнегреческих мифов.
Молекулярная физика, энергия атома,
Обнаженная женщина, киллер с лопатой.

Новогодняя елка, орбитальная станция,
Мыльница с музыкой, радио с танцами,

смайл, в общем

massmedium 10 окт 2019 в 19:56

R-Kt4xВ

webplanet 10 окт 2019 в 20:41

Лея женщина, а так перевод интересный

vassabi 10 окт 2019 в 22:54

да, это английский, я недавно перевод оттуда на испанский с такой же ошибкой исправлял…

mephius 11 окт 2019 в 00:31

Кен Томпсон в том же списке рассылки еще и оставил свои поздравления ;)

latimeria 11 окт 2019 в 07:25

Доправьте текст, там автор местами все ещё мужчина: "… и я поделился своими результатами и разочарованием, что не смог взломать пароль Кена". Нелегко, нелегко даётся нашей индустрии мысль о том, что женщины тоже существуют :)

scruff 11 окт 2019 в 13:04

Потребовалось более четырёх дней на AMD Radeon Vega64 в hashcat

Стало на этой видюхе можно любой 8-ми-знак взломать, даже от контроллера домена, не самого последнего уровня, скажем 2016?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Unix-пароль Кена Томпсона

Комментарии 70

Публикации

Истории