IDY Jul 16 2011 at 01:00

Умножение длинных чисел методом Карацубы

7 min

93K

Algorithms*

From sandbox

+92

Comments 90

BiSeTrojanov Jul 16 2011 at 01:10

Вот это да, буквально вчера переписывал функцию перемножения в своём модуле, а сегодня статья. Надо было мне подождать день.

CKOPOBAPKuH Jul 16 2011 at 04:19

нет, не надо было. если вы хотели разобраться, то написать всё самостоятельно — это самый хороший способ. если вы хотели работающее и хорошее production решение, то написать его довольно сложно, велосипед лучше не переизобретать и смотреть в гугл.

но сама статья интересная, автору спасибо.

UMAX Jul 16 2011 at 01:12

Ну вот что вы делаете, математики-волшебники? Мой гуманитарный мозг просто сгорел.

IDY Jul 16 2011 at 01:33

Кому не охота вникать в мат. часть, могут ориентироваться по примеру. Там достаточно информации для понимания «Как такое сделать».

MakeInstall Jul 16 2011 at 02:13

Извиняюсь, я далек от С++ но во мне затаился вопрос)) чем отличается ваше решение от банального умножения *?

SilentBob Jul 16 2011 at 02:19

«Умножение длинных чисел методом Карацубы» — 100-200 разрядов на число. Большинство языков не имеют встроенных типов для их представления.

muromec Jul 16 2011 at 08:13

>Большинство языков

это вы имеете ввиду shell, c, c++ и дельфи? и то, по поводу второго сейчас прибегут знатоки какого-нибудь boost или stl и расскажут нам правду.

-4

VBart Jul 16 2011 at 18:34

Причем здесь «shell, c, c++ и дельфи» и «boost или stl» или вы думаете, что числа там умножаются с помощью какой-то магии? Блог называется «Алгоритмы».

muromec Jul 16 2011 at 19:28

я думаю, что вы не удосужились прочитать на что я отвечал: там написано, что в большнстве языков нет встроенных типов для big integers. мне кажется, что такое мнение ошибочно и я знаю, что в нескольких языках такие типы есть.

кроме того, наличие встроенного типа для болших чисел, позволяет мне сделать предположение о том, что операция умножения в таких языках происхдит именно по такому алгоритму, особенно если его знает каждый студент-байтикоперекладыватель

IDY Jul 16 2011 at 20:20

Но ведь во встроенного действительно нет: basic и его вариации, Delphi, PHP (есть не встроенная хотя поставляется с оным), с, c++, javascript. Приведите, пожалуйста, ради расширения кругозора распространенный языке где есть встроенный.

Более верно будет предположить, что адекватно было бы применять не этот алгоритм, а с помощью БПФ.

UFO just landed and posted this here

metar Jul 17 2011 at 13:48

В исходники не заглядывал, но субъективно тормозная какая-то у них реализация длинных чисел.

mrxak Jul 17 2011 at 05:10

В Python встроенный.

metar Jul 17 2011 at 13:49

Насколько я помню, там прикручена сишная библиотека GMP. И это хорошо. :-)

mrxak Jul 17 2011 at 17:21

Вроде бы нет. GMP можно поставить отдельно.

VBart Jul 16 2011 at 21:24

Зато я удосужился прочитать на что отвечал собеседник, которому отвечали вы.

Изначальный посыл был:

Извиняюсь, я далек от С++ но во мне затаился вопрос)) чем отличается ваше решение от банального умножения *?

Т. е. человек не видит разницы, скажем, между простым mul и представленным алгоритмом.

Еще раз, даже если библиотеки и компилятор/интерпретатор вашего языка скрывают от вас всю сущность происходящего, это отнюдь не означает, что умножения 4 байт на 4 байта производится также, как умножение 40 байт на 40 байт.

Блог называется алгоритмы, приведенный код иллюстрирует пример реализации алгоритма. С тем же успехом, он бы мог быть написан на языке, который умеет умножать тысячи разрядов из коробки. Тут алгоритм показан, а не туториал по C++.

Alroniks Jul 16 2011 at 02:17

Плюсанул. Но… ребят, у нас этот метод рассматривался на уровне одной лабораторной работы…

IDY Jul 16 2011 at 02:21

Вам повезло с лабораторными и, похоже, что с обучением вообще.

+14

gribozavr Jul 16 2011 at 02:23

А вам, похоже, не повезло с умением гуглить: вводим karatsuba multiplication c++ в Google и получаем просто килотонны кода.

IDY Jul 16 2011 at 02:48

1. С умением гуглить у меня все нормально — как видите алгоритм был разобран.
2. Мне нужен был не код, а алгоритм. А прочитать готовы текст куда проще, чем разбирать исходник.
3. Под «беглый поиск в google ничего путнего не дал» имелось ввиду: «Русскоязычных статей с простым и детальным изложение найти не удалось (Википедию не считаю т.к. лично для меня там материал сложный). Поэтому пришлось собирать по-частям информацию из русскоязычных и англоязычных источников.»

PS не подумайте, что огрызаюсь — просто мне показалось Вы не совсем уловили суть.

gribozavr Jul 16 2011 at 03:03

В русскоязычной Википедии под заголовком «второй вариант» написана та же формула, что и у вас.

У вас, кстати, ошибка в формулах: скобка должна закрываться перед BASE^m.

eRaider Jul 16 2011 at 13:19

+1, один из вопросов на экзамене — перемножить два числа Карацубой. Достаточно несложный алгоритм. Как и деления, впрочем.

Legolas Jul 16 2011 at 21:19

Поддерживаю, это проходят на втором курсе в рамках дисциплины «Дискретная математика» или «Теоретико-численные методы»

klakhman Jul 17 2011 at 15:52

Единственная проблема, что к дискретной математике и к численным методам этот метод не имеет никакого отношения.

Tellur Jul 17 2011 at 22:44

А мы на первом курсе проходили, на алгоритмах.

IDY Jul 16 2011 at 03:29

Формула написана и в той статье на Хабре. Вы похоже не учли мой прошлый комментарий. Статья писалась «поделиться с общественностью в доступной форме» и никак не претендует на краткость и тп.

Извиняюсь. Ошибки исправлены. Спасибо.

-1

IDY Jul 16 2011 at 03:36

Это должно быть ответом на комментарий выше.

BlooDHounD Jul 16 2011 at 04:10

> время выполнения которых на порядок меньше

ну это не совсем верно. точнее совсем не верно. один порядок — это 10 раз. а что бы достигнуть ускорения в 10 раз число должно быть оооочень длинным.

IDY Jul 16 2011 at 04:38

Даже если в обоих числах по 100 знаков, то наивное умножение потребует 100*100 операций умножения, а сложение — 100 сложения. Это не учитывая того, что операция умножения сама по себе дольше выполняется процессором.

BlooDHounD Jul 16 2011 at 13:12

извините, я ещё разок вас процитирую:

> Алгоритм Карацубы — метод быстрого умножения со сложностью вычисления nlog23. В то время, как наивный алгоритм, умножение в столбик, требует n2 операций.

> при длине чисел короче нескольких десятков знаков (точнее определяется экспериментально), быстрее работает обычное умножение.

я придираюсь к вполне конкретному слову «на порядок». я понимаю, что оно может работать и быстрее чем в 10 раз, но увы точность такого измерения надо доказать. я же просто советую использовать слово «гораздо быстрее».

BearUA Jul 16 2011 at 14:36

Даже с учетом того, что автор допустил ошибку и скорость алгоритма явно не модет быть n*log(2,3)( так как это линейная зависимость от n), прежде чем советовать что-то другим, попробуйте сами освоиться с элементарной математикой.
n*log(2,3) будет в 10 раз меньше чем n^2 уже при n=15 или 16.
но даже если взять правильную формулу, то
n^log(2,3) будет в 10 раз меньше n^2 уже при n = 100.

BlooDHounD Jul 16 2011 at 21:33

мне конечно считать лень, и скорее всего вы правы в отношении цифр, вот только формула оценивает сложность, а не прирост скорости. производительность зависит не только от сложности алгоритма.

IDY Jul 16 2011 at 15:50

Наверное, в этом месте плохо построено предложение. Там где «на порядок», идет речь про сравнение операции сложения с операций умножения.
А насчет именно «на порядок» не спорую, цель была подчеркнуть отношение между ними как n^1 / n ^ 2. Просто в голове не нашлось правильного описания для данного отношения.

BlooDHounD Jul 16 2011 at 21:34

да я вас. просто придрался. каюсь. статья хорошая. мне бы её 7 месяцев назад =)

GrossHo Jul 16 2011 at 04:41

Кстати да, чего то непонятно, каким образом преобразовав 2 умножения и 1 сложение к 3 умножениям и 4 сложениям выигрывается время? Наверно нужно описать ограничение для данного утверждения?

IDY Jul 16 2011 at 04:45

А где Вы взяли изначальное количество операций умножения равное двум? Попробуйте два двух- трех-значных числа умножить в столбик у потом посчитать количество операция умножения относительно кол-ва цифр

-1

alexkolzov Jul 16 2011 at 06:14

А чем обусловлена необходимость хранить длинное число в виде массива десятичных цифр? Почему не использовать родную компьютеру двоичную систему?

IDY Jul 16 2011 at 06:55

В статье наоборот написано, что реально нужно использовать не десятичную систему. Например, если процессор/среда разработки предоставляет возможность умножения двух 32-х чисел и сложения 64-х битных, то разумно будет выбрать за основание системы счисления значение около 2^30. «Потери» памяти вприоритет у скорости решения, а не в занимаемой памяти
А насчет двоичной не совсем понятно, что Вы имеете ввиду. Выделить участок памяти и оперировать непосредственно битами? — медленно и к тому же экономия памяти в этих задачах неприоритетна — или хранить в массиве двоичные цифры? — тоже медленно и слишком расточительно (поэтому еще медленнее).

-2

IDY Jul 16 2011 at 07:19

Мда… Пора идти спать. В общем надеюсь смысли мысли приблизительно понятен )

-2

alexkolzov Jul 16 2011 at 17:17

С каких пор оперировать битами стало медленнее, чем байтами? А Вы именно это и делаете. Вы храните массив цифр в порядке разрядов десятичного числа. Это дает лишний расход памяти в 4 раза. И в скорости Вы при такой организации данных ничего не выигрываете, а совсем наоборот.
> Например, если процессор/среда разработки предоставляет возможность умножения двух 32-х чисел и сложения 64-х битных, то разумно будет выбрать за основание системы счисления значение около 2^30
Вы путаете основание системы счисления с разрядностью двоичного числа

IDY Jul 16 2011 at 19:48

«С каких пор оперировать битами стало медленнее, чем байтами?»

— минимально адресуемая единица памяти в x86 — байт. Соотв. для адресации битов нужно использовать дополнительные манипуляции — это раз. Два — тут действует принцип брать максимальное за раз. Например нужно умножить два 64х разрядных числа. Процессор ето может сделать это одной командой, если начать умножать побайтно или побитно, то понадобится соотв. 8 команд умножение или 64. И это только кол-во операций умножения, а еще масса других для «соединения» результата воедино. Если не верите — проведите небольшой эксперимент — напишите парочку маленьких программ на Ассемблере.

«Это дает лишний расход памяти в 4 раза.»

— откуда Вы взяли число 4? В этом случае гораздо больше. 4 будет если взять за основание системы счисления 2^16, а размер базового типа 2^64. И то это расход только на само хранение. Еще куча места выделяется во время подсчета. Кстати, такую организацию памяти придумал не я, если для Вас ето будет аргументом. Так принято хранить длинные числа.

«Вы храните массив цифр в порядке разрядов десятичного числа.»

«Вы путаете основание системы счисления с разрядностью двоичного числа»

— Да нет. Обратите внимание на

#define BASE 10 //система счисления

. Например, число 16400 можно представить в виде a[] = {0,0,4,6,1}, если основание системы 10. А если основание, допустим, 12000, то число примет вид a[] = {4400, 1}

-1

alexkolzov Jul 16 2011 at 20:15

> Например, если процессор/среда разработки предоставляет возможность умножения двух 32-х чисел и сложения 64-х битных, то разумно будет выбрать за основание системы счисления значение около 2^30
Поясните. Почему это разумно?
> «Это дает лишний расход памяти в 4 раза.»
Погорячился. В Вашей реализации в 8 раз (это учитывая только избыток на хранение одного разряда), поскольку Вы используете 32 бита для хранения числа, вмещающегося в 4. А если посчитать общее занимаемое место — избыточность данных растет экспоненциально
Насчет брать максимальное за раз — все верно. Только к Вашей организации вычислений жтот метод не имеет никакого отношения.

IDY Jul 16 2011 at 20:29

Поясните. Почему это разумно?

— Пояснения в статье в разделе «Реализация на C++»;

«Только к Вашей организации вычислений жтот метод не имеет никакого отношения.»

— почему же?

-1

alexkolzov Jul 16 2011 at 20:39

> Длинные числа удобно представлять в виде массивов…
> Для увеличения быстродействия желательно выбрать за основание системы счисления максимальное число в рамках базовых типов
А где обоснование? Почему удобно? С чего Вы взяли, что это увеличит быстродействие? Где это самое увеличение?

-1

IDY Jul 16 2011 at 20:48

Длинные числа удобно представлять в виде массивов.

Легкая и наглядная форма. Близка к действительному представлению числа в памяти. Автоматически резервирует место для операций умножения и сложения на возможность переполнения разряда.

Квадрат максимального числа в выбранной системе счисления должен помещаться в выбранный базовый тип. Это необходимо для хранения произведения одного разряда на другой в промежуточных вычислениях.
Выбранный базовый тип желательно брать знаковый. Это позволить избавиться от нескольких промежуточных нормализаций.
Лучше, чтобы в разряд помещалось сумма из нескольких квадратов максимального числа. Это позволит избавиться от нескольких промежуточных нормализаций.

Я с удовольствие узнаю другие методы и подходы. Подкинете?

alekseymenkov Jul 17 2011 at 05:09

Легкая и наглядная форма. Близка к действительному представлению числа в памяти. Автоматически резервирует место для операций умножения и сложения на возможность переполнения разряда.

BCD числа тоже наглядны и экономят 28 байт на цифру.

IDY Jul 17 2011 at 10:18

Сам по себе BCD здесь не подходит, т.к. десятичной системой ограничиваться нельзя. А принцип тут как раз тот же. Каждый разряд кодируется соотв. двоичным числом.

yeputons Jul 16 2011 at 10:19

Например, если у вас 100k десятичных знаков, то переводить их в двоичную систему вы их будете дольше, чем умножать. А потом еще результат обратно… Пример — питон, где самая долгая операция с длинными числами — вывод и ввод.
Но это в случае, если надо перемножить десятичные числа. А если просто нужна абстрактная длинная арифметика — выбор за вами. Но серьёзного выигрыша там, думаю, не будет.

-3

alexkolzov Jul 16 2011 at 17:21

Я не предлагаю ничего никуда переводить. В памяти компьютера числа уже хранятся в двоичной системе счисления. Подобное представление длинного числа в виде последовательности цифр в последовательности разрядов — одно из самых неоптимальных, на уровне представления строками

kogemrka Jul 16 2011 at 19:14

Это всё несущественные детали. Хоть в виде массива десятичных цифр храни, хоть в виде родных двоичных — сложность алгоритма останется той же и по расходу памяти и по времени работы.

Другое дело, что массив десятичных цифр удобнее для демонстрации (а цель статьи именно в объяснении алгоритма) и в некотором (пускай и небольшом) классе задач.

alexkolzov Jul 16 2011 at 19:21

Вы чудовищно заблуждаетесь. Ассимптотическая сложность, безусловно, остается прежней, но не в коем случае нельзя путать ее с вычислительной сложностью алгоритма. Мне попадались чудовищные реализации алгоритма быстрой сортировки, затратные по времени и по памяти, однако формально они были корректны и ассимптотическая сложность сохранялась. Но работали из рук вон плохо. То, что сложность алгоритма O(n) говорит, что рост количества вычислений есть линейная функция. Но к большим числам она может уйти очень быстро

-1

kogemrka Jul 16 2011 at 19:27

Именно асимптотическую сложность я и имею в виду)

Если бы автор использовал в статье и в примере двоичную систему счисления статья бы потеряла в наглядности.

alexkolzov Jul 16 2011 at 19:31

Я к тому, что представленная автором реализация, конечно, показательна, но совершенно не практична. Профессор Карацуба, насколько мне известно, разрабатывал свой метод именно в расчете на двоичную арифметику

-1

IDY Jul 16 2011 at 20:49

А что Вы считаете нужно изменить, чтобы реализация была практичной ( смену алгоритма на другой не рассматриваем :) )?

alexkolzov Jul 16 2011 at 20:53

Алгоритм менять не будем, он чертовски хорош :) Я считаю, что нужно использовать не суррогатное представление числа последовательностью цифр на местах разрядов, а в виде непрерывного участка памяти требуемой длины. По результатам диалога с автором думаю заняться реализацией на досуге

IDY Jul 16 2011 at 21:09

А как Вы это представляете себе?

alexkolzov Jul 16 2011 at 21:20

Есть такой тип замечательный. void*

IDY Jul 16 2011 at 21:32

Я понимаю. Но в чем именно суть? Выделить кусок памяти и «бегать» по нему указателем? Это тот же массив.

alexkolzov Jul 16 2011 at 21:42

Отнюдь. Массив — это последовательность независимых равноразмерных элементов. Я предлагаю хранить не массив разрядов, а непрерывное n-байтное число в двоичной системе. Можно организовать арифметику чисел размерности n.
Предлагаемый автором способ, собственно, сходится к такому хранению при основании системы счисления 2^n, где n — количество бит для хранения одной цифры разряда (то есть в реализации автора 32)

-2

IDY Jul 16 2011 at 21:50

В том то и дело, что в реальности константа BASE меняется как-раз на число (2^n)

VBart Jul 16 2011 at 22:08

«Массив — это последовательность независимых равноразмерных элементов.»
What? Массив в C/С++ это последовательность элементов одинакового типа (а следовательно и размера).

VBart Jul 16 2011 at 22:34

Как вы собираетесь адресовывать void*?

IDY Jul 17 2011 at 00:06

По-моему в адресации void * проблем нет — правда много возни с адресной арифметикой и приведениями типов. Просто в конце-концов получится тоже самое.

VBart Jul 17 2011 at 00:15

Адресная арифметика просто не работает с типом void* за отсутствием информации о размере адресуемых элементов.

Я не понимаю, что автор комментария хотел этим сказать. Он собирается оперировать байтами или чем?

IDY Jul 17 2011 at 00:44

Адресная арифметика просто не работает с типом void*

адресной арифметикой и приведениями типов.

VBart Jul 17 2011 at 00:55

Чем это будет отличаться от того, что написано у вас? Ничем. Вы и сами так написали, что получится то же самое. Вот поэтому я у автора комментария и хочу узнать, может он что-то другое имел ввиду.

alexkolzov Jul 17 2011 at 11:54

Смещение по указателю + приведение, Вам правильно сказали. Как я отмечал раньше, представление автора неизбыточно только для системы счисления с основанием, равным соответствующей степени двойки. В этом случае разницы нет. Если основание меньше — получается избыточность, растущая экспоненциально с количеством разрядов числа. Фактически эта избыточность не нужна, поскольку числа с верхней границей 2^n можно хранить в линейной памяти и обращаться к нему по указателю. Реализовать арифметические операции в этом случае проблем не составляет. Единственная проблема — это перевод числа в десятичную систему для вывода. Для представления автора, когда основание 10, это тривиально, а для всех других оснований представляет сложности. Поэтому я не вижу особого смысла переходить к таким системам счисления (2^32), никакого выигрыша это не дает

VBart Jul 17 2011 at 13:44

«Смещение по указателю + приведение» = массив как у автора. Плюс, похоже вы еще собираетесь делать битовые операции, что будет эквивалентно приведению к нужному основанию.

Иными словами, вы просто предлагаете способ приема числа, при котором, оно всегда будет приводится к виду, как у автора при использовании правильного основания. Но это лишь вопрос преобразования входных данных. С таким же успехом, автор мог бы строго закрепить нужное основание, а принимать числа в любом формате, хоть в ASCII строке, просто написав нужную функцию.

alexkolzov Jul 16 2011 at 20:56

Меня больше всего напрягает, что такое представление числа неизбыточно только для основания системы счисления 2^32, а таких систем я не встречал даже в теории. Для практически значимых систем счисления избыточность просто колоссальная

-1

IDY Jul 16 2011 at 21:11

А какая разница какая система счисления? Арифметика везде одинаковая. Поэтому считать нужно в которой удобно. А приведение к заданной (нужно только в случае вывода результата пользователю) делается за линию.

alexkolzov Jul 16 2011 at 21:19

Разница в скорости вычислений и объеме памяти

IDY Jul 16 2011 at 21:36

системы счисления 2^32, а таких систем я не встречал даже в теории.

А какая разница какая система счисления?

Разница в скорости вычислений и объеме памяти

Что-то винегрет получается. Чем же тогда этот способ плох, если он отлично подходит для этой системы?

alexkolzov Jul 16 2011 at 21:43

Плох тем, что только в предельном случае для системы с основанием 2^n (см. выше) является неизбыточным

IDY Jul 16 2011 at 21:46

Я же и спрашиваю. Чем это плохо?

alexkolzov Jul 16 2011 at 21:47

Чем плоха избыточность? Тем что она не нужна

IDY Jul 16 2011 at 21:49

Зачем же использовать систему счисления для которой представление избыточно? Чем плоха система «основанием 2^n»

alexkolzov Jul 16 2011 at 21:52

Учитывая, что n не может быть меньше 8, т.е. минимальное основание 256… Покажите мне задачу с использованием такой системы счисления. Тут как раз спрашивали, зачем нужны лишние преобразования систем счисления. Не нужны

IDY Jul 17 2011 at 00:11

преобразование из системы в систему за линию + мало операций умножения будет быстрее чем просто решение с большим количеством операций умножения. Еще раз:«Для практической реализации алгоритмов не имеет значение в какой системе значения. Система важна только как результирующие данные для пользователя.

alexkolzov Jul 17 2011 at 11:56

> А приведение к заданной (нужно только в случае вывода результата пользователю) делается за линию
Каким образом для больших чисел?

IDY Jul 17 2011 at 17:46

Мм… Да, тут действительно у меня ошибка.

alexkolzov Jul 17 2011 at 17:48

Не ошибка. Я столкнулся с такой же проблемой. И тут единственное очевидное решение — как раз использование Вашего представления больших чисел с основанием десять. Других решений пока не вижу. Будем искать

IDY Jul 17 2011 at 18:41

Ну 10 это тоже не вариант. Подойдет любое основание, являющееся степенью 10.

NeoNs Jul 16 2011 at 08:42

Мельком глянув заголовок, вспомнил пограничника Карацупа :)

yeputons Jul 16 2011 at 10:17

На самом деле Карацуба работает не n*log₂3, а n^log₂3~n^1.5. См. вики.

IDY Jul 16 2011 at 10:33

Еще раз извиняюсь. Спасибо.

UFO just landed and posted this here

IDY Jul 16 2011 at 12:55

Да. При чем далеко за пределами.

Wolong Jul 16 2011 at 22:46

в статье автор пошел не снизу, а сверху, и алгоритм по изложению сразу превратился из простейшего, реализуемому обычным студентом за несколько часов, в монстра.
нам когда-то объясняли на примере двузначных чисел, а потом рекурсивно расширяли на числа любой длины, и все все схватывали на лету, и реализовывали без проблем. эту же статью куда сложнее читать

IDY Jul 17 2011 at 00:17

Спасибо. В следующий раз учту. У меня была надежда, что тем кому интересно мат. обоснование, прочтут первую часть и пример им не понадобится. А те кому это не нужно прочитают маленький кусочек текста в главе с примером, примут во внимание, что алгоритм рекурсивный и верхний уровни добавлены только для количества примеров.

Rulez Jul 17 2011 at 01:33

а как и для чего этот алгоритм применять?

Show the best of all time