a-lexus91 Dec 9 2013 at 12:21

Алгоритм проверки на простоту за O (log N)

2 min

184K

Sport programming*Algorithms*Mathematics*

Tutorial

From sandbox

+25

116

Comments 116

mayorovp Dec 9 2013 at 12:27

Разве длинная арифметика не будет работать быстрее двоичного умножения?

alexeykuzmin0 Dec 9 2013 at 13:39

Практика показывает, что нет. Разделить одно длинное число на другое — не так уж просто

Mrrl Dec 9 2013 at 13:49

А если делить с помощью вещественных чисел, а потом корректировать? Умножать длинные числа (в пределах int64*int64) не так уж сложно.

alexeykuzmin0 Dec 9 2013 at 13:58

Точно не помню, проверял давно. Но вроде тоже медленнее

a-lexus91 Dec 10 2013 at 21:21

Да, очень хорошая идея.

long long mul( long long a, long long b, long long m ) {
  long long q = (long long)((long double)a * (long double)b / (long double)m);
  long long r = a * b - q * m;
  return (r + 5 * m) % m;
}

Данная функция умеет перемножать long long по модулю за O(1). Более подробно на Codeforces.

Mrrl Dec 10 2013 at 21:29

Если long double у вас 80-битный, то это может сработать. Но Visual Studio долгое время интерпретировало его, как double. И тогда вы потеряете старшие 8-12 бит числа r, поскольку q будет найдено с точностью 52 бита. В общем, это сильно зависит от компилятора.
Да и 5*m вызывает подозрения. Они учитывают случай m>2^62?

datacompboy Dec 10 2013 at 21:53

(1*1%0x7FFFFFFFFFFFFFFFLL) = 9223372036854775804
так и должно быть?

#include <iostream>

using namespace std;

long long mul( long long a, long long b, long long m ) {
  long long q = (long long)((long double)a * (long double)b / (long double)m);
  long long r = a * b - q * m;
  return (r + 5 * m) % m;
}

int main()
{
   long long a = 1;
   long long b = 1;
   long long m = 0x7FFFFFFFFFFFFFFFLL;
    
   cout << mul(a, b, m);
   
   return 0;
}

Mrrl Dec 10 2013 at 22:42

На тех компиляторах, на которых sizeof(long double)>8, есть хорошие шансы на успех у такого кода:

long long rmul(long long a,long long b,long long m){
	int s=0;
	if(a>=m/2){ a=m-a; s=1; }
	if(b>=m/2){ b=m-b; s^=1; }

	long long q=(long long)((long double)a*(long double)b/(long double)m+0.5);
	long long c=a*b-q*m;
	if(c>=m || c<=(-1LL)<<62) c-=m;
	else if(c<0) c+=m;
	if(s && c!=0) c=m-c;
	return c;
}

К сожалению, VS к таким не относится. И про «старый x87» он уже не знает, а без него 80-битную арифметику, по-видимому, не получить.

Mrrl Dec 10 2013 at 23:16

Пытаюсь добиться 80-битных чисел с помощью ассемблерных вставок — всё равно получается ерунда:

bool TestPrecision(long long a,long long b){
// test (a+b-b==a)
	long long c=0;
	__asm {
		        fild a
			fild b
			fadd
			fild b
			fsub
			fistp c
	}
	if(c!=a) printf("Error: a=%I64x, b=%I64x, c=%I64x\n",a,b,c);
}

Работает так, словно регистры х87 реализованы, как 8-байтовые double: уже на a=1, b=1LL<<53 выдаётся ошибка.

a-lexus91 Dec 9 2013 at 12:30

Длинную арифметику писать нужно, а двоичное умножение очень и очень простое. Но вообще да, можно и длинную арифметику организовать. Она, скорее всего, будет работать несколько быстрее.

mayorovp Dec 9 2013 at 12:37

И да, еще замечание: что вы будете делать с числами Карамайкла? На серьезных соревнованиях такие числа всегда включают в тестовые данные.

Mrrl Dec 9 2013 at 12:39

Вас интересует ответ, или то, знает ли его автор? ;)

+10

a-lexus91 Dec 9 2013 at 12:40

Если проанализировать числа Карамайкла, то можно заметить, что они состоят из нескольких простых множителей, например 3, 5, 7, 11… Если выбрать 100 случайных чисел, то, с большой вероятностью, эти множители будут входить в некоторые из выбранных чисел.
Тест Ферма в данном случае пользы не даст, но НОД будет отличен от 1. Значит программа все равно выдаст, что число непростое.

Mrrl Dec 9 2013 at 12:56

У таких чисел, как 410041 и 252601 наименьший простой делитель будет 41. Вероятность того, что он встретится у какого-нибудь из 100 случайных чисел уже всего 92% — маловато для вероятностного теста. А у бОльших чисел наименьшие делители могут быть и ещё больше.

a-lexus91 Dec 9 2013 at 13:02

Количество итераций в тесте Ферма может быть и не 100, а например, 200. Но устранять эту проблему можно и другим способом:
Перед проверкой числа N тестом Ферма, можно перебрать все простые числа от 2 до min(N, 300), а их там будет очень мало, и найти НОД каждого из этих чисел и N. На время работы это сильно не скажется, так как массив простых чисел от 2 до 300 можно посчитать в самом начале.

mayorovp Dec 9 2013 at 13:06

Откуда взялось число 300?

a-lexus91 Dec 9 2013 at 13:08

В олимпиадном программировании многие константы берутся интуицией

-6

mayorovp Dec 9 2013 at 13:29

В олимпиадном программировании числа, взятые интуицией, приводят к WA Test 35

+11

alexeykuzmin0 Dec 9 2013 at 13:59

И хорошо если не WA126, когда это последний тест :'(

mayorovp Dec 9 2013 at 14:03

Хорошо — это когда после успешного отлова ошибки, приводящей к WA126 не прилетает TL127!

UFO just landed and posted this here

TakeOver Dec 9 2013 at 15:53

WA — wrong answer
TL — time limit

TheShock Dec 9 2013 at 21:06

Т.Е. в олимпиадном программировании всего 128 попыток?

datacompboy Dec 9 2013 at 21:12

нет, просто речь идёт о том, что много тестов прошло, а на последних обломинго. очень обидно.

TakeOver Dec 9 2013 at 21:15

Нет) Зависит от самой олимпиады. А WA126 — значит, что программа дала неверный ответ на 126 тесте, а на 1-125 — верный.

datacompboy Dec 9 2013 at 21:12

а плохо — когда после отлова WA126 прилетает TL125/

mayorovp Dec 9 2013 at 21:13

Это за успешный отлов не считается!

Mrrl Dec 9 2013 at 21:17

После отлова возможной причины WA126 :)

Mrrl Dec 9 2013 at 13:17

Ну-ну.
1207252621 = 613 * 919 * 2143
54519328481 = 503 * 5021 * 21587
20618724001 = 701 * 2801 * 10501
8976678481 = 1009 * 2521 * 3529
432210655801 = 3011 * 5419 * 26489
949631589089 = 6917 * 10193 * 13469

Это только среди чисел до триллиона. Дальше наверняка будет ещё хуже.

И где вы планируете остановиться в проверке делимости?

mayorovp Dec 9 2013 at 13:28

Ну, статья была про числа до 2³², так что автор может остановиться, хе-хе, на 613…

Mrrl Dec 9 2013 at 13:31

Тогда зачем там long long? И двоичное умножение?

mayorovp Dec 9 2013 at 13:32

long long и двоичное умножение не дают асимптотики, указанной в заголовке статьи

a-lexus91 Dec 9 2013 at 13:28

Я думаю, что не все поняли, что данный алгоритм является вероятностным. Чисто математически любой вероятностный алгоритм не верен уже изначально. Тест Ферма может только доказать, что число не является простым.
На реальных олимпиадах этот код работает, я сам его писал.

mayorovp Dec 9 2013 at 13:32

Значит, это была олимпиада не того уровня. Если Mrrl нашел число 1207252621 за каких-то 15 минут — значит, Станкевич его давно наизусть знает, и вставляет в каждый 35й тест :)

a-lexus91 Dec 9 2013 at 13:35

Можете простым перебором убедиться, что данный алгоритм безошибочно работает на всех тестах в пределах типа Int. Для больших чисел есть вероятность ошибки, однако, на олимпиаде может встретиться задача именно на такой алгоритм. Знать его все же нужно.

-2

mayorovp Dec 9 2013 at 13:58

Какой алгоритм? Первый, который на 410041 падал? Или тот, который перебирает делители до 300 и падает на 1207252621 (это число в int входит, между прочим)? Но командных соревнованиях вы бы сейчас 40 штрафных минут уже получили. Еще по одной задачке такой же фейл — и прощай надежда на третье место.

Mrrl Dec 9 2013 at 13:42

Мне случалось придумывать тесты, на которых люди и по 60 минусов получали :)

Mrrl Dec 9 2013 at 13:38

Вероятностный алгоритм хорош, если при любых внешних данных (в данном случае, x) и случайном выборе переменных в алгоритме (a) вероятность ошибки будет не больше чего-то. В данном случае, кармайлово число x повышает вероятность ошибки на отдельно взятом тесте вплоть до 1-3*(x^(-1/3)), что выглядит недопустимо близко к 1 (да ещё и растёт с ростом x).

Scratch Dec 9 2013 at 13:03

Я вас удивлю, но любое непростое число состоит из простых множителей

SeptiM Dec 9 2013 at 14:55

-2

SeptiM Dec 9 2013 at 17:19

Можно минусы обосновать?

mayorovp Dec 9 2013 at 18:44

Придираться к придирке — верный путь скатиться во флейм и взаимотроллинг. Отсюда и минус — чтобы к этому «1?» не придрался кто-то еще.

mayorovp Dec 9 2013 at 13:05

(удалено)

gentee Dec 9 2013 at 13:17

for(long long i=2;i<=sqrt(n);i++)

Даже в первом варианте лучше так
for(long long i=3;i<=sqrt(n); i+=2 )
а проверку на 2 выполнить в начале

a-lexus91 Dec 9 2013 at 13:32

В таком случае уже не имеет смысла использовать тест Ферма, если проверять до корня. Иногда на олимпиадах нужна более быстрая проверка, пусть и вероятностная.

UFO just landed and posted this here

datacompboy Dec 9 2013 at 13:45

да почему, 3-4 раза засабмитил, прошло — ура.

mayorovp Dec 9 2013 at 14:00

А потом жюри делает, ха-ха, rejudge задачи из-за технических проблем. Или случайно смотрит на решение — и делает rejudge ему индивидуально.

Во всех регламентах соревнований всегда есть фраза — если программа показывает разные результаты от запуска к запуску — жюри имеет право выбрать худший.

alexeykuzmin0 Dec 9 2013 at 14:03

Если ответ неверен в одном случае на 2^1000 — можно и рискнуть, Вы не находите? =)

mayorovp Dec 9 2013 at 14:06

Можно, так и нахожу. Разумеется, если нельзя подобрать тест, который валит решение гарантированно. А вот если вероятность составляет "3-4 раза засабмитил, прошло — ура" — то нет никакой гарантии, что задача случайно не пропадет из числа решенных уже после окончания тура…

alexeykuzmin0 Dec 9 2013 at 14:06

Все, понял Вас. Спасибо

Mrrl Dec 9 2013 at 20:56

А разве нет принципа «плюсы не перепроверяются»?

mayorovp Dec 9 2013 at 21:01

Нет. Есть принцип — «все посылки после плюса не учитываются», но он затрагивает другие ситуации. А еще есть принцип «жюри всегда право». Не говоря уже о негласном «лучшие тесты всегда пишутся во время соревнований» :)

UPD: забавно, в системе Челябинской системе Polypody была стандартная операция «перепроверить все плюсы», а вот «перепроверить только минусы» — не было

Joshua Dec 10 2013 at 14:11

На четвертьфиналах в НГТУ регулярно бывало, что обнаруживали неверный тест. Например, 5.
Тогда перепроверяли все отправленные задачи, в том числе пройденные.

datacompboy Dec 10 2013 at 15:20

А помнишь, когда greedy алгоритм проходил потому что теста на него не было? Было обидно :(

Joshua Dec 10 2013 at 15:28

Ага, помню, я отказался решать какую то задачу, т.к. отсек жадный алгоритм, как непроходящий краевые условия, а аналитический алгоритм был слишком сложен за отведенное время. А какой то парень из НГУ от балды заслал и он прошел, т.к. оказалось, что не было достаточно серьезного теста.

datacompboy Dec 10 2013 at 21:47

а я тогда помню хотел жадный всё равно сделать. но Лёха нас обоих удебил приведя контрпример сразу же :(

Mrrl Dec 9 2013 at 13:46

Простейшая модификация функции ferma уменьшит вероятность ошибки примерно до 10^(-60) при любом x. Это уже вполне приемлемо, хотя алгоритм и остаётся вероятностным.
Кроме того, разве на олимпиадах не используют quicksort или nthelement? Они тоже вероятностные :)

mayorovp Dec 9 2013 at 14:01

Быстрая сортировка, хоть и вероятностная, но, в недетерминированом исполнении, не обладает гарантированно валящими ее исходными данными.

Mrrl Dec 9 2013 at 14:04

Worst-case expected-time? :D

alexeykuzmin0 Dec 9 2013 at 14:06

Мне кажется, mayorovp имеет в виду, что здесь не «работающий вероятностный алгоритм», а «алгоритм, работающий почти на всех тестах». Какой тест мы бы ни придумали, мат ожидание времени работы QS будет хорошим, здесь же не так

dimitrimus Dec 9 2013 at 14:28

это смотря как написать qsort =) можно написать так, что будет такой тест

alexeykuzmin0 Dec 9 2013 at 14:29

-2

UFO just landed and posted this here

Mrrl Dec 9 2013 at 21:05

Превратить недерминированное время в вероятностный ответ довольно просто, только нужна подходящая задача.
Допустим, в задаче ищется существование решения или наилучшее решение. Перебором. qsort (или другой метод с похожими свойствами) вызывается на каждом шаге перебора. Если он всегда успевает за n*log(n), то перебор успеет закончиться, если не всегда — можно вылететь по TL. И следим по таймеру, не кончилось ли время. Если кончается — выдаём ответ, не дождавшись конца перебора.
Как-то так. Не знаю, насколько сейчас практикуются такие приёмы, но при подготовке тура их приходится учитывать.

mayorovp Dec 9 2013 at 21:16

Такие приемы практикуются в «конкурсных» задачах, где нет правильных ответов, и за каждый тест начисляются баллы согласно близости ответа тестируемой программы к лучшему ответу.

UFO just landed and posted this here

datacompboy Dec 9 2013 at 13:44

тогда уж
for(long long i=3,j=2;i<=sqrt(n); i+=j,j=6-j)

FeferIvan Dec 9 2013 at 14:18

Можно еще i <= sqrt(n) заменить на i*i <= n.
Умножить два целых быстрее, чем взять корень в вещественных числах.

alexeykuzmin0 Dec 9 2013 at 14:19

И точнее

datacompboy Dec 9 2013 at 14:19

ну я вообще предполагал что любой дурак сделает
long long sqrtn = sqrt(n)
взять один раз корень быстрее, чем N раз умножать

Mrrl Dec 9 2013 at 21:16

Сейчас многие считают, что этим дураком должен быть компилятор.

datacompboy Dec 10 2013 at 00:10

ну если не знают что такое «volatile»…

Mrrl Dec 10 2013 at 00:20

А, кстати, есть ли в современном C/C++ обозначение для «чистой» функции, результат которой зависит только от аргументов?

datacompboy Dec 10 2013 at 00:25

не помню, "#pragma intrinsic" не оно?

mayorovp Dec 10 2013 at 00:28

Нет, #pragma intrinsic — это обозначение функции, которая реализована компилятором специальным образом.

Mrrl Dec 10 2013 at 00:35

В этом смысле, вызов sqrt может быть соптимизирован: раз компилятор знает, как это устроено, то он может догадаться, что его значение в данном случае не изменится.

datacompboy Dec 10 2013 at 00:37

Стоп, а модификатор const у функции разве не оно?
const
Many functions do not examine any values except their arguments, and have no effects except the return value. Basically this is just slightly more strict class than the pure attribute below, since function is not allowed to read global memory.

есть еще pure:
pure
Many functions have no effects except the return value and their return value depends only on the parameters and/or global variables. Such a function can be subject to common subexpression elimination and loop optimization just as an arithmetic operator would be. These functions should be declared with the attribute pure.

Mrrl Dec 10 2013 at 00:43

Да, const похоже. Осталось проверить, есть ли оно у математических функций в стандартных math.h.
А смысла pure я не понял. Если оно может зависеть от глобальных переменных — как его можно вынести из цикла? Вдруг другой поток (или неизвестная функция, вызванная в том же цикле) их поменяет?

datacompboy Dec 10 2013 at 11:08

Я так понимаю, разница pure и const в том, что pure никуда не пишет кроме результата, а const еще и не читает ничего

mayorovp Dec 10 2013 at 11:17

Но если в цикле нет ни одной неизвестной не-pure функции — то выносить вычисление из цикла все-таки можно. Что же до других потоков — то их действия не обязаны быть видимы сразу же, если только глобальная переменная не volatile. А такие переменные читать из pure — функции либо нельзя, либо UB.

Mrrl Dec 10 2013 at 11:44

VS2013 выносит из цикла не только sqrt, но и sin. Допустим, sqrt описан, как intrinsic. Но у sin никаких пометок нет! Откуда он знает, что это const функция?

mayorovp Dec 10 2013 at 13:00

Во-первых, sqrt тоже не как intrinsic описан. А во-вторых, не пофиг ли компилятору, особенно от M$, забыли или нет указать, что хорошо известная ему функция должна быть реализована им же?..

До кучи — если выключить стандартную библиотеку, то компилятор жалуется на отсутствие не то memset, не то memcpy, но при этом запрещает реализовывать в своем коде.

Mrrl Dec 10 2013 at 21:23

Во-первых, sqrt тоже не как intrinsic описан.

Он описан так:

_CRT_JIT_INTRINSIC  double  __cdecl sqrt(_In_ double _X);

Возможно, правда, что «JIT_INTRINSIC» означает, что это действует только в managed коде — я не разбирался с её расшифровкой.

datacompboy Dec 10 2013 at 21:49

www.cdsan.com/Src_VsInc.php?fid=122&ln=35

/* jit64 instrinsic stuff */
#ifndef _CRT_JIT_INTRINSIC
#if defined(_M_CEE) && (defined(_M_AMD64) || defined(_M_IA64))
/* This is only needed when managed code is calling the native APIs, targeting the 64-bit runtime */
#define _CRT_JIT_INTRINSIC __declspec(jitintrinsic)
#else
#define _CRT_JIT_INTRINSIC 
#endif
#endif
</code>

alexeykuzmin0 Dec 9 2013 at 13:47

Я всегда писал тест Рабина-Миллера, он вроде работает на числах Кармайкла
ru.wikipedia.org/wiki/%D2%E5%F1%F2_%CC%E8%EB%EB%E5%F0%E0_%97_%D0%E0%E1%E8%ED%E0

alexeykuzmin0 Dec 9 2013 at 13:47

По крайней мере, Станкевич, Лопатин и иже с ними никогда не были против

Mrrl Dec 9 2013 at 13:51

Он на всех числах работает. Менее 25% ошибки на 1 тест для любого x.

SeptiM Dec 9 2013 at 14:53

Я, конечно, понимаю, что здесь собрался кружок по спортивному программированию, но, блин, укажите нормальную асимптотику в заголовке.
AKS проверяет числа за O(L^{6 + eps}), Рабин-Миллера и Ферма можно написать за O(k * L^2 \log L), где L — длина числа.

Вы же не будете составлять RSA-ключ из чисел, влезающих в long long?

mayorovp Dec 9 2013 at 15:08

Я не буду, но за остальных я бы не стал ручаться… А реальная асимптотика тут O(k L³)

Mrrl Dec 9 2013 at 21:13

А почему не O(k L² log(L) log(log(L))?

(у алгоритма, реализованного через двоичное умножение, вообще получается O(k L⁴) — он же вычисляет остаток от деления на P после каждого сдвига. К счастью, деление там можно заменить вычитанием, и вернуть потерянный порядок).

mayorovp Dec 9 2013 at 21:19

Как — почему? Возведение в степень — это log N умножений, каждое умножение — это L² операций. L = log N. Отсюда и L³. Откуда вообще в подобном алгоритме, как описанный в этой статье, может появиться log L?

Mrrl Dec 9 2013 at 21:26

Если L будет большим, то и умножение будет браться из длинной арифметики. А там оно уже быстрое (если подобрать подходящую библиотеку или язык, в котором длинная арифметика входит в стандартные библиотеки).

mayorovp Dec 9 2013 at 21:31

Быстрое длинное умножение — это уже оптимизация, не подразумеваемая явно… Хотя, возможно, я просто слишком много раз писал длинное умножение без сторонних библиотек за ограниченное время.

Да, с быстрым длинным умножением асимптотика выходит другая, согласен.

PS УПС! А ведь там в алгоритме еще требуется длинное деление по модулю… Надеюсь, у него тоже существуют быстрые версии? Иначе асимптотика падает до O(k L⁴)…

SeptiM Dec 9 2013 at 21:54

Gcd можно искать через двоичного Евклида. Это O(L^2).
А так, конечно, есть. Например, метод касательных (Newton-Raphson method). Мне кажется, он работает за O(\log L M(L)), где M(L) — время умножения двух чисел.

Mrrl Dec 9 2013 at 21:59

Если через длинную арифметику (а не «двоичным умножением»), то оно делается один раз на умножение, то есть, остаётся то же O(k L³) (при классической реализации). Поскольку делим мы всегда на одно и то же число, то можем заранее посчитать 2^(2L)/x, и искать остаток за два умножения (умножили на обратный — взяли старшее «слово» — умножили его на x — вычли из a*b — при необходимости прибавили или вычли x). Существует ли настоящее быстрое деление, я, к сожалению, не знаю. За O(L*log(L)^2*log(log(L)) — скорее всего, существует (для вычисления a/b считаем (a/M)/(b/M), где M=2^(L/2), потом корректируем… или что-то в этом роде).

Psychosynthesis Dec 9 2013 at 20:23

А зачем проверять чётные?

bool SimplicityTest(int number) {
  if (number%2 == 0) { return false; }
  int temp = 3;
  do { if (number%temp == 0) { return false; }
  temp=temp+2; }
  while (temp<number);
  return true; }

В моём случае числа заведомо меньше int, если что.

-3

datacompboy Dec 9 2013 at 20:35

использовать надо +2 +4 — это еще на треть сокращает поле

-1

mayorovp Dec 9 2013 at 20:48

Ваш код работает за O(N), а код из первого примера — за O(N^1/2), не говоря уже о правильном варианте, упомянутом выше в комментариях.
То есть при простом N около 10⁶ вашему коду понадобится порядка 5 10⁵ операций, а тому коду — всего 1000. Не надо заниматься микрооптимизациями прежде, чем достигните нормальной асимптотики.

Mrrl Dec 9 2013 at 22:26

Не надо заниматься микрооптимизациями прежде, чем достигните нормальной асимптотики.

Не совсем уверен. Очень аккуратный O(n*log(n)), учитывающий особенности кэша памяти, скорее всего, обгонит надёжного, но громоздкого O(n). В том числе, за счёт микрооптимизаций.
Конечно, к сравнению O(n) и O(sqrt(n)) это не относится, если только у нас нет уверенности, что n достаточно мало.

Mrrl Dec 9 2013 at 22:25

rhaport Dec 9 2013 at 22:49

писать рекурсивные функции для решения такого рода задач не есть правильно. Даёшь только нерекурсивные версии. Самое позднее при переходе на длинную арифметику станет больно вызывать много раз одну и ту же функцию с тремя параметрами.

mayorovp Dec 9 2013 at 23:06

Не бейте лежачего!

vasiatka Dec 20 2013 at 16:49

Тест Ферма говорит «n – простое с вероятностью 1– е^t», где e<= Fi(n)/n, Fi(n) — функция Эйлера, t — количество итераций. В случае составного числа имеющего только большые делители e приблизительно равно единице. То есть качество проверки практически равно 0. И тут уже не особо важно 100 или 1000 итераций вы сделаете, вероятность-то все равно близка к 0. Я это студентам каждый год рассказываю. Данный тест надо знать, но использовать его в реальных приложениях не нужно.

vasiatka Dec 20 2013 at 21:51

Не хотел никого задеть. Ну вот вам пример:
A = 18446743979220271189 = 4294967291*4294967279
Число А — составное, равное произведению двух простых чисел. Число A чуть меньше 2^64.
Тогда вероятность того, что тест ферма выдаст вам правильный ответ равна p = 1 — (0.9999999995)^t. При 100 итерациях p = 5 x 10^(-8), при 1000 итерациях p = 5 x 10^(-7).
На соревнованиях легко могут подсунуть такое число. В итоге ваша программа не выиграет. И дело даже не дойдет до чисел Кармайкла.
Если очень хочется использовать вероятностный алгоритма присмотритесь к тесту Миллера-Рабина. Для него вероятность e меньше в 4 раза. Как следствие, число необходимых итераций для получения заданной точности в сотни раз меньше. К сожалению оценку сложности на память не помню.

-2

Mrrl Dec 20 2013 at 22:07

Тогда вероятность того, что тест ферма выдаст вам правильный ответ равна p = 1 — (0.9999999995)^t.

Проверил на Maple. Для первых 50 простых чисел все значения p^(A-1) mod A отличаются от 1… Какова вероятность такого события?

vasiatka Dec 21 2013 at 21:49

Провел собственное небольшое расследование. Похоже на то, что точное значение e в оценке e<= Fi(n)/n сильно отличается от верхней границы. Получается она реально годна только для сравнения эффективности тестов. Например аналогичная вероятность для теста Соловея-Штрассена в 2 раза ниже этой e<= Fi(n)/(2n), а для теста Миллера-Рабина в 4 раза e<= Fi(n)/(4n). Которые, похоже, так же сильно завышены.
Ноги у казанной оценки вроде бы растут отсюда «Молдовян Н.А., Молдовян А.А. Введение в криптосистемы с открытым ключом. – СПб.: БХВ-Петербург, 2005. 288 с.», но сам не читал… Авторы этой книги в некоторых кругах имеют дурную славу.

mayorovp Dec 21 2013 at 22:03

Мне кажется, вы оба сейчас перепутали условную вероятность того, что число простое при пройденном тесте, и условную вероятность того, что тест будет пройден, для составного числа.

vasiatka Dec 21 2013 at 22:16

Никто не перепутал. Изначально предполагается, что n составное.
В случае простого числа тест ошибиться не может, будут всегда выполняться все t =100 итераций.

Mrrl Dec 21 2013 at 23:02

Про «условную вероятность того, что число простое при пройденном тесте» можно говорить только когда есть какое-то априорное распределение тестируемых чисел. А его взять неоткуда, мы не знаем, откуда берутся тесты…

Mrrl Dec 21 2013 at 22:54

Оценка Fi(n)/n в тесте Ферма вполне может достигаться. А именно, на кармайкловых числах. Для остальных вероятность ложного положительного результата заметно меньше.

vasiatka Dec 21 2013 at 23:00

Нету ли у Вас ссылок на литературу (касаемо теста Ферма), лучше бумажную? Я о точности оценок.

Mrrl Dec 21 2013 at 23:16

К сожалению, нет — никогда не интересовался этим вопросом в такой степени, чтобы была нужна литература. Но в простейшем случае, когда n=p*q (p,q — простые) всё легко посчитать и так: число решений уравнения a^(n-1)=1 (mod n) равно gcd(p-1,q-1)^2. Например, для n=91 тест Ферма пройдёт в 36 случаях. А для больших p=2*q-1 вероятность ошибки будет стремиться к 1/2. Но для двух «случайно выбранных» простых чисел gcd(p-1,q-1) будет довольно маленьким, и вероятность ошибки тоже.

vasiatka Dec 21 2013 at 23:21

Спасибо

MegaMANGO Aug 27 2023 at 10:55

...if(b==1)
return a;
...

А почему не "return a%m;"? По-моему a*1 mod m = a mod m = a%m. Это ошибка автора или я что-то не так понял?

BorodaMhogogreshnaya Jan 7 at 09:06

Выбран крайне неудачный ГПСЧ. Дело в том, что rand() возвращает число в диапазоне от 0 до RAND_MAX = 32767.

Show the best of all time