malkovsky 19 дек 2018 в 20:42

Обзор основных методов математической оптимизации для задач с ограничениями

7 мин

53K

Алгоритмы*Математика*

+29

Комментарии 20

Palich239 20 дек 2018 в 09:02

Жаль, что материал на такую тему исключительно справочный… Есть ли ссылки на адекватные программные реализации? (Без симплекса — его и так много)

malkovsky 20 дек 2018 в 12:11

Смотря для каких целей. Если для прикладных — не стоит задумываться о том, как и какой метод реализован, лучше просто использовать готовый пакет оптимизации типа гуроби, cvxopt или scipy.optimize. Есть например хороший интерфейс на питон — cvxpy. В matlab точно что-то есть, скорее всего и в подобных математических продуктах тоже.

Если нужно «пощупать» руками, я могу дать свои реализации, по которым анимации строил.

Palich239 27 дек 2018 в 17:24

Спасибо. Я много лет использую библиотеку PuLP, вдруг пригодится… Кстати, какой метод реализован — на больших размерностях бывает важно… Во всяком случае, если вы хотите знать сколько времени (хотя бы порядок) может занять сам расчет. Вообще, у меня есть небольшая претензия к названию статьи (излишне обобщили), но это мелочи с учётом того, что вы продемонстрировали ;) Спасибо

kxx 20 дек 2018 в 23:02

В MATLAB есть пакет CVX, который является удобной надстройкой над солверами. Он же портирован в R.

skaz07 20 дек 2018 в 12:12

Спасибо за статью. Добавьте, пожалуйста, список используемой литературы.

NikR 20 дек 2018 в 17:52

Отличная статья!
По методу внутренней точки для линейного программирования:
— логарифмический барьер — правильный? (шаг метода Ньютона генерирует точку, которая остается внутри нашего множества)
— шаг метода L-BFGS с логарифмическим барьером генерирует точку, которая остается внутри нашего множества?
— какие обычно значения берутся для t0 и a?

malkovsky 20 дек 2018 в 18:41

Логарифмический барьер — правильный. К сожалению тут есть небольшие тонкости с выбором начальных данных. Готового рецепта на все случаи жизни я к сожалению не готов дать. Когда готовил анимации у меня возникла проблема, что Ньютон разваливался. Тогда я это решил методом научного тыка.

Про BFGS и все его вариации не могу ничего сказать, лично я пробовал применять градиентный спуск вместо Ньютона — ничего хорошего не выходило. Всегда можно самому попробовать, но думаю, что уже пробовали не один раз. Метод внутренней точки придумали давно и Ньютон там засел намертво.

NikR 21 дек 2018 в 10:52

Что значит, Ньютон разваливался?
Еще не пробовал. Ищу методы с адекватной сложностью. Ваша статья очень помогла мне.
Какие значения t0 и a вы брали для демонстрации?

malkovsky 21 дек 2018 в 19:43

Я использовал t=0.1, alpha=2. В некоторых экспериментах Ньютон на первом шаге уходил за пределы области. Студенты, которым давал задание реализовать метод внутренней точки, говорил, что тоже иногда Ньютон не выдавал точку внутри. В статье правку сделал

Tsvetik 26 дек 2018 в 20:21

А симплекс-метод работает только для линейных ограничений и линейных функций?

malkovsky 27 дек 2018 в 11:56

Да

Palich239 27 дек 2018 в 17:19

Вставлю свои пять копеек: для непрерывных величин (тип float и им подобные) и некоторых случаев булевого линейного программирования

MajinSaha 4 фев 2019 в 22:14

Если не ошибаюсь, проективные градиенты и подобные ему — первого порядка сходимости, поэтому на практике, c общими нелинейными функциями, работают медленнее, чем, например, SQP, где локально решается задача квадратичного программирования. Я сам это наблюдал, когда использовал его с коробочными ограничениями. Если не присобачить поправку второго порядка, сходиться будет как черепаха.
А вообще классная тема. Обогнали меня, сам хотел что-то такое в перспективе написать!:)

malkovsky 5 фев 2019 в 13:19

Если говорить о количестве итераций до достижения определенной точности, то да — чем выше порядок метода, тем быстрее он сходится. Однако есть и другая сторона медали — чем выше порядок метода, тем сложнее одна итерация, и тем сложнее применять эти методы в пространствах очень больших размерностей. Например, градиентный спуск очень распространен в нейронных сетях, где обычно не меньше миллиона параметров, причем в основном его «стохастический» вариант, который очень хорошо укладывается в парадигму ML. Применять его в пространствах размера < 10000 практически бессмысленно, есть достаточно методов, которые будут работать быстрее.

MajinSaha 6 фев 2019 в 08:20

Если не секрет, не подскажете, каким софтом рисовали анимацию сходящихся итераций для этого поста? Очень-очень полезная вещь!

malkovsky 7 фев 2019 в 19:37

Не секрет, это python/matplotlib. Я хотел приложить ноутбук к статье, но в итоге недооформил адекватно. Сейчас могу только выложить черновик

MajinSaha 7 фев 2019 в 19:45

Спасибо!

grigorym 18 апр 2019 в 09:12

Уточните, пожалуйста, обоснованность «Выбрать новое приближение методом Ньютона». Вы его применяете так, будто хотите найти не минимум, а 0 от функции fi(x,t).

malkovsky 18 апр 2019 в 10:54

Обратите внимание, что метод Ньютона применяется для градиента fi(x, t), т.е. мы действительно ищем 0 градиента функции, что соответствует минимуму самой функции в случае, когда она выпукла и дифференцируема, у нас как раз такой.

grigorym 18 апр 2019 в 16:45

А, действительно, вижу. У вас dx = -grad(fi) / grad(grad(fi)), а не dx = -fi / grad(fi). Разобрался, спасибо

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Обзор основных методов математической оптимизации для задач с ограничениями

Комментарии 20

Публикации

Истории