Как стать автором
Обновить

Комментарии 3

Почему просто не вычесть константу c из всех x_i перед взятием софтмакса? Вычитание любой константы из вектора не должно менять значение софтмакса так как это эквивалентно сокращению дроби в софтмаксе на exp( c ).
Ровно это функция LSE в коде выше и делает.
Речь идёт о том, чтобы сделать «ровно это» не вводя функцию LSE.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий