Открыть список
Как стать автором
Обновить

Комментарии 8

Рыбка.
На пятом графике я вижу рыбку!

Заголовок спойлера
image


А вы видите рыбку?
Я вижу половинку сердца с большим рожком мороженного
А в чем принципиальная разница от подхода из этой статьи?
Breaking news
image
Принципиальное отличие заключается в использовании рекуррентных нейронных сетей, а не простой N-gram модели с использованием линейных классификаторов или решающих деревьев. В конечном итоге использование модели Biderection GRU, в совокупности с механизмом внимания показывают результат, превосходящий модели, построенные только на энтропии, N-gram моделях и моделях, использующих алгоритм TF-IDF.
Клево! Больше нейросетей! А расскажите какие-нибудь детали про процесс войны за обучение? Что попробовали и не сработало? Как выбирали толщину? Какой размер датесета?
В общем, больше мяса!
Воу, тут материала наверно на ещё одну статью :)
Если из интересного и кратко, то я был удивлен, что SVM — не выстрелило, а оптимальным количеством units для нейронной сети стало 128. Их увеличение до 256 или 512 только ухудшало модель — почему, загадка.
Пробовал разные алгоритмы градиентного спуска — остановился на Adam.
Ну а самая сложная модель, которую попробовал выглядит примерно так.
Скрытый текст


Размер датасета у нас 1кк легитимных доменов и 800к вредоносных (по 100к на каждое из 8 рассмотренных семейств).
А последний график построен по Training Set или по Test Set?
Точность на тестовой выборке
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Информация

Дата основания
Местоположение
Россия
Сайт
dsec.ru
Численность
51–100 человек
Дата регистрации

Блог на Хабре