Как стать автором
Обновить

Комментарии 5

Привет Илья! рад что ты решил постить на Хабр.


В принципе идея user2vec не сказать что новая, борьба с инфраструктурой конечно еще та история.


вопрос же по предикту следующего эмбеддинга что дальше-то? и вообще, вот получили вы хорошие представления, а далее куда они идут? декодируете обратно или ищете ближайших, или что?


ваши downstream не совсем раскрыты вобщем :) как пользователь lenta.ru заметил кстати изменения в рекламе, она стала релевантней контенту и релевантней моим предпочтениям. но это так, возможно квантовый эффект наблюдателя. вобщем пролей света немного.

Привет! Спасибо за содержательный комментарий!

1) Идея представления пользователей в виде векторов(user2vec) действительно старая, и мы сами занимаемся этим очень давно. В этой статье захотели рассказать о новой для нас технологии построения профиля пользователя на основе нейросетевых эмбеддингов. Формально, мы решаем все ту же задачу, но более перспективной технологией, которая не только улучшает качество, но и, как ни странно, позволяет (в перспективе) упрощать инфраструктуру.

2) Предикт следующего события напрямую мы никак не используем. Действительно, у нас (пока) нет бизнес задач «предсказать следующее событие пользователя». Мы оптимизировали предикт след. событий для универсальной цели — научить модель понимать смысл в данных. Идею взяли из статьи Representation Learning with Contrastive Predictive Coding. Адаптировав подход к нашим задачам, мы заметили, что если научить модель отличать логи следующих событий, сделанные одним и тем же пользователем, от событий других пользователей, то модель эффективно учит закономерности в данных, и позволяет построить универсальное представление пользователя, которое хорошо заходит в разных downstream задачах.

3) Downstream задачи. Имея представление каждого пользователя, мы можем использовать его как признаковое описание для решения ряда задач классификации и регрессии. Например, предсказание сегментов пола, возраста, дохода. А так же поиск похожих пользователей как верно ты подметил. Далее эти сегменты используются для персонализации рекламы.

4) Пресс-релиз. Помимо статьи мы выпустили еще пресс-релиз, где чуть больше о бизнес-составляющей проекта.

Если остались вопросы, буду рад ответить!

огонь, вопросов не осталось. успехов вобщем) если еще про трансформеры статью запилишь, про устройство и применение, будет круто)

спасибо:)
трансформеры — моя любимая тема! Надеюсь, мы дойдем до применения их в проде. На текущий момент сложновато с точки зрения ресурсов и нагрузки, но мы уже немного фантазируем и прорабатываем эту историю.

и вдогонку — возьму на заметку про эмбеддинги на основе предиктов. если хорошо заходят, "надо брать".

Зарегистрируйтесь на Хабре, чтобы оставить комментарий