sunnybear 23 мар 2008 в 15:52

Рекомендательные системы: перепросмотр

6 мин

2.5K

Чулан

Перевод

+24

Комментарии 25

jasiejames 23 мар 2008 в 15:58

Статья хорошая, безусловно, но не могли бы вы исправить некоторые ошибки? Перечитайте повнимательней.

sunnybear 24 мар 2008 в 12:31

был бы признателен, если бы указали конкретные места, которые, по Вашему мнению, стоит переработать

jasiejames 24 мар 2008 в 17:00

Я не буквоед, но из-за этих ошибок пришлось абзац три раза перечитать чтобы понять:)
2й абзац - "...любой, кто изобретает алгоритмА.."
- "...количеством доступнОМ для анализа информации.."
- "...достигнут некоторый прогреАсс.."
- "...скорее, вопросом преставления.." (наверное все-таки преДставления:)
- не буду перечислять еще что-то потому что вы сами должны были это сделать перед тем как постить.

sunnybear 25 мар 2008 в 08:26

Александр, я уважаю Ваш труд, но считаю недопустимым указывать, что я должен был сделать перед публикацией

jasiejames 25 мар 2008 в 11:14

Не обижайтесь, я из хороших побуждений (да и кто я такой, чтобы Вам указывать:).

sunnybear 25 мар 2008 в 11:48

да я внес уже все правки, чуть еще подправил, it's OK :)

skfd 23 мар 2008 в 16:29

Веселые времена настанут тогда, когда эти рекомендательные системы станут на столько хороши и популярны, что фильмы начнут снимать под них.

kuchin 23 мар 2008 в 19:16

А что в этом плохого, собственно говоря? Наверняка сценаристы в Голливуде уже давно имеют набор штампов, которые нравятся публике. На самом деле, интересное начнется тогда, когда фильмы станут интерактивными.

wpm1 24 мар 2008 в 13:36

в шоубизнесе будут создаваться аналоги дорвеев

aleks_raiden 25 мар 2008 в 08:33

они и так уже давным давно есть

titanbull 23 мар 2008 в 19:25

Я лично использую рекомендательный сервис imhonet. Должен сказать, он бывает ошибается, однако в большинстве случаев предугадывает довольно верно.

SeoBaby 23 мар 2008 в 19:35

Alex Iskold прежде всего знаменит своими статьями о семантике, у него и компания на этом специализируется. Очень хорошие у него статьи, популярные такие, то есть легкие, потому с удовольствием читаю.

djsv 23 мар 2008 в 19:44

Это что - машинный перевод?

-2

MRoizner 23 мар 2008 в 20:14

Если не брать в расчет фильмы и новости, где было бы хорошо применить вышеописанные фильтры?

Их можно применять там же, где сейчас уже применяют рекомендации, например, в музыке. В Imhonet ещё есть разделы, посвящённые книгам, сцене, комп. играм.
Можно ещё к кафе/ресторанам.
Фильтры и рекомендации можно применять вообще ко всем вещам, которые можно сравнивать и выбирать.

babysas 24 мар 2008 в 02:23

livelib.ru Рекомендует книги. Пока доволен, книги куда медленнее читаются поэтому навреное дольше буду доволен.

avenu 24 мар 2008 в 10:56

> Ошибочные результаты расстраиваются, а неверные ошибки нет.

Не совсем понял про фильтры, что имеется ввиду? Например, на Озоне имеется кнопка, по нажатию на которую мы говорим, что нам не понравилась рекомендация.
А что значит одна большая кнопка для фильтрации?

К сожалению, в статье практически не раскрыта тема успешных алгоритмов конкурса Netflix, так чтобы мы смогли применить их на практике.

avenu 24 мар 2008 в 10:57

Первая цитата приведена как лишенная смысла :) Наверное, там утеряно "из-за"

Perec 24 мар 2008 в 12:33

ОЗОН как раз предлагает "то, что тебе должно понравиться". При этом позволяет настроить рекомендации вручную. Таким образом пытаются уменьшить риск того, что в статье названо "ошибочный результат".

Тема про "неверные ошибки" это, как японял, не выбор "хороших" сущностей, а удаление "плохих". В общем-то спам фильтры работают по такому принципу. Считаем, что нам страшнее плохое назвать хорошим чем не назвать хорошее хорошим. В статитсике это ошибки 1го и 2го рода (никогда не мог запомнить что из них что).

Мне, как раз, очень понравилась эта идея. Новая для меня мысль в плане рекомендательных систем.

avenu 24 мар 2008 в 13:34

А, спасибо, теперь понял. Интересная идея. Только вот она мне кажется затратной с точки зрения рассчетов. Если для писем понятны параметры для оценки (текст, отправитель и т.д.), то какие параметры у рекомендательной системы? Искать максимально непохожих на данного пользователя пользователя и вычеркивать его предпочтения?

Perec 24 мар 2008 в 13:51

Идея частично в статье была: из множества киноновинок отсечь заведомо мне неинтересные. Понять, что мне НЕ интересны низкобюджетные ужастики, тупые молодежные комедии и все фильмы с Вином Дизелем (все для примера) задача сопостовимая с определением интересных фильмов. Тут вся выборка сущностей достаточно маленькая. Мне бы лично такой сервис был бы интересн...

С другой стороны, я, работая с рекомендательными системами пришел к выводу, что это больше для лонг-тейла, чем для новинок. Т.е. интересно выудить достаточно старую сущность (здесь скорее о книгах), которя ускользнула от взгляда. По таким объектам информации уже много пространство для работы есть. На новинках статистику еще рано пременять.

avenu 24 мар 2008 в 14:02

Да в принципе все рек. системы для лонгтейла, а новое учитывать - это уже дополнительное измерение надо вводить - время.

Заведомо неинтересные? Но тогда и пользователя нужно отправлять не на оценку прочитанных книг, а того, что ему не нравится?

Perec 24 мар 2008 в 14:17

>> Но тогда и пользователя нужно отправлять не на оценку прочитанных книг, а того, что ему не нравится?

Ну почему же?! Юзер идет на список новинок, видит большой список. Нажимет кнопку "убрать неинтересные" и список существенно сокращается. Почему это лучше, чем вывести список понравившихся (см. статью) психология потребителя.

Повторюсь, что это хорошо на сравнительно небольшом списке объектов. Даже больше: если до удаление "мусора" список необозримо большой, а после вполне доступен для беглого просмотра, то наша модель заработала!

avenu 24 мар 2008 в 15:23

> Юзер идет на список новинок, видит большой список. Нажимет кнопку "убрать неинтересные" и список существенно сокращается.
Это понятно, это уже следствие алгоритма. А сам алгоритм? Из чего он будет получать информацию о том, что есть потенциальный "спам"?

Perec 24 мар 2008 в 16:51

Нужны неоторые события, характеризующие негативное отношение к товару. Например, плохая оценка товара, плохой отзыв, малое время просмотра (это уже сложно и экзотично). А дальше все аналогично поиску положительных рекомендаций (тут масса вариантов). "Товар не нравиться похожим на меня людям => не понравиться мне"

avenu 24 мар 2008 в 17:06

Хм, довольно интересный подход. Задумался.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Рекомендательные системы: перепросмотр

Комментарии 25

Публикации

Истории