О создании персональных рейтингов. Вроде IMHO.net / Комментарии / Хабр

AlexeyR 7 сен 2012 в 18:14

Тема прогнозов очень обширная и интересная. Но содержит массу подводных камней. Два примера.
Первый. Посмотрите распределение рейтингов на IMDB для хороших фильмов. Вы заметите «нелогичный» всплеск на 10 баллах. Причина — реальное распределение оценки имеет нормальный характер. Ограничение шкалы заставляет десятку аккумулировать оценки 11 12 и т.д. Для хороших явлений это сильно искажает картину.
Второй. Шкала оценок — шкала ранговая. Это означает, что следующий рейтинг выше предыдущего, но ничего не говорит о том насколько. Например, для фильмов оценки 1 или 5 отражают небольшую разницу в отношении к плохому фильму. А вот 6 или 8 это разница между посредственным фильмом и хорошим. То есть в первом случае разница в 4 балла — не о чем, во втором 2 балла — огромное различие. Соответственно все действия основанные на сложении и вычитании таких рейтингов сразу дают колоссальную погрешность. Перед тем как хоть что-то делать с оценками по ранговой шкале их надо преобразовать в соответствующее пространство. Это относится и к использованию любых метрик.

О создании персональных рейтингов. Вроде IMHO.net

Комментарии 1

Публикации

Истории