Lumber room
June 2007 2

Фильтрация контента

Я тут задумался об эффективном механизме фильтрации интересующего контента: премодерирование, карма, etc…

И в голову пришла простая идея: почему бы не использовать байесовскую фильтрацию для топиков? Теоретически для этой цели она должна работать даже лучше, чем для фильтрации спама. Кроме того, если потеря email из-за ошибки фильтра может обойтись очень дорого, то пропуск хабратопика абсолютно не критичен.

Не знаю, может идея бредовая… я её толком обдумать ещё не успел. :)
+18
280 15
Comments 65
Top of the day