Как стать автором
Обновить

Комментарии 5

Думаю, в данном случае больше подойдет теория нечетких множеств.
Ну мысли вслух:

— произвольные свойства независимы
— к свойству можно вес для релевантности
— отсутствующие свойства никак на другие свойства не влияют, их появление должно увеличивать общую релевантность

в результате имеем — веса для каждого из свойств и простая взвешенная сумма, без нормализации.
Мои свойства не произвольные: грубо говоря, мои объекты представляют собой иерархию, и я точно знаю, в каком объекте какие свойства.

Мне кажется, что нормализация нужна. Иначе получится, что если стопроцентное попадание у базового класса может проиграть трем пятидесятипроцентным попаданиями у наследника.
Тут надо смотреть — если свойства зависимы, то есть появление свойства уменьшает значимость остальных — тогда нормализация, если независимы, то нет. Например ранг по отдельным словам из фразы — зависим, а вот частота слов в тексте и растояние между словами — не зависимы.
В общем надо смотреть свойства — их сущность и реальную взаимосвязь.
Свойства у меня, пожалуй, независимые. Уговорили, попробую без нормализации. А там уже буду думать…
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации