amilner Jul 26 2007 at 05:05

Критерии ранжирования: От каждого по способности, каждому по труду (№3 )

6 min

2.3K

Чисто социалистический лозунг, вынесенный в заголовок этой заметки – третьей в серии «Как нам обустроить социальный веб?», может оказаться совсем не плохим применительно к Web 2.0. Да, и, если хорошо подумать, не такой он уж и плохой для реальной жизни. Беда только в том, что никто его и никогда не собирался в этой жизни по настоящему использовать.

В предыдущей заметке этой серии (все заметки серии будем помечать их относительным порядковым номером) мы рассмотрели инструментарий, с помощью которого каждый зарегистрированный пользователь может выразить своё отношение к различным входным сообщениям, поступающих от других пользователей. В этой остановимся на том, для чего, как, когда, и в какой степени при ранжировании информации и пользователей система (ресурс, ИСР) должна использовать, проставленные оценки.

В предложенном подходе к выбору основного критерия ранжирования участников прямые пользовательские оценки либо вообще не учитываются, либо идут с меньшим весом, косвенные действия читателей, которые объективно отражают их реальный интерес к сообщениям оцениваемого участника. Ведь и в самом деле трудно предположить, что вы будете знакомиться с неинтересными и бесполезными для вас материалами, голосовать по ним и участвовать в их обсуждениях. Другими словами, практика (ваши действия, а не намерения и пристрастия) – критерий истины.

О чём речь

В общем случае, процедурам ранжирования в социальных ресурсах подвергаются объекты трёх типов:
1. Основные сообщения (темы/topics)
2. Пользователи
3. Сайты (ресурсы – источники информации)

В качестве исходной информацией для ранжирования при этом могут выступать:
1. Прямые пользовательские оценки:
-данного объекта, например, как мы это видели в предыдущей заметке применительно к сообщениям
-другого объекта, например, сообщения при оценке его автора
2. Косвенные действия пользователей, которые могут что-то сказать об интересе к ранжируемому объекту

А теперь рассмотрим всё это конкретнее применительно к каждому из трёх видов объектов ранжирования. Как всегда, сначала будем говорить о существующих ресурсах, а затем о том, что предлагается для типового интеллигентного социального ресурса (ИСР). При этом хочу сразу предупредить, что, говоря о существующих ресурсах и в некоторых случаях не зная точных алгоритмов их работы, я буду опираться на свои наблюдения. Непрозрачность алгоритмов ранжирования – это вопрос отдельного разговора

Ранжирование основных сообщений
Ранг сообщения в существующих ресурсах определяется как:

digg – некоторая функция от сумм всех пользовательских «за (digg it) и «против» (Bury) по отношению к данному сообщению. Такая интегральная оценка здесь называется Популярностью сообщения.

reddit — некоторая функция от сумм всех пользовательских «за (Up/like) и «против» (Down/dislike) по отношению к данному сообщению. Однако такая функция рассматривается здесь только как один из вариантов ранжирования. Почти на равных используются и другие, например, по «противоречивости» (Controversy) и актуальности (Hot)

news2 – некоторая функция от сумм всех пользовательских «за (Отметить) и «против» (проблема?) по отношению к данному сообщению. Такая интегральная оценка здесь называется Качеством сообщения.

habrahabr – некоторая функция от сумм всех пользовательских «за и «против» по отношению к данному сообщению. Такая интегральная оценка здесь называется Хабрасилой

del.icio.us – некоторая функция от сумм всех пользовательских «за (save it) по отношению к данному сообщению. Такая интегральная оценка здесь называется Популярностью сообщения.
bobrdobr.ru — ранжирование сообщений не используется (или мне так показалось?)

У меня есть подозрение, что на значения аргументов типа «за» и «против» в некоторых ресурсах также влияют ранги голосующих пользователей. Также думаю, что иногда на значение такого весового коэффициента влияет и сумма комментариев к данному сообщению. С большей вероятностью последнее предположение верно для reddit при ранжировании по «противоречивости» и актуальности.

Предлагается для ИСР:

1. Ранжирование по номинациям — многокритериальное ранжирование
2. Равноправность всех номинаций – пользователь сам выбирает, какая номинация его больше устраивает и даже может соотнести такую номинацию со своей домашней страницей
3. Актуальность сообщения является самой «объективной» номинацией для сообщений, хотя рассматривается системой только как первая среди равных. Именно по критерию актуальности ранжируются сообщения, выдаваемые на главную страницу по умалчиванию. Как мы увидим дальше — этот же критерий является основным (если не единственным), используемым при ранжировании пользователей.
4. Равноправность «оценивающих» пользователей в части возможности высказать свою оценку любого сообщения (не своего, конечно). Что касается весовых коэффициентов такой оценки, то статус голосующего в определённых случаях может оказать влияние на такой весовой коэффициент. Но этому планируется посвятить отдельный разговор.

Сформулированный подход, с моей точки зрения, является гарантией высокого уровню плюрализма ИСР и предотвращает возможность когда либо некоторой группе пользователей навязывать свои «идеологические» пристрастия остальным.

Сначала несколько слов о номинациях ранжирования основных сообщений, каждая из которых связана со своим критерием. Вообще говоря, их может быть сколь угодно много. Я приведу только несколько (названия условные; как и номенклатура номинаций, это дело вкуса разработчиков ИРС):
— Актуальность (популярность, востребованность) сообщений – как мы уже отметили, это основной критерий. Поэтому, с моей точки зрения, он является обязательным для любой ИРС. Подробнее об этой номинации смотри ниже.
— Общепризнанность сообщений – содержат идеи (мысли, предложения, выводы), с которыми согласны большинство ознакомивших с ними
— Неприемлемость сообщений — содержат идеи (мысли, предложения, выводы), с которыми не согласны большинство ознакомивших с ними
— Противоречивость сообщений – содержат спорные идеи (мысли, предложения, выводы).

Рассмотри подробнее критерий ранжирования по актуальности информации. Остальные критерии (номинации) ранжирования будут представлены в следующей заметке.

Ранг сообщения в номинации актуальность определяется как функция от сумм всех пользовательских:

1. просмотров (View) этого сообщения. Имеется, конечно, в виду, что пользователь сначала получает только общий список сообщений.
2. прямых ответов — комментариев верхнего уровня к этому сообщению
3. голосований Согласен — Не согласен, не зависимо от того, как конкретно проголосовал каждый пользователь
4. комментариев более нижних уровней, связанных с этим сообщением
5. голосований к этим комментариям, опять же независимо от того, какие они

Каждый аргумент (сумма) имеет свой весовой коэффициент, выбор которого может сыграть решающую роль в корректности номинации. Не углубляясь пока в тонкости этого вопроса можно, в общем, наметить следующие приоритеты (в порядке убывания значения весовых коэффициентов): 2, 1, 3, 4, 5. При этом для аргументов 4 и 5, связанных с комментариями нижнего уровня, весовой коэффициент должен резко понижаться для каждого следующего уровня.

Почему я всё-таки отдаю предпочтение комментариям по отношению к обычным просмотрам (прочтениям) сообщений. Ответ, мне кажется прост. Мы все мастера делать броские аннотации, как я по совету уважаемого sheller я и сделал к этой заметке. В тоже время тяжело не согласиться с утверждением dik, что за «заманчивой превьюшкой», часто «скрываться откровенная пустышка» (смотри комментарии к предыдущей заметке в habrahabr). Надеюсь, к моим заметкам это не относится:). А вот комментарий каждый из нас, как правило, будет писать только в том случае, если материал его задел за живое.

Как мы видим, здесь прямые пользовательские оценки либо вообще не учитываются (например, «нравится — не нравится»), либо идут с меньшим весом («согласен- не согласен»), чем его косвенные действия, которые объективно отражают реальный интерес пользователя к данному сообщению. Ведь и в самом деле трудно предположить, что вы будете знакомиться с неинтересными и бесполезными для вас материалами, голосовать по ним и участвовать в их обсуждениях. Другими словами, практика (ваши действия, а не намерения и пристрастия) – критерий истины.

Только один пример для иллюстрации сказанного. Есть у меня один верный читатель – мой заклятый друг. Нет, не тот, о котором вы подумали — здесь всё в рамках допустимого, хотя иногда и тянет на Что- то не так. Кто он и и откуда, не имеет сейчас никакого значения. Главное, что не пропускает «мой друг» почти ни одной моей заметки. При этом чистит меня, как только может и минусы соответствующие расставляет. Почти риторический вопрос, актуальны ли для него мои мысли или нет? А может быть это просто такой себе современный информационный Робин Гуд, который посвятил всю свою жизнь защите сирых и бедных пользователей социального веба?

Нетрудно также заметить, что в определении критерия актуальности я следую известному правилу: «новое – это хорошо забытое старое». Ведь вспомним, какие постинги мы, прежде всего, читаем на форумах, построенных на традиционных движках типа IPB? Правильно, те, которые до нас больше всего просмотрели и прокомментировали другие. Правда, в известных мне форумных движках в выходных листингах редко производится упорядочение сообщений по критерию актуальности, но ведь и времена сейчас другие:). Это, кстати, ещё раз к прозвучавшему в мой адрес намёку об использовании «перелицованного форума».

А теперь нам будет проще перейти и к самому «больному вопросу социалки». К вопросу о том, кто, как и почему нас с вами ранжирует. Об этом читайте в расширенном варианте заметки, размещённом в iTech Bridge (Внимание! Честно предупреждаю, заметка опять получилась достаточно длинная).

Tags:

Hubs:

Lumber room