VRus 30 мая 2012 в 23:48

Тематические подписки в соцсетях

2 мин

1.3K

Социальные сети и сообщества

Комментарии 19

AlexShkor 31 мая 2012 в 00:08

Что-то подобное пытаемся реализовать в нашем проекте.

VRus 31 мая 2012 в 00:11

Есть сайт уже?

AlexShkor 31 мая 2012 в 00:12

Да, но там ранняя beta. Если интересно могу ссылку в лс скинуть.

VRus 31 мая 2012 в 00:13

давайте, гляну.

shvedovka 31 мая 2012 в 00:12

Над чем то подобным тружусь в свободное время, только без явных тем типа «Стартапы». А на основе схожести постов, относительно интерес к ним людей.
Если очень грубо, находим человека которому интересно тоже что и вам, и предлагаем вам то что понравилось ему. А точнее по сумме таких микроретингов относительно других пользователей, находим посты наиболее подходящие вам.

VRus 31 мая 2012 в 00:22

Это по-моему коллаборативная фильтрация называется :) Интересно, действительно, почему её Фейсбук не использует? Хотя может слегка использует.

AlexShkor 31 мая 2012 в 00:25

Думаю использует, но у Фейсбука такие огромные данные, что проанализировать таким способом полностью все практически невозможно.

shvedovka 31 мая 2012 в 00:34

Да именно она, только реализуется все с определенными упрощениями. Оцени вида лайк и дислйак. Выборка происходит не на основе все пользователей, а на основе некоторого количества наиболее авторитетных за последнее время. Там еще много всего)

VRus 31 мая 2012 в 00:49

Вот попалось недавно что-то в эту тему signup.endorphin.me/ Хотя это скорее рекомендации собственно кого зафрендить, как я понял.

НЛО прилетело и опубликовало эту надпись здесь

VRus 31 мая 2012 в 00:54

Интересно, можно ли в наше фейсбучное время раскрутить альтернативный социально-сетевой ресурс? Даже с хорошей альтернативной идеей. Френд мой amilner всегда скептически относился к этому, когда я сам хотел сделать такой… Но я считаю пробовать надо, да.

shvedovka 31 мая 2012 в 01:01

Тот же Instagram или Foursquare тоже социально-сетевой ресурс. Так что хорошая альтернативная идея, решает.

VolCh 31 мая 2012 в 04:42

Тут конечно значительную роль начнет играть механизм автоматического ранжирования, определяющий, что именно достойно в первую очередь попасть в вашу ленту.

По-моему, без семантического анализа того, что мне уже было интересно и того, что может быть интересно, эту задачу не решить. А есть у нас технологии семантического анализа, кроме вечно ожидаемого ИИ?

VRus 31 мая 2012 в 16:11

не туда тыкнул, ответ ниже.

VRus 31 мая 2012 в 16:09

По правде я не силен в семантическом анализе, не могу комментировать. Но так навскидку мне пока продолжает нравится идея обобщения PageRank, которую я тут на Хабре высказывал. А если ограничиться конкретным ресурсом, чтобы не было проблемой собирать и анализировать пользовательскую активность внутри него, так и вообще думаю можно найти неплохие методики.

VolCh 31 мая 2012 в 22:33

Что может сказать факт, что я прочитал (вернее провёл на странице какое-то время и скролил её) ваш пост и написал к нему комментарий без определения смысла этого комментария? Ладно, допустим как-то определили, что пост мне понравился (хотя бы по тому, что я плюс нажал). Как определить, что другой пост мне тоже понравится? Что два поста ссылаются на одни и те же вещи ни о чём не говорит. Скажем ваш пост ссылается на соцсети, и другой ссылается, но мне интересно нестандартное использование соцсетей, а не новость, что соцсеть заработала 1005000 денег. Что какой-то авторитетный для меня пост ссылается на два других — тоже. На один он может ссылаться как «рекомендую, качественный материал», на другой «полная чушь, автор не понимает что пишет»". Про такие семантические тонкости как сарказм или ирония, которые человек-то не всегда может распознать, я вообще молчу.

В общем не верю я в качественное ранжирование статистическими методами.

VRus 31 мая 2012 в 23:10

Что может сказать факт, что я прочитал (вернее провёл на странице какое-то время и скролил её) ваш пост и написал к нему комментарий без определения смысла этого комментария?

Данный факт говорит как минимум о том, что вы потратили часть своего невосполнимого жизненного ресурса — времени (или пусть будет внимания) — на чей-то пост. Ранжирующий алгоритм учтет также, что вы читатель не абы какой, а довольно высокорейтинговый. Т.е. ваше внимание предположительно стоит дороже. А еще можно анализировать ваше поведение — читаете ли вы все посты подряд и комментите их все, учитывать и величину, и соотношение этих чисел. Опять же интересно сравнение вашего поведения с поведением других пользователей с похожей величиной рейтинга, насколько вы типичны или отличаетесь. Я думаю из статистического анализа поведения (чтения, голосований, комментирований, занесения в избранное, в друзья, письма в личку) можно с неплохой вероятностью определять позитивные/негативные/нейтральные отношения между пользователями. И учитывать все это в алгоритме. Т. е. не обязательно иметь ИИ для определения смыслов. Смыслы не критично важны. Важно внимание и как им оперируют люди. Хотя я думаю из статистического анализа можно даже определять тональность комментариев.

VolCh 31 мая 2012 в 23:55

Считаю, что главный недостаток статистических алгоритмов большое (и не могущее быть нулевым даже теоретически) количество ошибок первого рода — могут счесть интересный для меня пост неинтересным. Это, например, главный недостаток известных мне спам-фильтров. Толку от них, если всё равно приходится заглядывать в папку «Спам» :(

VRus 1 июн 2012 в 00:21

Мне кажется у спам-фильтров просто мало информации для анализа. В таких условиях любые алгоритмы ошибаться будут. И ИИ не спасет, и даже человека-секретаря посади почту разбирать и то не 100% качество фильтрации получится.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Тематические подписки в соцсетях

Комментарии 19

Публикации

Истории