Как стать автором
Обновить

Комментарии 19

Что-то подобное пытаемся реализовать в нашем проекте.
Есть сайт уже?
Да, но там ранняя beta. Если интересно могу ссылку в лс скинуть.
давайте, гляну.
Над чем то подобным тружусь в свободное время, только без явных тем типа «Стартапы». А на основе схожести постов, относительно интерес к ним людей.
Если очень грубо, находим человека которому интересно тоже что и вам, и предлагаем вам то что понравилось ему. А точнее по сумме таких микроретингов относительно других пользователей, находим посты наиболее подходящие вам.
Это по-моему коллаборативная фильтрация называется :) Интересно, действительно, почему её Фейсбук не использует? Хотя может слегка использует.
Думаю использует, но у Фейсбука такие огромные данные, что проанализировать таким способом полностью все практически невозможно.
Да именно она, только реализуется все с определенными упрощениями. Оцени вида лайк и дислйак. Выборка происходит не на основе все пользователей, а на основе некоторого количества наиболее авторитетных за последнее время. Там еще много всего)
Вот попалось недавно что-то в эту тему signup.endorphin.me/ Хотя это скорее рекомендации собственно кого зафрендить, как я понял.
НЛО прилетело и опубликовало эту надпись здесь
Интересно, можно ли в наше фейсбучное время раскрутить альтернативный социально-сетевой ресурс? Даже с хорошей альтернативной идеей. Френд мой amilner всегда скептически относился к этому, когда я сам хотел сделать такой… Но я считаю пробовать надо, да.
Тот же Instagram или Foursquare тоже социально-сетевой ресурс. Так что хорошая альтернативная идея, решает.
Тут конечно значительную роль начнет играть механизм автоматического ранжирования, определяющий, что именно достойно в первую очередь попасть в вашу ленту.

По-моему, без семантического анализа того, что мне уже было интересно и того, что может быть интересно, эту задачу не решить. А есть у нас технологии семантического анализа, кроме вечно ожидаемого ИИ?
не туда тыкнул, ответ ниже.
По правде я не силен в семантическом анализе, не могу комментировать. Но так навскидку мне пока продолжает нравится идея обобщения PageRank, которую я тут на Хабре высказывал. А если ограничиться конкретным ресурсом, чтобы не было проблемой собирать и анализировать пользовательскую активность внутри него, так и вообще думаю можно найти неплохие методики.
Что может сказать факт, что я прочитал (вернее провёл на странице какое-то время и скролил её) ваш пост и написал к нему комментарий без определения смысла этого комментария? Ладно, допустим как-то определили, что пост мне понравился (хотя бы по тому, что я плюс нажал). Как определить, что другой пост мне тоже понравится? Что два поста ссылаются на одни и те же вещи ни о чём не говорит. Скажем ваш пост ссылается на соцсети, и другой ссылается, но мне интересно нестандартное использование соцсетей, а не новость, что соцсеть заработала 1005000 денег. Что какой-то авторитетный для меня пост ссылается на два других — тоже. На один он может ссылаться как «рекомендую, качественный материал», на другой «полная чушь, автор не понимает что пишет»". Про такие семантические тонкости как сарказм или ирония, которые человек-то не всегда может распознать, я вообще молчу.

В общем не верю я в качественное ранжирование статистическими методами.
Что может сказать факт, что я прочитал (вернее провёл на странице какое-то время и скролил её) ваш пост и написал к нему комментарий без определения смысла этого комментария?

Данный факт говорит как минимум о том, что вы потратили часть своего невосполнимого жизненного ресурса — времени (или пусть будет внимания) — на чей-то пост. Ранжирующий алгоритм учтет также, что вы читатель не абы какой, а довольно высокорейтинговый. Т.е. ваше внимание предположительно стоит дороже. А еще можно анализировать ваше поведение — читаете ли вы все посты подряд и комментите их все, учитывать и величину, и соотношение этих чисел. Опять же интересно сравнение вашего поведения с поведением других пользователей с похожей величиной рейтинга, насколько вы типичны или отличаетесь. Я думаю из статистического анализа поведения (чтения, голосований, комментирований, занесения в избранное, в друзья, письма в личку) можно с неплохой вероятностью определять позитивные/негативные/нейтральные отношения между пользователями. И учитывать все это в алгоритме. Т. е. не обязательно иметь ИИ для определения смыслов. Смыслы не критично важны. Важно внимание и как им оперируют люди. Хотя я думаю из статистического анализа можно даже определять тональность комментариев.
Считаю, что главный недостаток статистических алгоритмов большое (и не могущее быть нулевым даже теоретически) количество ошибок первого рода — могут счесть интересный для меня пост неинтересным. Это, например, главный недостаток известных мне спам-фильтров. Толку от них, если всё равно приходится заглядывать в папку «Спам» :(

Мне кажется у спам-фильтров просто мало информации для анализа. В таких условиях любые алгоритмы ошибаться будут. И ИИ не спасет, и даже человека-секретаря посади почту разбирать и то не 100% качество фильтрации получится.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации