Как стать автором
Обновить

Комментарии 29

Уточню - по запросу администраторов блог-хостинга.
Потому что им придётся кое-что у себя сделать.
foaf?

А вообще - молодцы. :(
1. Да. Вливайтесь.
2. Почему ":("?
1. Не вопрос. Из отпуска вернусь - прикрутим, в апреле-мае.
2. Потому что я свой такой хочу хотел, хочу и буду хотеть.
Ты лучше скажи, когда с этого поиска трафик пойдёт? Мне на beon.ru больше 3-х человек в день не приходит с поиска по блогам. Неужели поиск по блогам так непопулярен? По пропорции количества постов beon-а и ЖЖ, выходит что второй получает 3х52855/1067 - 150 переходов в день!

Можно прикрутить для вас и foaf и кучу всего другого. Но зачем на это тратить время программеров, если оно не даёт никакой отдачи? Вы уже год индексируете фиды моих проектов, но я так и не понял зачем мне это надо... Может моим юзерам польза от этого есть? Просветите меня тёмного...

Кроме того в рейтингах совершенно не учитывается специфика блогхостингов. На одних блогхостингах люди часто ссылаются на других юзеров, на других это не принято, на третих народ через SMS пишет и вообще ни на кого не ссылается и т.д. И выходит, что рейтинг заточен под ЖЖ, а все остальные курят в сторонке.

В чём я вижу огромнейшую проблему Яндекса - отсутствие обратной связи с интернетом. Это какая-то виртуальная компания, производящая виртуальные сервисы вроде поиска по блогам. Это смешно звучит. Но как только попробуешь пообщаться с яндексойдом, то сразу это понимаешь.
Давай считать, что тебе - никогда, ок?

Мне кажется, так проще будет.
Именно про это я написал выше. Обратной связи нет. И ты сейчас это продемонстрировал.

Яндексойд живёт только Яндексом, не замечая ничего и никого вокруг. В окружающую среду он испускает только ПЕАР своей компании. Он едет на Мальдивы и как истинный раб брэнда втыкает там флажок с надписью свой компании. Яндекс и только Яндекс.

P.S.
Начните сканировать книжки, как Гугл, и ПЕАРится будет проще.
Мы работаем для пользователей, а не для веб-мастеров.
Демонстрация отсутствия обратной связи номер два.

Именно из-за этого тотального игнора окружающего мира, сейчас пол Рунета обвешано продажными ссылками и веб-мастера зарабатывают на создании сайтов для продажи ссылок на них, вместо создания нормальных сайтов. Ну разве не бред? Вот юзерам от этого польза то! Сразу видно, что это Яндекс над этим полезным пользователям проектом поработал. Гуглу до таких масштабов далеко...
Начали уже давно: http://company.yandex.ru/news/2006/0901/…

Сколько уже можно обвинять других в том, что они вам чего-то недодали?
Столько, сколько ты кормишь меня завтраками. Не более.
Завтраки чего? Беон в рейтиге.
лталк ты уже несколько месяцев не можешь в рейтинг добавить, хотя обещал это сделать "завтра".
Может от контента зависит?
На некоторые блоги, по которым я смотрел статистику, приходит иногда больше 6 человек в день. То есть один блог в два раза популярнее вашей площадки. Круто, правда? ;)
Расскажите это Кукуцу. Я это знаю, потому и написал.

Его поисковик считает, что контент в ЖЖ более качественный и информативный. Я и не спорю. Так оно и есть. Разные люди всё таки в ЖЖ и на beon.ru . По возрасту особенно. У меня - школьники. В ЖЖ - студенты и старше.

Просто удивляет цифра 3. 300 я бы ещё понял, но 3... Такое ощущение, что поиском по блогам пользуются только гики от 20 лет и старше.

Я потому и задаюсь вопросом - в чём причина такого странного ранжирования. И ответ мне видится в том, что в алгоритме совершенно не учитываются особенности каждого отдельного блог-хостинга. Яркий пример отличий: в ЖЖ люди часто друг на друга ссылаются. У меня это редкость, особенно если это запись, а не коммент к ней. На Хабре в комментах вообще сослаться на юзера нельзя - только явно ссылку поставить можно.
Давайте так попробуем: какие инструменты ранжирования предлагаете?
Критериев масса. Вот что приходит в голову на вскидку. Время между постингами, их размер и колебания этого размера во времени (можно выделить стадии развития блога - зарождение, развитие, угасания интереса к блогу и его смерть. а так же тип юзера - "постоянный блогер", "мимо проходил и написал", "сейчас интересно, а через месяц заброшу" ) , количество комментов и активность комментаторов (интервалы между комментами, число уникальных комментаторов), время существования блога, тематика блога и её изменчивость со временем (посты на одну и ту же тему или каждый раз о чём-то новом), соответствие времени реальных событий и времени описания события их в блоге (не сложно отследить время выхода фильма на экран, дату политического события и посмотреть, когда про это пишет тот или иной автор и, например, присвоить ему бонус за своевременность постинга), соответствие тагов тематике поста и есть ли тематическая близость к другим постам с такими же тагами и т.д.

Можно ещё кучу всего придумать, подумав над тем, как и о чём пишут люди.

Кроме того совершенно убивает навязанная разработчиками дефолтная сортировка по дате, ухудшающая выдачу. Она полезна только при поиске новых ссылок в блогах на какой-то сайт. Кто ищет _новые_ мнения? Я например иногда ищу отзывы о фильме и мне всёравно когда их писали. Мне нужны отзывы просмотревших, чтобы решить - идти или нет. А они не меняются со временем. Если фильм хороший, то и отзывы будут хорошим в любой день: вчера, сегодня и завтра. ИМХО сортировка по дефолту должна быть по критерию, учитывающему одновременно и релевантность, и время постинга. Или для одних запросов - по релевантности, а для других - по времени.
Не понимаю, как время, разер и колебания записей влияют на их качество, интересность. Ну пишу я мало и редко — не может быть интересно? Фотографии, например, размещаю — всё, вниз? :)

Комментарии могут быть отключены. Есть посты, где автор призывает к обсуждению, а есть — к которым нечего написать. (Кстати, вы думаете, с комментариями дела вашей площадки относительно ЖЖ изменятся? Что-то сомневаюсь :) ). Время существования — ну есть у кого-то блог уже 5 лет, никто не читает, не ссылается. Что с этого? Тематика ещё хуже: если пишешь на разные темы, значит плохо пишешь?

По-моему, ни одного нормального критерия, который мог бы быть адекватной замене индексу цитирования, вы не придумали.
А почему Вы решили, что эти критерии должны именно понижать блог? Вы просили инструменты ранжирования, а не понижения. Да и задача у поиска не понизить миллион блогов, а скорее повысить единицы по какому-то запросу.

Большинство моих критерием легко считаются. Пофантазировав можно ещё несколько критериев придумать. Далее берётся статистика по кликам в выдаче и смотрится какими свойствами обладают те блоги, по которым чаще всего кликали. При этом легко посчитать, какой клик привёл юзера к тому, что он искал, а какой нет. На выходе имеем информацию о том, какие критерии в лучшую или худшую сторону влияют на выдачу. Т.е. юзеры сами голосуют за интересные блоги своими кликами.
Я написал примеры, когда ваши критерии будут работать плохо. Примера, когда индекс цитирования работает плохо, придумать не могу. Что мелкие площадки оказываются в пролёте, мне видится достоинством, а не недостатком.
Так я же написал, что критериев можно выдумать много, но узнать какие из них реально оказывают влияние на качество выдачи можно посредством экспериментов.

Легко придумать как отделить сплоги от блогов, ибо имитировать человека сложно. А вот выделить из блогов те, которые ищет в данный момент юзер - сложнее. Должна быть обратная связь и только на её основе можно сделать качественный поиск.
Думаю, сортировка обусловлена самой сущностью блога. Первая же строчка:
A blog is a user-generated website where entries are made in journal style and displayed in a reverse chronological order.

http://en.wikipedia.org/wiki/Blog

Вот сколько поиском по блогам пользуюсь, ни разу «по релевантности» не сортировал ;)
Каждом своё. Мне удобнее искать мнения вообще, а не последние мнения. Кроме того, сильно зависит от того, что именно ищешь.
ЖЖ получает не 150 переходов с blogs.yandex.ru в день, а примерно на пару порядков больше

У ЛИ.ру переходов с blogs.yandex.ru также более 10 тысяч в день - http://www.liveinternet.ru/stat/liveinte…

Так что сервис работает, им пользуются люди, он приносит реальный траффик проектам с большой аудиторией и большим объемом UGC.
Поясните откуда такой дисбаланс? 10000 переходов и 3.
тут http://blogs.yandex.ru/services/ сейчас показывает 1354 постинга в сутки. Ли - 36072. Т.е. в 26 раз больше. При этом 10000 и 3 отличаются более, чем в 26 раз.
Наверное, значимо не только количество постов, но и качество их контента и соответствие этого контента запросам пользователей ПБЯ.

Конечно, надо еще учитывать, что и ЖЖ, и ЛИ.ру помимо трафика из собственно Поиска по Блогам получают переходы из рейтинга блоггеров и Популярных записей
Супер! Это то чего мне давно не хватало. Иногда что-то увидишь в френдленте полезное, а потом не можешь найти, т.к. не помнишь кто писал.
НЛО прилетело и опубликовало эту надпись здесь
И вы найдёте последнее, что гугль проиндексировал по этому адресу. Обычно это состояние страницы в случайный день за последний месяц. Какая от этого польза?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации