Как стать автором
Обновить

Комментарии 38

Это круто.
Но мне кажется Вы заблуждаетесь, считая, что добавление в избранное = полезности информации. Зачастую это просто невозможность прочитать статью в данный момент.
Ищём способ узнать, кто поставил минус ^_^
Ну а уж вычислять по айпи мы умеем
Конечно умеем =)
Осталось только найти способ набить…
Желательно — не вылезая из-за компа.
И прямо по протоколу TCP/IP.
Гарантированная доставка пакетов с пи*дюлями.
В качестве идеи, как это сделать.

Нужно регулярно собирать базу по всем пользователям хабра (которым доступно голосование) с информацией об остатке голосов. Дальше можно фиксировать время изменения собственной кармы и путем быстрого пересканирования найти, у кого изменился остаток голосов. Не однозначно, но их будет немного.

В каждой шутке есть доля шутки…
а как посмотреть сколько еще доступно голосов? :)
Эти данные напрямую закрыти. Можно попытаться сузить круг возможных людей

1) Сейчас голосовать можно от +15 кармы, полагаю таких наберется ~20%
2) Есть дата последнего появления на сайте. Можно исключить всех, кто не заходил
3) Есть текущая карма — ее голосов хватает на 1х изменение кармы, 1х голосование за топик и 2х — за комменты
4) Рейтинг увеличивается от участия в дискуссиях и со временем падает
5) Количество голосовавших за карму может быть велико, а карма — маленькая. Значит, были неоднозначные высказывания или публикации, то есть человек активно выражает персонально свое мнение, и вероятность его голосования растет.
6) Можно присмотреться к количеству друзей — вероятно совместное голосование.

Во такие идеи.
НЛО прилетело и опубликовало эту надпись здесь
У меня не получилось придумать способ это отследить. Так же не получилось «заменить» кнопку понизить карму наезжающей картинкой, style хабр не дает прописать, ни в один обычный тег. Он хорошо сделан. Поэтому что делать с кармой и голосованием очевидного решения или хака нет. Внесистемного способа как этот пост в голову не лезет.
В гугле надо «Обработка критических ошибок в PHP» взять в кавычки.
Я пробовал искать по полной фразе, но тогда намного меньше результатов, и при чем фильтруются действительные результаты. Почему, не знаю ответа.
Видимо Яндекс чаще индексирует Хабр.
Я буквально в начале января, когда ночью сидел и открыл Хабр (решил наверстать непрочитанное за праздники), увидел статью, опубликованную буквально несколько минут назад. Выделил название — Искать в Google — статья найдена! Хотя может и совпадение.
И не только в кавычки надо искать так:

«Обработка критических ошибок в PHP» inurl:habrahabr.ru/users/*/favorites/*
А для яндекса так

Обработка критических ошибок в PHP site:habrahabr.ru inurl:favorites
Sorry.
Fix!

Yandex: !(Обработка критических ошибок в PHP) site:habrahabr.ru inurl:favorites
Google: «Обработка критических ошибок в PHP» site:habrahabr.ru inurl:favorites
yandex вывел больше результатов
Ну, может быть надо еще учитывать что в Яндексе не получилось ввести этот параметр habrahabr.ru/users/*/favorites/*
Хотя судя по выдаче, хуже из-за этого не стало, там все равно фаворитные страницы вылезли.
Что-то я проверил первые штук 10 вывода яндекса — так там у половины людей нет моего поста в избранном. Хотя на поисковой выдаче он присутствует. Видимо это просто кеш, так что не особо действенный способ. Можно теперь написать скрипт, который будет обходить поисковую выдачу и уточнять результат.
Победила дружба.

image

image
НЛО прилетело и опубликовало эту надпись здесь
Почему никто не говорит про очевидное? :)) О том, что описанное в статье не соответствует реальным результатам из поисковиков?

По факту, работает совсем не показательно, если не сказать очень плохо, с очень малой долей найденного, если бы такой поиск действительно был обязан давать то, о чём автор пишет в статье. Куда случайно, видимо, поисковик забрёл, то и откладывается. Даже пример из статьи — у статьи 500+ добавлений в избранное, а Яндекс показывает 91, гугл говорит про примерно 650. Автор утверждает, что найденные страницы сравнялись в количестве, но где же здесь сравнение? Или
у нас разные интернеты?
Итак, пруфы:
копия ссылки для Гугла (от юзера webportal): «Результатов: примерно 669 (0,24 сек.)»
копия ссылки для Яндекса: «Нашлось 93 ответа»
Исследуемая статья: 513 добавлений в избранное на данный момент.

Вопрос: что мы получаем, что исследуем и почему в статье о неполноте данных ни слова?
Или это настолько КО, что не стоит упоминания? :)

Второе. Видим в ссылках мусорные параметры, которые получаем уже после поиска в адресной строке. Зачем? Кто так делает? Вы каждый раз будете вводить строки в Гугл в безопасном режиме, и плюсы вместо пробелов, и левые параметры? И показываете пример читателям? Или тоже очевидно, что плюсы вводить не надо?
Я, например, ввёл заголовок этой статьи в яндекс-поиск, не получил ничего и начал искать, почему так.

Оказалось, что ни плюсы, ни особые параметры ни при чём. Вот доказательство (смотрите, насколько короче и понятнее тексты ссылок):
Поиск Яндекса по короткой строке: те же 93 результата!

поиск в гугле с пробелами и без лишних параметров: Поиск Результатов: примерно 1 510 (0,36 сек.)
Смотрим, в чём дело. Оказалось, что если простые кавычки, то 1510 (или около того), если двойные угловые, которые записаны в URL строчками %C2%AB и %C2%BB (UTF-8?) — кликабельно, проверябельно — то 647 или около.
Ну и как с этим быть, чему верить?

Вопрос не праздный, потому что я быстро написал скрипт, который одним кликом делает просмотр избранного по алгоритму автора (рассчитывая «хоть иногда и не точно»), а оказалось " далеко не так точно, как описал автор.

Итог: автор описал идею, но преподносит как решение. По сути, вводя в заблуждение.

И при этом — 61 плюс в рейтинг! (Да, я и сам повёлся на текст и кликнул плюс :) ) 115 добавлений в избранное!
(На момент комментария)
===========================
С разгромом статьи закончили — теперь напишу правильный текст.
Поиск по поисковикам идёт, но они отыскивают от силы 20% (может больше, может меньше) искомых ссылок из избранного, и то не сразу, а по прошествии некоторого времени порядка дней и недель. Поэтому не рассчитывайте, что вы будете в реальном времени мониторить всех, кто добавил пост в избранное. В лучшем случае потом, попозже туда попадут некоторые пользователи, бОльшая часть их останется неизвестной. Но Гугл, если верить его цифрам (а верить не надо, глядя на 1500 для примера из статьи), через месяц индексирует примерно 80-90% ссылок. А может, в 3 раза меньше (?). (Вот пример начала января — habrahabr.ru/blogs/augmented_reality/135659/ ) Результаты Яндекса намного хуже, если верить его цифрам, и вообще, любые результаты надо воспринимать как есть и как предмет для критического осмысления. Чуть изменится алгоритм — и завтра будет всё по-другому.

Скрипт, который позволяет смотреть (неполный или сильно неполный) список добавивших в избранное.
HabrAjax версии 0.804 и выше (выложена, проверена, отлажена только что, 29.01.2012).
Работает, если включена настройка «поиск по Гуглу и Яндексу по сайту». Если в поле поиска ничего не вводить, то читается заголовок статьи и ищется простым кликом на нужной кнопке поиска (их там 3 в этом режиме). Результаты заместят страницу статьи. Если удерживать Ctrl или Shift, результаты откроются в новом окне, не стирая читаемую страницу.
(… Как раз был вопрос, что делать, если забыли заполнить поле поиска.)
Действует в версии скрипта HabrAjax 0.804 и выше.

Но осторожно, радоваться рано — в заголовках попадаются особые символы — неразрывные пробелы, кавычки и другие, и неизвестно, как он с ними себя (вместе с поисковиками) поведёт.

(Поставил простые кавычки, а не UTF-8 и исправил некоторые возможные конфликты данных — nbsp, quot. В остальном скрипт, конечно, требует исследований и доработок в дальнейшем. Пробуйте, отчётливо понимая, что он делает, а что не делает.)

Если с написанным согласны и другие видят то же самое, что и я, предлагаю обсуждать это.
Да, действительно сам заметил, что не соответствует. Там не было понятно поначалу.
Я ничего не хотел преподносить как готовое решение, просто я смекнул что я хочу узнать кто добавлял, пускай даже из кеша. Накидал примерно грамотное решение, потом его улучшили.

А ваш комментарий классный, очень хорошо дополняет правильное решение поставленной проблемы.
Не хотели, но звучит как готовое решение. Вот основные фразы из статьи:
«Простой способ узнать, кто добавил твой пост в избранное»

Пришлось задать вопросы иначе. Самое удивительное, он смог ответить и даже вполне внятно, хоть иногда и не точно.

Вот посмотрите — звучит, как будто Вы нашли решение увидеть всех, кто добавил пост в избранное, лишь «иногда и не точно». (Мне тоже так показалось по словам из статьи, поэтому сразу сделал инструмент, чтобы не вбивать заголовки вручную, благо, всё было уже заготовлено для поиска по сайту, а он совсем не так работает, как заявлено у Вас. И даже не проверил утверждение "После этого улучшения количество найденных страниц сравнялось." 650 и 93 — где оно сравнялось? И 650 — больше, чем число реальных добавлений.)

Возможно, Гугл почему-то преувеличивает число точного найденного в 3 раза, и число перед написанием статьи было что-то около 500 и это привело к неправильным утверждениям?
ну все, я совершил великое святотатство :-). Но идея, то хорошая и нигде не описанная? С этим вы согласитесь, то что она была не отлажена, ну все в мире получается не сразу же, я сам ошибался вначале когда писал, а те кто поняли весь смысл сами смекнули доделали и начали применять для себя. Как я должен был писать? «Посмотрите какая идея...» и дальше легал полиси БаЛЬШИМИ буквами (отказываюсь от ответственности)?

Кроме того пост-то править не хорошо после, поэтому я пишу к нему патчи, и вы тоже с ним помогли. (UPD3)
Ну, для меня Вы заставили потратить ещё 2 часа на разбор, почему это не работает, как описано. А вначале хотел написать несколько строчек благодарности за хорошую подсказку :).
Сейчас бы я на Вашем месте переписал заголовок статьи в связи с новыми данными. Главное, что она не говорит, что не показывает всех добавивших, да и тех показывает очень неспешно. Кто сказал, что неправильно написанная статья должна быть навсегда в камне вырублена в истории? Памятники тоже сносят :).
А дохождение до результатов — да, отличный пример краудсорсинга.

Кстати, если бы избранное попало в ведение робота «Яндекс-блоги», обновление было бы гораздо чаще. У них там свой расширенный поиск. Но для этого не хватает представления избранного как RSS, по правилам блогов Яндекса: blogs.yandex.ru/add.xml

От разработчиков Хабра нужно такое:
habrahabr.ru/rss/users-favorites/<имя_пользователя> и, видимо, общий список, чтобы дать ссылку Яндексу: habrahabr.ru/rss/users-favorites/
поиск действительно был обязан давать то, о чём автор пишет в статье.

На самом деле, поиск с этой задачей справляется вполне неплохо, если правильно строить поисковый запрос. Хотя, данные для крупных сайтов могут быть неполные, а для сайтов редкообновляемых, поиск будет отдавать результаты (двух)недельной.

поиск в гугле с пробелами и без лишних параметров: Поиск Результатов: примерно 1 510 (0,36 сек.)
Смотрим, в чём дело. Оказалось, что если простые кавычки, то 1510 (или около того), если двойные угловые, которые записаны в URL строчками %C2%AB и %C2%BB (UTF-8?) — кликабельно, проверябельно — то 647 или около.
Ну и как с этим быть, чему верить?

Для Гугла:
"I have a dream" — the exact phrase I have a dream

Для Яндекса:
"К нам на утренний рассол" — Слова идут подряд в точной форме


Верить надо кавычкам "

У Гугла кавычки » из поиска вырезаются. Приведу пример, чтобы было нагляднее:

image

image

Результат иногда может меняться из-за особенностей поиска Гугла на несколько результатов, но можно увидеть, что поиск отдает одни и теже документы. Различными иногда будут только сниппеты.

А вот у Яндекса, наоборот, кавычки » преобразуются в ":

image

image

Результатов «без лишних параметров» у вас получилось много, т.к. часть из них влияет на настройки поиска. Например, будет ли Гугл скрывать похожие результаты (дубли страниц).
У Гугла кавычки » из поиска вырезаются

А, вот оно что с Гугулом и угловыми кавычками. Значит, действительно, правильный запрос — с обычными кавычками. Но почему в моих запросах было с угловыми — 650, а с простыми %22 (точная фраза) — 1500 — непонятно. 1500, если статей — 512.
Оказывается, Гугл может очень некорректно подсчитывать кол-во найденных результатов. Запрос:

image

Переходим в найденном на вторую страницу:

image

У меня 50 рез-тов на странице, получилось всего две страницы.

Т.е. на первой странице он прикинул, что результатов около 1990, когда его попросили показать вторую (и последнюю) страницу выдачи, он решил, что результатов все таки 91 :)
$Q = 'site:habrahabr.ru inurl:comments nForce «27 апреля 2011, 22:48»'
chromium www.google.com/search?q=$Q

только с экранированием надо разобраться
Несколько лет назад просил хабраадминистрацию сделать соответствующий функционал, но на тот момент мало кому это было интересно и функционала не появилось. А было бы прикольно :)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории