Pull to refresh

Comments 146

На пару дней бы пораньше. Но всё равно отлично.
кажется вовремя
«Лучше поздно, чем никогда.» почему-то вспомнилось.
Своевременно, скажем так.
не понял вас.
у меня не так?
У вас по каждому хеш-тегу отдельно. Информация идет по разным тегам. Нужна ссылка на поиск с OR по всем (наиболее популярным) тегам ИМХО.
не знаю, целесобразно ли. Это сейчас так, что все тренды на 1 и туже тему, а что будет когда они будут на разные?
Ну их однозначно заспамят. Не знаю как с этим бороться. Может добавлять «вес» твитам. Скажем с фото, видео — имеют больший вес.
У спам ботов мало фоловеров. Сделайте «вес» твита пропорционально числу фоловеров.
Отнюдь. Открываем тег #ЧП и смотрим количество фолловеров первых попавшихся ботов: @gibohelok — 488, @cyniravu — 894, @xasuges — 982. Реально три первых попавшихся бота. Или это у одного меня количество фолловеров меньше сотни и я считаю это нормальным?
Что я могу сказать. С той стороны баррикад тоже не дремлют.
Не сказал бы. Видели и 1000, и 10000 и 100000.
а что искать — приснится!
Да, это я так его называю. Своя какая-то привычка.
Ещё бы они в топ не вышли. Их же так активно спамили…
Похоже, спам-ботам стало легче работать.
Пользуйтесь для поиска по twitter'у topsy.com, у них сделано грамотное ранжирование, так что спама не бывает в топе.
Ещё бы выпилить из твиттера как-нибудь тех, которые теги засирают…
Это в планах. Очень много ботов берут и срут одним хештегом 100 твитов. Просто пока времени не хватило выпилить это
В основном это «twitterfeed» и «dlvr.it» спам-боты.
я их исключаю, однако в твиттер поиске вы их видите
Извините. Просто еще сорцы не смотрел, поэтому не знаю, что там и как.
Можно «10 мин» сделать подчеркнутой пунктиром ссылкой и чтобы по нажатию выпадал список «10 мин», «30 мин», «1 час» и т.д. на ваше усмотрение.
о, спасибо. отличная идея, сделаем
Может теги все в строчные переводить?
Ну и, транслитерацию применить к латинским?
да, я думаю над этим. Пока есть дублирование
Пожалуйста, расскажите, как и откуда берутся русские тренды твиттера.
Вы можете посмотреть код: github.com/babi4/TwiTrends
Если вкратце: настраивается поиск по твиттер стриму по наиболее популярным русским словам. Далее, парсятся найденные твиты на присутствие в них хештегов, а потом сортируется по наиболее упоминаемым за 10 минут, которые вы уже и видите на сайте
А ретвиты учитываются?
добавь ещё больше мата в код :)))
куда уж больше :)
Из такого поиска, к сожалению, выпадут твиты, содержащие только хэш-тег и ссылки. Таких немало.
твиты только с ссылкой или только с хештегом чаще всего спамерские и не имеют какого-то смысла.
Вы проверяли и подсчитывали или просто предполагаете?
Да, расскажите, на чем делали, как делали, алгоритм в общем описании.
Вот за что я люблю Хабр — даже самую политическую тему сведут к разговорам о сырцах, алгоритмах и реализации. =)
Вопрос не праздный и с политической точки зрения. Иначе как без алгоритма понять, можно ли доверять рейтингу? :)
Наоборот, (лично мне) удивительно, как сравнительно простые алгоритмы и методики находят свое прикладное применение.
если задачу можно решить просто, то почему бы и нет?
Этот сервис просто выполняет свою функцию, конечно без каких-то особых изысков
Тут изыски и не нужны.
А где Вы взяли такой классный набор слов-исключений? )))
Это не исключения, это слова для поиска.
Слова из частотного словаря русского языка dict.ruslang.ru/freq.php а маты, я на всякий добавил :)
А поиск по Твиттеру осуществляется через Search API обычный или Streaming?
А почему выбрали именно Stream?
другого адекватного способа нет
А почему не обычный Search API?
потому-что через search api нельзя всех русских пользователей определить.
можно например twitter.com/#!/search/*%20lang%3Aru но туда твитов в раз 5 попадает меньше, чем есть реально.
Автообновление страницы через 10 минут присутствует?
<meta http-equiv="refresh" content="600" />

?
скоро по нормальному сделаем
А технически возможно делать сортировку только по популярным твитам?
не понял вас. в чем проблема?
Что бы не читать все спамерские твиты, а например только от пользователе с 500+ подписчиков или только те, которые ретвитят.
Просто перешел по тегу 6дек, да там ничего по теме не найдешь.
это можно. но все-равно в поиске твиттера они будут отображаться.

Единственной панацеей я вижу — отображать тренды у меня на сайте, исключая ботов
популярные твиты есть на tjournal.ru
да, ребята молодцы
Ребята, сейчас боты завалили спамом эти теги. Перейти на другие тэги или как-то можно изолировать ботов? Было бы здорово, если бы из twitter-а кто-нибудь помог бороться с ботами. Актуальной информации не хватает. LJ из России закрыли. Смотреть через прокси.
У меня доступен. Эртелеком. НН.
чтобы читать теги нормально, надо искать сразу пару тегов, напримр "#6дек #чп"
ЖЖ тормозит нереально, перед выборами началось и до сих пор не закончилось.
Дронов писал сегодня посреди дня, что само по себе оно живое. Юзайте прокси или как временный паллиатив — турбо-режим Оперы.

У меня лично режется на первом же хопе после линка до Ростелекома. Спасает VPN в Штатах, крутящаяся на TinyVZ.
Как идея на будущее: Сделайте приложение, а лучше виджет для мобильных ОС где будут показываться эти теги и автообновляться каждые 10 секунд. Ну или обновляться по нажатию на кнопку, это уже не так важно. Сам факт, что мне был бы полезен такой виджет на телефоне.
Твиттерянам на заметку, the.tj — тренды русского твиттера.
А кто-нибудь знает, как в результатах поиска твиттера исключить дублирующиеся записи?
Это должно было случиться ;) Самое интересное ещё впереди)
Насколько в твиттере эффективно «Пожаловаться на спам»?
Не вмещаюсь в формат 140 исволов, поэтому твиттер для меня — новинка.
Ровно настолько, насколько это эффективно в других социальных сетях.
Это пропадает с течением времени (у меня через полторы недели). Помогает четко, быстро и кратко формулировать мысли.
Надеюсь российские твиттер тренды погут людям понимать, что на самом деле происходит как в Москве, так и в России в целом.

Надеюсь, Вы всерьез не думаете, что выборка из твитера сколь нибудь репрезентативна даже на Москву, не говоря уже о России в целом!
я всерьез думаю что презентативна как для Москвы так и для России.
Другое дело, что к сожалению, многие хештеги засираются ботами и полезная инфа резко уменьшается.
Пользователи твиттера — это почти на 100% одна вполне ярко выраженная социальная группа со своей ярко выраженной позицией. Или вы реально верите, что в твиттере много пенсионеров, бюджетников и тому подобного?

Да ради бога, в твиттере даже процента от населения нашей страны не наберется. Что тут может быть репрезентативного?
даешь каждому бюджетнику и пенсионеру по твиттеру!
Это прекрасная идея на самом деле. Но слабореализуемая.
Просто реализма — клиент в сотовый. Но зачем бабушке Твитер?

Ну как же? А соседям кости поперемывать с другими бабушками?


У бабушек редко бывают сотовые в которые можно воткнуть адекватный и легкоиспользуемый клиент для твиттера.
Съелся тэг irony, сорри ;)
Тоже самое. Парсер, видимо, сегодня покормить забыли.
Осторожно! Злой парсер!
Семёновна! Семёёёновна! Ты до сих пор твитишь? Пенсию получила?
От молодежь-то пошла испорченная. Не ретвитят, хэштеги не ставят… Вот в наше время…
Тут оно ни к чему… Разве что, забыл приписать "@BabushkaSemen".
Сам телефон с механизмом SMS — легкомспользуемый клиент для твитора.
Ограничение в 140 символов — оно неспроста ;)
Твиттер, если не ошибаюсь, поддерживает только Билайн.
Так расскажите знакомым бюджетникам и пенсионерам.
Множество пользователей Твитера и Россиян весьма разнятся.
Твитер в большинстве фрондерствуещее студенчество и офисный планктон.
Вы сами еще достаточно молоды поэтому не осознаете, что реальная жизнь по эту сторону экрана. И не на флешмобах, а в троллейбусах и очередях. Процент бабушек, дальнобойщиков или военных твитящих свою жизнь ничтожен.
UFO just landed and posted this here
Меня тошнит от подобной дешёвой манипуляции.
Ссылку на блог Старикова забыли поставить.
Спасибо! Вы помогли мне понять, что на самом деле происходит как в Москве, так и в России в целом.
Сейчас по этим тегам активно идет спам ботами. Известные всем силы пытаются заблокировать оперативный доступ к информации об акциях протеста.
Серьезно??? Массовые акции народного негодования?
ссылочки с фото видео. Я искренне надеялся что из России Ливию не замутить. Но если не прав надо думать, о минимизации рисков!
А вы почитайте по топовым хеш-тегам. до того как спам начался. Если коротко: Сейчас Навального судят в кутузке. Также по твиттеру зазывали на митинги.
Зазывать будут! Но пойдет — целевая аудитория Твитера :)
Это не так страшно…
Я в 2 раза тебя старше, но я уже ушел. Не люблю хамов.
Заметьте, я таки на «Вы» обратился. А Вы сочли возможным тыкать с первого же сообщения =)
В интернете чаще всего все общаются именно на ты, даже 16-летние подростки с 50-летними взрослыми людьми. И это не признак неуважения, а всего лишь особенности интернет-жизни, общение на равных, а не игра в «задавалки». Тогда как «вы» чаще всего подчеркивает дистанцию между собеседниками и звучит уничижительно. На «вы» в интернете обращаются часто тогда, когда хотят написать что-то неприятное. Например, пишут: «Вы, уважаемый», «Вы, господин», «А вы, товарищ», хотя ни уважаемым, ни господином ни, уж тем более, товарищем собеседника не считают

Обращение Вы уместно в личной переписке, а не в чате. nature.web.ru/db/msg.html?mid=1187746

Я хочу посмотреть, как Вы обратитесь на «ты» к кому-нибудь на тематической конференции.
Не нужно путать сарказм с банальной вежливостью.
«Уйдите, сэр Кремлядь.» — это как минимум небанальная вежливость ;)
Я жирный тролль, но ни разу не Кремлядь.
В сортах говна не разбираюсь, простите.
Опять хамишь… Ну да ладно, чатиться с тобою (или уж если Вам будет угодно, Вами) я не собираюсь.
А ты\Вы пойми(те) одно. Понимание того, что в розетку не надо совать два гвоздя одновременно приходит с опытом. Когда мне было 20 лет, я проходил все эти митинги и акции — стало только хуже. Так что мой троллинг вашего энтузиазма не от любви к ВВП и ДАМ, а от моего опыта.
Это не хамство, это констатация факта. В моей системе координат порядок вещей устроен так, что для меня одинаково мудаками являются и толстые тролли, и кремляди.

Если же Вам персонально стало только хуже — это персонально Ваша вина, и ничья иная.
Не персонально мне, а всей стране в среднем.
image
Это график ВВП на душу СССР(России) к США.
Суперски рад за график.

Только вот я знаю, что с учетом инфляции, моя мать, к примеру, сейчас зарабатывает в школе меньше, чем она зарабатывала двенадцать лет назад, до прихода Пу, при том, что чисто количественно её зарплата выросла с тех пор примерно на 3\4.

Уходите, прошу Вас — нежели Хабр, для Вас гораздо более приятным для дискуссий местом будет блог кого-нибудь вроде Старикова.
Действительно — Хабр не место для полит-дебатов :)
www.youtube.com/watch?v=AJx1UC48HDs
Смотрите на здоровье.
Такой тролль, а еще в преподавателях? И чему же учат такие товарищи, как вы, неокрепшие умы?
Боюсь, скрипт не отражает действительности.
#navalny сейчас наверняка во много раз популярнее какого-то там #чп
это изза ботов.
Скоро буду их отсекать
UFO just landed and posted this here
как бы скоро не превратилось в «чрезвычайное положение» ;)
тоже какое-то время там держал, но он часто глючил…
а это заморочки с twitterstream. Иногда, просто теряется коннект. Я с саппортом связывался, они говорят что знают об этой проблеме, скоро сделают. Скоро сделать они должны полгода как уже.

Я добавля переподключения, будет лучше.
Боты совсем опримитивились:

VasyaPupkin вася

<жаргонное название оппозиционеров> <совершили некие пассивные действия сексуального характера> <представителям неких провластных движений> на [Триумфальной площади|Триумфалке] <оскорбительное прозвище> #выборы #чп
Ммм… На мой взгляд, спорный вопрос необходимости этого.
Я читаю то, что мне* интересно, а не то, о чём пишет большинство в России.
разное время, разные тренда
Я имел ввиду предпочтения аудитории твиттера
это просто такое время сейчас. И боты, которые постят и ретвитят эти анекдоты и приколы. Скоро их отсеку, будет лучше
Я думаю нужно блочить 1 к 1 одинаковые твиты, наподобии b23.ru/3i7x
«Чтобы» пишется слитно.
«Что бы пишеться вместе» — неправильный вариант.
Хабр все еще торт, #СПАСИБОПУТИНУЗАЭТО
Хм… сколько разработчиков, столько мнений?

Есть такой древний сервис — twitwave.ru/ и странно то, что ТОПы на 2-х сайтах расходятся. У twitwave в БД уже больше 10 млн. твитов — и у каждого есть абсолютные цифры, которым можно верить.

Не совсем понятно почему у вас идут только хэштеги, сам твиттер давно индексирует слова и предложения.
Ой, а бревно то я и не заметил — все ссылки ведут на twitwave.ru :) Собственно а в чём ценность вашего сервиса, другая морда к twitwave? Кстати неплохо бы упомянуть это в статье.
прочитайте мой коммент ниже. ошибся чуть.

А все ссылки да, на twitwave, но это пока.
Я то думаю откуда такой трафик попёр…
Я пару дней назад добавил ссылки. Просто через twitter search не удобно смотреть, с twitwave как-то получше)
у каждого?
Извините, а где вы на trends.babi4.com увидели абсолютный показатель? Там только цифра за 10 минут.

>>Не совсем понятно почему у вас идут только хэштеги, сам твиттер давно индексирует слова и предложения.
Это совсем не просто сделать. Сервис был сделан на скорую руку. Возможно, скоро добавлю этот функционал.
Ну тогда правильно название статьи — «Топ русских хештегов за прошедшие 10 минут».
Пишите пожалуйста сами статьи с правильными названиями.
Хотя конечно за совет спасибо.
Sign up to leave a comment.

Articles