Как стать автором
Обновить
1
0
Игорь Петров @zooom

Пользователь

Отправить сообщение

Рекомендательные системы: перепросмотр

Время на прочтение6 мин
Количество просмотров2.5K
Примечание: ниже перевод статьи «Rethinking Recommendation Engines» от Alex Iskold (знаменитого своими исследованиями в области экономики внимания и теоретических основ механизма социальных сетей), в которой автор рассматривает текущие рекомендательные системы и пытается предсказать, что ждет их в будущем (фактически, предлагает радикальный способ по их улучшению).

NeflixБолее двух лет назад Netflix анонсировал соревнование по движку рекомендаций: любой, кто изобретает алгоритм, позволяющий улучшить качество их рекомендательной системы не менее, чем на 10%, выигрывал один миллион долларов. Многие исследовательские группы с энтузиазмом взялись за дело, воодушевленные количеством доступной для анализа информации. В самом начале был достигнут некоторый прогресс, но затем он затормозился, и сейчас исследователи остановились в районе улучшения примерно на 8,5%.

В этом посте мы разберем, почему улучшения рекомендательного движка является не алгоритмической проблемой, а, скорее, вопросом представления. Переосмысление рекомендаций как фильтров и их применение без ориентации на высокий конечный результат, по-видимому, скорее приведет к успеху, чем более быстрое «перемалывание» (crunching) данных.
Читать дальше →
Всего голосов 30: ↑27 и ↓3+24
Комментарии25

Доступ к рабочему столу получить очень легко

Время на прочтение1 мин
Количество просмотров7.1K
Иногда возникает такая ситуация: ты объясняешь кому-то, как что-нибудь делать на компьютере. Например, человек не умеет настраивать какую-нибудь программу и звонит тебе, чтобы ты помог. Или вдруг у друга, который мало понимает в компьютерах, вылезло какое-то окошко, и он просит тебя помочь. Если у вас были подобные ситуации, то вы представляете, насколько сложно объяснять по телефону (или даже по аське Gtalk) последовательность действий. И вы не помните, что и как должно быть, и начинаете поэтому воспроизводить действия у себя на компьютере, да и собеседник иногда толком ничего не может объяснить.

Конечно же, решение данной проблемы уже давным-давно нашли. Это просто удалённое управление компьютером. Данные программы даже встроены в новейшие операционные системы. Хотя можно поставить и решения на основе VNC: например, популярную бесплатную программу UltraVNC.

Подключится к компьютеру с помощью данных решений легко, особенно, если они находятся в одной локальной сети. Но… будем считать этот случай идеальным. А вот в реальности (что происходит, например, постоянно у меня) люди обычно сидят за NAT, файрволом и т.п. Поэтому хоть и можно получить IP-адрес, но ведь нужно ещё и порты настроить. Думаю, что только объяснение всего этого займёт в разы больше времени, чем решение самой проблемы. Не надо забывать, что не все знают, что такое IP и порты.

И даже для этих случаев придумали отличное решение: TeamViewer. О нём-то я немного и расскажу.

Читать далее →
Всего голосов 56: ↑53 и ↓3+50
Комментарии88

Зарядка для глаз

Время на прочтение1 мин
Количество просмотров23K
Хотел я написать взывающий к разуму ИТ-шника пост о вреде долгосидения перед компьютером и важности зарядки для глаз, но не буду. Просто вот так:

Не будешь делать зарядку — потеряешь зрение через несколько лет!


Ниже написано то, что надо делать. Зарядка отнимает 5-7 минут ежедневной жизни, но зато существенно понижает вероятность нужды в очках.
Читать дальше →
Всего голосов 91: ↑80 и ↓11+69
Комментарии120

Хороши ли Яндекс.Фотки?

Время на прочтение1 мин
Количество просмотров5.3K
Меня зовут Иван Матвеев и я руководитель сервиса Яндекс.Фотки. Уверен, что многие из вас о нём знают или даже используют (если кто не знает — это то, что кратко можно описать как «бесплатный безлимитный фотохостинг с функциями общения»).

Нашему сервису недавно исполнился год, за который у нас накопилось 42 терабайта фоток. Всё это время наши разработчики работали над Фотками не покладая рук, в частности, за последнее время мы запустили ненакручиваемую голосовалку (по мотивам постинга Димы Смирнова) и слайд-шоу.

Мне бы хотелось спросить у всех, кто пользуется или пробовал пользоваться Яндекс.Фотками: что вам нравится/не нравится на сервисе, что удобно/не удобно, чего не хватает, с какими багами или проблемами вы сталкивались?

А мы, в свою очередь, постараемся баги исправить, а недостающие возможности аккуратно записать в молескин список будущих дел :)
Всего голосов 112: ↑100 и ↓12+88
Комментарии406

Mail.ru на первом месте, «Одноклассники» обогнали «Рамблер»

Время на прочтение1 мин
Количество просмотров1.2K
На конференции «Интернет и бизнес 2008» компания TNS Gallup Media опубликовала статистику по всероссийской аудитории интернет-сайтов (презентация Руслана Тагиева в формате PPT). На сегодняшний день это самые объективные и свежие данные по охвату аудитории шестью крупнейшими интернет-ресурсами России.


В таблице указан охват аудитории за март 2008 года в млн человек.


Россия

Москва

дневной недельный месячный дневной недельный месячный
Mail.ru 5,85 10,43 13,5 2,064 3,386 4,166
Яндекс 5,56 10,52 13,55 2,117 3,621 4,355
Одноклассники.ру 3,74 7,16 9,52 1,68 2,93 3,6
Rambler 2,77 5,85 8,73 1,05 2,08 3,08
Livejournal 0,7 2,39 5,02 0,45 1,27 2,5
Liveinternet 0,53 1,73 4 0,29 0,81 1,76



Читать дальше →
Всего голосов 39: ↑32 и ↓7+25
Комментарии106

Памятка для SEO оптимизаторов

Время на прочтение1 мин
Количество просмотров1.9K
Вот решил поделиться некоторым материалом, который сам составил в ходе экспресс-изучения SEO оптимизации и раскрутки сайтов. Просто попался видео-курс Юсуфа Губайдуллина, который продает его на promoguide.ru и решил воспользоваться случаем. Честно говоря, курс не понравился — нудно как-то рассказывается. Оценил содержание на 4 с минусом, а изложение — на 2 с плюсом. Само SEO весьма скучная вещь, но нужная, поэтому составил небольшую памятку для себя — чтобы не держать это в голове и легко вспомнить когда понадобится. Здесь два файла: первый — просто картинка, второй — в формате freemind, для тех, кто желает что-то для себя добавить.

SEO-карта
Читать дальше →
Всего голосов 97: ↑88 и ↓9+79
Комментарии81

Endeavour отправляется на орбиту!

Время на прочтение1 мин
Количество просмотров573
Эндевеар отправляется на орбиту

Как мы знаем, недавно, Американский шатл Эндевер отправился на орбиту. Технокрасота — доступная немногим, теперь доступна и нам с веком высоких технологий. Не ругайте, что не по теме, но это
должен видеть каждый хабрачеловек.

Видео

Источник
Всего голосов 52: ↑48 и ↓4+44
Комментарии58

Частоты, способные взорвать атомную бомбу, зомбировать людей и помочь нам познать тайну души

Время на прочтение6 мин
Количество просмотров3.6K
В радиолюбительстве есть особое направление – мониторинг ведомственных радиостанций: правительственного радио, раций спецслужб, военных передатчиков. Особым шиком считается перехват сеансов связи между базой и атомными субмаринами в диапазоне сверхдлинных волн – СДВ. В англоязычной литературе СДВ получили прекрасное название ELF (Extreme Low Frequency – «предельно низкая частота»). Так что ELF’ы – под этой аббревиатурой мы будем подразумевать СДВ-передатчики – встречаются не только в сказках.
Читать дальше →
Всего голосов 32: ↑22 и ↓10+12
Комментарии6

Некоторые секреты мозга

Время на прочтение3 мин
Количество просмотров4.6K
Статья основана на переводе статьи Nine Brain Quirks You Didn’t Realize You Had, которая в свою очередь основана на научных исследованиях. Взято от©юда

Я думаю, что вы уже имеете некоторые представления о принципе работы нашего мозга. Психология зачастую подтверждает наши догадки о том, как работает мозг, но вместе с тем преподносит много сюрпризов. Под хабракатом список секретов мозга, о которых вы, возможно, и не догадывались:

Читать дальше →
Всего голосов 69: ↑64 и ↓5+59
Комментарии51

Методы оценки качества прогноза

Время на прочтение3 мин
Количество просмотров33K
Часто при составлении любого прогноза — забывают про способы оценки его результатов. Потому как часто бывает, прогноз есть, а сравнение его с фактом отсутствует. Еще больше ошибок случается, когда существуют две (или больше) модели и не всегда очевидно — какая из них лучше, точнее. Как правило одной цифрой (R2) сложно обойтись. Как если бы вам сказали — этот парень ходит в синей футболке. И вам сразу все стало про него ясно )

В статьях о методах прогнозирования при оценке полученной модели я постоянно использовал такие аббревиатуры или обозначения.
  • R2
  • MSE
  • MAPE
  • MAD
  • Bias

Попробую объяснить, что я имел в виду.
Читать дальше →
Всего голосов 7: ↑6 и ↓1+5
Комментарии16

Google Chart API

Время на прочтение1 мин
Количество просмотров32K
Несколько дней назад компания Google выпустила новый сервис — Google Chart API.

Сервис как и все гениальное прост: теперь все, что необходимо для построение графиков это сформировать URL.
Читать дальше →
Всего голосов 51: ↑50 и ↓1+49
Комментарии55

Выпущен Apache FOP 0.94

Время на прочтение1 мин
Количество просмотров2.6K
FOP — это наиболее работоспособный open-source интерпретатор XSL-FO для преобразования XML в PDF. Команда Apache XML Graphics сообщила о выходе версии 0.94.
Читать дальше →
Всего голосов 2: ↑2 и ↓0+2
Комментарии3

10 юзабилити-преступлений, которых вы не должны совершать

Время на прочтение2 мин
Количество просмотров4.4K
На стадии дизайна и разработки мы должны учитывать прописные истины и основные концепции для улучшения юзабилити сайта. В этой статье описываются классические, но непростительные ошибки в области веб-дизайна и способы их решения.

Преступление #1: В формах метки не связаны с полями ввода


crime1
Использование атрибута «for» позволит пользователям кликать по метке, для выбора соответствующего поля формы. Это особенно важно для чекбоксов и радиокнопок — увеличить область клика.
Читать дальше →
Всего голосов 325: ↑289 и ↓36+253
Комментарии160

Компактный 2-терабайтный склад

Время на прочтение1 мин
Количество просмотров1.3K
Компания Iomega анонсировала выход на рынок своего нового продукта Iomega StorCenter ix2 — сетевого хранилища данных, предназначенного для использования как в офисе, так и дома.


Хранилище StorCenter ix2 — это два SATA-II жестких диска плюс мини-ПК на базе ПО EMC LifeLine (спец-пакет ПО из ОС Linux и сервисных приложений), с 400-мегагерцевым процессором и 128 МБ оперативной памяти. В комплекте — порт Gigabit Ethernet, два USB и EnergyStar-«одобренный» адаптер питания.


Iomega предлагает две модели StorCenter ix2. Объемом 1 ТБ и 2 ТБ. Стоит эта радость $300 (за терабайтную модель) и $480 за 2-терабайтное хранилище.

via Gizmodo
Всего голосов 51: ↑45 и ↓6+39
Комментарии70

Гуглякартим по умному

Время на прочтение9 мин
Количество просмотров10K
В последнее время модно стало использовать гуглякарту.
Гугля карту суда, гугля карту туда.
И главное не забыть отобразить свои объектики на карте.
Но, почему-то, подавлявшее число сервисов используют неправильную реализацию процесса передачи маркеров с сервера на клиент.
Точнее они не правильно формируют запросы.
А если выразиться еще более точнее — они это делают
не-по-умному
Всего голосов 80: ↑63.5 и ↓16.5+47
Комментарии29

Важность факторов, влияющих на ранжирование сайта в Яндексе

Время на прочтение1 мин
Количество просмотров2.3K
Мною был организован опрос среди опытных SEOшников на тему сабжа. Надеюсь — оцените.

Факторы с важностью по 10-и бальной шкале в картинках (чем больше — тем важнее):



Остальные графики спрятал под кат.

Читать дальше →
Всего голосов 161: ↑139 и ↓22+117
Комментарии99

Склеивание фотографий в Photosynth теперь открыто для всех

Время на прочтение2 мин
Количество просмотров6.7K
Microsoft открыла для всех пользователей доступ к своему уникальному инструменту создания трёхмерных панорам Photosynth. Теперь каждый желающий может нащёлкать сотню фотографий например, собственной комнаты, загрузить их в Photosynth — и любоваться готовой трёхмерной моделью. Интересно, что для ресурсоёмкого вычислительного процесса Microsoft не использует собственные сервера. Они сделали небольшой модуль, который загружается на ПК пользователя и уже здесь анализирует фотографии (ищет одинаковые объекты), и только потом передаёт их на сервер для окончательного склеивания.

Вот эту 3D-модель (на иллюстрации внизу) журналист слепил из 300+ фотографий своей квартиры. Весь процесс полностью автоматизирован. Если что-то непонятно, то есть обучающее видео.



Такой способ визуализации идеально подходит также для туристических снимков. Каждый из них не полностью передаёт красоту местности, но если склеить из них панораму, то картина становится гораздо более впечатляющей. Кроме того, теперь можно избавиться от огромных фотоальбомов с тысячами фотографий.
Читать дальше →
Всего голосов 102: ↑96 и ↓6+90
Комментарии84

Альтернатива облаку тегов

Время на прочтение2 мин
Количество просмотров1.4K
Как пример дерево тегов или пирамида? В случае если несколько тегов связано иерархически, то такое представление будет полезней нежели облако тегов по которому можно судить только о популярности чего-либо, но никак не о иерархической позиции. В тоже время дерево тегов можно сформировать из многомерного массива циклами или используя рекурсию. По-поводу графического представления все в наших руках. Современные средства позволяют сделать визуальную часть дерева почти любой. Подобная система будет полезна в случае когда облако тегов служит именно элементом навигации, а не «прикольной фичей».
Читать дальше →
Всего голосов 16: ↑10 и ↓6+4
Комментарии19

Города России в именительном и предложном падеже

Время на прочтение1 мин
Количество просмотров2.9K
Необходимо было писать названия городов России в предолжном падеже типа в Москве, в Ростове-на-Дону и т.д. После полуавтоматической обработки списка городов товарищем sofrus появилась таблица, которая содержит два поля с названием города в именительном и предложном падежах. И мы совершенно бескорыстно предлагаем эту таблицу (около 2400 городов) в двух вариантах:
  1. CSV
  2. MySQL


P.S. Почему хабр так уродует ordered list, для меня загадка.

ОЧЕНЬ ВАЖНЫЙ P.S.
Я не хочу присваивать себе чужие заслуги, поэтому я специально проверил, так как не исключал этого. Карма начала расти у меня, а не у sofrus, если вы считаете нужным поднять за пост карму, то поднимайте ему. Просто у него с компанией NDA подписан и в должностной инструкции нет пометки о том, что он может оценить важность информации. Поэтому я и запостил. Но в появлении этих таблиц нет моей заслуги.
Всего голосов 1: ↑1 и ↓0+1
Комментарии49

Определение пола по истории навигации

Время на прочтение1 мин
Количество просмотров2.7K
Используя тот факт, что браузеры обычно по-разному отображают и обрабатывают посещённые и не посещённые ссылки, умные люди давно придумали, как можно автоматически отследить историю веб-навигации посетителя.

Сперва мы выводим на страницу ссылки на популярные ресурсы (в скрытом фрейме, например). Далее, два варианта:

1) Написать скрипт, который пробегает по ссылкам и определяет их цвет через getComputedStyle, как описывает Jeremiah Grossman. На этот счёт даже есть готовый скрипт.

У этого способа есть небольшой недостаток: требуется включённый JavaScript.

2) Тот же J. Grossman предложил усовершенствованный вариант с использованием CSS. Определяем свой стиль, в котором у посещённых ссылок будет фоном стоять картинка: у каждой — своя. В этом случае браузер выполнит всю работу за нас. Потом достаточно посмотреть в логах, какие картинки были загружены.

Почему это может быть полезно (вредно): если человек посещал некоторый URL, то, с большой вероятностью, у него есть аккаунт на соответствующем ресурсе. Это может пригодиться, например, если вы используете в целевом ресурсе какую-то дырку.

Теперь, почему я про это вспомнил, и почему такой заголовок поста. Один остроумный товарищ при помощи первой технологии решил определять пол посетителя. Его теория в том, что определённые сайты посещаются по половому признаку, так что можно вычислить вероятность того, что вы такого-то пола. Я вот, например, на 68% мужчина.
Всего голосов 19: ↑19 и ↓0+19
Комментарии40

Информация

В рейтинге
Не участвует
Откуда
Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность