Pull to refresh
0
4elentano @4elentanoread⁠-⁠only

User

Send message

Живите (опять) без скучных дел

Reading time4 min
Views929
Если кратко, мы сделали веб-сервис, избавляющий от скучных дел. Причем клиенты выбирают сами, сколько платить:


Клиенты — наши начальники. Они сами оценивают работу и назначают оплату. Иллюстрация — Michael Dashow.

Когда-то хабр благосклонно принял мою статью Аутсорсинг жизни, водка, матрешка (в отличии от другой, 100 долларов в час). Речь шла о сервисе персональных ассистентов, который:
  • искал жестянщиков вытащить сосульку из крыши Пассата
  • делал визу в Польшу на 86 дней
  • в общем, скрашивал быт.

Читать дальше →
Total votes 123: ↑103 and ↓20+83
Comments199

Необходимость длительного отдыха: очередная ловушка при планировании времени

Reading time3 min
Views41K
Корреляция между трудом и отдыхом на коротком промежутке времени прослеживается очень просто. Если ночь не спал — днем гудит голова, сложно сосредоточиться, работать практически не возможно (подчеркну, что здесь и далее речь идет об интеллектуальном труде).

А вот более длительные фазы, период которых составляет несколько месяцев, проследить значительно сложнее. Хотя эти фазы так же реальны, как и кратковременные фазы.

Читать дальше →
Total votes 148: ↑146 and ↓2+144
Comments208

Инвесторы — естественные враги стартапов

Reading time7 min
Views3.5K
В живой природе естественное равновесие поддерживают хищники. В среде стартапов такими хищниками являются венчурные инвесторы (бизнес-ангелы, венчурные фонды и пр.). Они ограничивают размер популяции и оздоравливают её, поедая слабых и больных (понятно, что в большинстве случаев у «слабых и больных» на этот процесс есть своя точка зрения, но факты — упрямая вещь).

Я вот уже два года пытаюсь поднять собственный стартап, за это время встречался и разговаривал с десятками потенциальных инвесторов, поэтому надеюсь, что моё видение проблемы взаимоотношений инвесторов и основателей стартапов может кому-то оказаться полезным. Понятно, что многие живущие в этом мире стартаперы знают обо всём этом не меньше (а то и гораздо больше) меня, но начинающим или потенциальным бизнесменам от высоких технологий, надеюсь, моё (исключительно субъективное) мнение поможет реальнее смотреть на вещи.
Читать дальше →
Total votes 114: ↑101 and ↓13+88
Comments167

Открытые данные электоральной статистики России

Reading time2 min
Views2.3K
Некоммерческая организация ГОЛОС занимающаяся мониторингом выборов в России буквально вот только что открыла сайт электоральной статистики в нашей стране — stat.golos.org

Всего в их базе 36 834 записи о выборах на всех уровнях власти — от федерального до местного самоуправления, по всем регионам и начиная с 2003 года.

Огромный объем работы наконец-то доступный онлайн. Данные по весьма чувствительной теме под названием «выборы». Причем данные официальные, наконец-то, извлеченные из сайта Центризбиркома и представленные в форме пригодной для повторного использования как открытые данные.

И у каждого из выборов есть ссылка на CSV файл с описанием. Который можно выгрузить, загрузить в Excel, загрузить в любимую базу данных, построить инфографику, сделать свой региональный проект, сделать проект по собственному муниципалитету и многое другое.

Скриншот главной страницы:
image
Читать дальше →
Total votes 32: ↑29 and ↓3+26
Comments13

Как устроен поиск по письмам в Яндекс.Почте

Reading time3 min
Views7.8K

Задача Яндекса – найти ответ на вопрос пользователя. Но технологии поиска этого самого ответа бывают разными. Скажем, поиск по интернету и по письмам очень сильно различаются. Поиск по почте – это особенный продукт, уникальный и сложный.

В первую очередь, Яндекс.Почта – это огромный объём данных. У нас хранится около 10 миллиардов писем – это почти столько же, сколько страниц в индексе веб-поиска Яндекса. При этом поисковых запросов примерно в 1000 раз меньше, чем запросов к поиску по интернету.

Зато в поиске по Почте очень важна полнота результатов: если поиск по интернету не найдёт один-единственный сайт из трёх миллионов по запросу «пластиковые стулья», этого никто (кроме, разумеется, вебмастера этого сайта) не заметит. Гораздо критичнее, если потеряется письмо с важным адресом или паролем.

По этим причинам в поиске по Почте существует ряд архитектурных и технологических особенностей.

Архитектурные особенности

Поступающие в почту письма можно индексировать в хронологическом порядке. В этом случае, как только на первом сервере закончится дисковое пространство, мы начнем строить индекс на втором и так далее. Но такой способ не гарантирует полноту результатов поиска: для полного ответа нужно получить результаты с каждого сервера, а, поскольку время ответа от каждого сервера разное, то из-за сетевых задержек мы можем потерять часть данных.

Чтобы обеспечить полноту результатов, весь поисковый индекс для некоторого пользователя хранится на одном сервере и полностью дублируется на другом – если один сервер недоступен, то мы ищем на дублирующем.

Когда система работает в штатном режиме (все серверы функционируют, все дата-центры доступны), половина поисков отправляется на сервер в одном ДЦ, а вторая половина – на сервер в другом ДЦ. Благодаря этому поисковая производительность увеличивается в два раза.

Технологические особенности

На каждом сервере располагается индекс по письмам пяти миллионов пользователей. Можно строить его разными способами: например, по индексу на пользователя, но в таком случае возникает большая нагрузка на файловую систему, а также требуется огромное количество аппаратных ресурсов и ресурсов операционной системы (потоки и файловые дескрипторы) для поиска.

Другой вариант – все пользователи в одном индексе. Однако этот вариант ненадёжен: если произойдёт сбой, то сразу миллионы пользователей останутся без поиска, а восстановление системы займёт значительное время.

1-й вариант решения: Индекс размером до 10 Гб
Мы попробовали промежуточный вариант: выбрали максимальный размер каждого индекса 10 Гб. Следовательно, на каждом сервере получилось по 50-100 индексов, которые создаются в порядке поступления писем, а данные пользователя, таким образом, могут находиться в любом из индексов. Но письма часто содержат большое количество однотипной информации («привет», «пока», «@yandex.ru»), которая подходит под 46% всех запросов к поиску по Почте. Получалось, что ответ на такой запрос требовал поднять около 20% всех писем, хранящихся на сервере — это занимало десятки секунд.

2-й вариант решения: Префиксный индекс
Мы оставили максимальный размер индекса равным 10Гб, но перед каждым словом добавили ID пользователя. В результате каждый поиск сразу ограничивался количеством и размером писем в почтовом ящике текущего пользователя. Это снизило объем находимых данных и на порядок ускорило поиск. Но когда на диске – сотни индексов, то из-за большого числа дисковых операций поиск занимает несколько секунд. Наша же цель – десятые доли секунд.

3-й вариант решения: Шардирование по пользователям
Все индексы на сервере были разделены на 1000 сегментов (шардов). В каждом из них – от пяти до двадцати индексов размером до 1 Гб, и данные конкретного пользователя всегда находятся в определённом сегменте. В результате число дисковых операций было снижено до 20 раз по сравнению со вторым вариантом. Скорость поиска также увеличилась в разы. Так мы получили поиск за доли секунд.

Онлайн-индексация
Для того чтобы все поступающие письма практически сразу появлялись в результатах поиска, мы разработали специальный инкрементальный индекс в памяти. Особенность индекса в том, что в него можно добавлять по одному документу, а после добавления документ сразу появляется в поиске.
Процесс индексации выглядит так:
Поступающие письма попадают в инкрементальный индекс в памяти. Когда в памяти накапливается определенное количество писем или занят определенный объем,  запускается процесс переноса данных из индекса в памяти в дисковый индекс.  В этот же момент прекращается индексация в памяти №1 и создается индекс в памяти №2.

Конечно, это – лишь часть того, что мы делаем для улучшения качества нашего поиска по Яндекс.Почте. Может быть, у вас есть какие-то вопросы? Мы с радостью на них ответим.


.
Total votes 46: ↑41 and ↓5+36
Comments24

Про вред молчания

Reading time3 min
Views20K
Товарищи, хочу поднять тему, которая уже очень долгое время меня волнует. Может быть, кому-то она покажется слишком резкой, а кому-то слишком нескромной, но тем не менее.

Лично мне как руководителю много неудобств приносят люди, которые чем-то недовольны, но молча сидят и ждут. Молча ждут, пока им поднимут зарплату. Молча занимаются неинтересной работой в надежде, что когда-нибудь я это замечу и осчастливлю новым проектом. Молча мёрзнут под кондиционером и уходят на больничный, так и не попросив его выключить.

Люди сидят, молчат и, молча, обижаются. А потом, когда предел ожидания достигнут, они вместо того, чтобы придти ко мне и рассказать о проблеме, также молча идут в соседнюю фирму на собеседование.

Дальше текст немного в «чёрном» стиле Славы Панкратов (case), но это нынче модно. Я надеюсь, вас не смутит обращение на «ты», поскольку оно лучше передаёт эмоциональную составляющую и смысл статьи.
Читать дальше →
Total votes 301: ↑264 and ↓37+227
Comments209

Разработка мобильных приложений на PhoneGap и jQuery Mobile

Reading time10 min
Views147K


PhoneGap — это OpenSource платформа, позволяющая разрабатывать мобильные приложения на HTML, JavaScript и CSS под различные платформы (практически без изменения кода приложения) в их число входят: iOS, Android, Blackberry, WebOS, Symbian и Windows Mobile на подходе. Прелесть его в том, что он не требует навыков разработки под конкретную платформу. Вы пишете свое приложение на JavaScript, используете HTML и CSS для разметки. Вы пишете мобильное приложение как обычный сайт или веб-сервис.
Движок PhoneGap расширяет API браузера и добавляет следующие возможности: доступ к акселометру, доступ к камере (пока только фото), доступ к компасу, доступ к списку контактов, запись и прослушивание аудио файлов, предоставляет доступ к файловой системе, позволяет работать с разными HTML5 хранилищами localStorage, Web SQL и т.п а также позволяет безболезненно обращаться к любому кросс-доменному адресу.
Кроме платформы PhoneGap имеет, пока бесплатный, билдер приложений под все устройства в один клик.

jQuery Mobile


Думаю все знают, но напомню ещё раз. jQuery Mobile — это надстройка над jQuery, позволяющая безо всяких проблем разрабатывать мобильные веб сайты и мобильные веб приложения.

Если вы знаете HTML, JavaScript, CSS, jQuery и испытываете проблемы с Java, Objective-C и другими, но желаете попробовать свои силы в мобильной разработке, то эта статья для вас.
Читать дальше →
Total votes 117: ↑115 and ↓2+113
Comments47

Iconizer.net — перерождение бесплатного генератора иконок

Reading time2 min
Views1.6K

Первое что мы сделали это начали изучать лучшие проекты в этой индустрии. Нормальных генераторов мы не нашли, но зато нашли очень многое в поисковиках иконок. Собрав самое лучшее, и улучшив на что хватило фантазии, мы создали довольно неслабый поисковик с огромной базой. Мы собрали свыше 50 000 уникальных иконок (под словом «уникальный» имеется ввиду реальная уникальность, а не 5 000 иконок 10 размеров каждая).
Подробности под катом
Total votes 106: ↑98 and ↓8+90
Comments81

Новая фича в Google Analytics – многоканальные последовательности

Reading time5 min
Views15K
Не так давно в Google Analytics появился обновленный интерфейс, о чем здесь же в «Электронной коммерции» написал мой коллега Алексей Ильин. А сегодня на суд общественности была вынесена новая фича – “многоканальные последовательности” (как обычно, не самый лучший перевод, но уж какой есть). В оригинале эта функция называется “multichannel funnels”, и доступна она тоже только в свежем интерфейсе (причем, пока далеко не всем).
Читать дальше →
Total votes 24: ↑20 and ↓4+16
Comments14

Как повысить эффективность рабочего дня с помощью интеллект-карт

Reading time2 min
Views16K
В этой заметке я поделюсь своим опытом использования интеллект-карт (mind maps) для повышения эффективности на работе. Для рисования карт я использую программу Mindjet MindManager, которую довольно легко освоить – поэтому не буду останавливаться подробно на этом, скажу лишь, что основные операции производятся клавишами Insert, Enter и стрелками.

Примечание: в комментариях много возмущений по поводу цены программы, поэтому упомяну бесплатные аналоги: XMind и FreeMind.

1. С чего начать день?


Начинать рабочий день полезно с планирования: выписывания задач, которые должны быть выполнены. Если этот список был составлен с вечера – достаточно его просмотреть и при необходимости дополнить.


2. «Разделяй и властвуй»


Если задача с трудом укладывается в голове и вызывает растерянность – это повод разбить её на более понятные подзадачи и начать с первой.

Читать дальше →
Total votes 77: ↑64 and ↓13+51
Comments82

Яндекс начинает инвестировать в стартапы

Reading time1 min
Views3.4K
В июне 2010 года Яндекс начал присматриваться к венчурному рынку. Сначала мы работали со стартапами через партнеров – первыми для Яндекса искали проекты Startup Point и Greenfield Project. Затем к ним присоединился питерский бизнес-инкубатор Ингрия и еще десяток партнеров в России и Украине.

С тех пор мы провели три Яндекс.Старта, где руководству и менеджменту компании были представлены больше двадцати российских стартапов, закрыли две сделки по покупке технологий WebVisor и Loginza.

С февраля 2011 года мы начали принимать заявки от проектов напрямую. Сегодня мы готовы расширить работу с проектами, как географически, так и содержательно.

Яндекс открывает программу инвестиций для стартапов Яндекс.Фабрика. В рамках этой программы получить финансирование объемом до нескольких сотен тысяч долларов могут как российские, так и зарубежные проекты. Заметим, что российским проектам в среднем будут предложены инвестиции от 50 до 150 тысяч долларов.

Мы все так же разыскиваем талантливых ребят, развивающих близкие Яндексу технологии и сервисы как на web, так и на мобильных платформах. Подробнее о потребностях Яндекса рассказали наши менеджеры.

В рамках программы инвестиций мы готовы вкладывать в проекты не только деньги, но и экспертизу наших менеджеров и разработчиков. Многим российским проектам сотрудничество с Яндексом поможет больше узнать об уже существующих технологиях и сервисах и не совершить лишних ошибок.

Мы надеемся, что готовность Яндекса к открытому взаимодействию со стартапами поможет российскому рынку сделать качественный скачок, в то время как технологических прорывов мы ждем скорее от западных рынков, куда Яндекс также планирует инвестировать в недалеком будущем.

Команда Яндекс.Старта.
Total votes 57: ↑51 and ↓6+45
Comments16

Фонетический поиск

Reading time4 min
Views16K
Пару лет назад была задача написать для одного из сайтов такой поиск, который бы распознавал опечатки и предлагал бы исправленные запросы. Было перепробовано несколько вариантов, об одном из которых я и хотел тут написать. Поиск на основе звучания слов может стирать языковые границы, поскольку имена собственные на разных языках созвучны. Например, ищешь «Арнольд Шварцнеггер» на русском — находишь «Arnold Schwarzenegger» на английском, или ищешь «Michael Jordan» — находишь «Майкл Джордан», или ищешь «Чак Норрис» — и вдруг он сам тебя находит. Помимо поиска созвучных слов этот метод нивелирует большое количество опечаток. А то че-то задолбала попса, надо больше про инсайд…

...больше про инсайд
Total votes 123: ↑122 and ↓1+121
Comments77

Фонетические алгоритмы

Reading time9 min
Views44K
Фонетические алгоритмы сопоставляют двум словам со схожим произношением одинаковые коды, что позволяет осуществлять сравнение и индексацию множества таких слов на основе их фонетического сходства.

Часто довольно трудно найти в базе нетипичную фамилию, например:
— Леха, поищи в нашей базе Адольфа Швардсенеггера,
Шворцинегира? Нет такого!
В этом случае использование фонетических алгоритмов (особенно в сочетании с алгоритмами нечеткого сопоставления) может значительно упростить задачу.

Такие алгоритмы очень удобно использовать при поиске в базах по спискам людей, в программах проверки орфографии. Зачастую они используются совместно с алгоритмами нечеткого поиска (которые, несомненно, заслуживают отдельной статьи), предоставляя пользователям удобный поиск по именам и фамилиям в различных базах данных, списках сотрудников и так далее.

В этой статье я рассмотрю наиболее известные алгоритмы, такие как Soundex, Daitch-Mokotoff Soundex, NYSIIS, Metaphone, Double Metaphone, русский Metaphone, Caverphone.
Читать дальше →
Total votes 154: ↑153 and ↓1+152
Comments35

Выбираем отечественного поставщика облачного хостинга

Reading time5 min
Views20K
Здравствуйте, уважаемые читатели! В своей статье я хочу произвести анализ компаний, предоставляющих услуги «облачного» хостинга на территории РФ. Анализ проводится с точки зрения среднестатистического пользователя, перед которым встала задача приобретения хостинга в облаке. Основные критерии по которым будет производиться анализ — поддержка, стоимость, гибкость(как один из основных критериев), прозрачность ценовой политики т.д.
Читать дальше →
Total votes 92: ↑80 and ↓12+68
Comments91

Информационные интеллектуальные сети и Семантический Веб

Reading time10 min
Views24K
Информационные интеллектуальные сети, Семантический Веб, Веб 3.0, ИИ… Эти слова все чаще стали появляться в нашем обиходе.

Целая эпоха универсального Интернета заканчивается. Она начинает сменяться до того, как мы начинаем это ощущать. На смену едва оформившемуся термину Web 2.0 уже приходит другой, непонятный и загадочный на первый взгляд — Web 3.0, или же просто «Семантический Веб».

О том, что это такое и куда движется наш интернет, я хотел поговорить в этой статье.
Читать дальше →
Total votes 37: ↑31 and ↓6+25
Comments43

Сайт Сколково

Reading time2 min
Views64K
Читал тут ленту друзей, наткнулся на интересное замечание относительно сайта Сколково и, в частности, на чем и за сколько он сделан.

Собственно, сам сайт великого Фонда развития Инновационного центра «Сколково». Мотнем скроллом вверх-вниз и запомним общий концепт.

Поищем, сколько же стоит разработка этого сайта. Конечно, на хабре огромное число разработчиков, порядок цен все знают, но мы же пишем волшебный проект, поэтому и цены у него должны быть волшебные:
На PR-сопровождение деятельности фонда планируется потратить 38,7 млн руб. На медиаразмещение и рекламу — 92,8 млн руб., на брендинг — 12,9 млн руб., на веб-сайт и блоги — 3,1 млн руб.

Дизайнеры, сколько бы ориентировочно взяли за разработку дизайна сайта Сколково? 500$? 1к$? 10k$?
А программисты?

Дорого берете, скажу я Вам, за натягивания шаблона на Joomla.

Эх, вот Вам хотя бы хорошая песенка про Сколково, чтобы лишний раз не расстраивались.

UPD: внимательный хабрапользователь DarkPreacher верно подметил, что все-таки не Joomla, a UMI:
Читать дальше →
Total votes 416: ↑393 and ↓23+370
Comments699

Визуализация графов. Метод связывания ребер

Reading time7 min
Views57K
Иногда полезно представить граф в графической форме, так чтобы была видна структура. Можно привести десятки примеров, где это может пригодиться: визуализация иерархии классов и пакетов исходного кода какой-нибудь программы, визуализация социального графа (тот же Twitter или Facebook) или графа цитирования (какие публикации на кого ссылаются) и т.д. Но вот незадача: количество ребер в графе зачастую настолько велико, что нарисованный граф просто невозможно разобрать. Взгляните на эту картинку:



Это граф зависимостей некой программной системы. Он представляет собой дерево разбиения на пакеты (серые шарики — пакеты, белые — классы), на которое поверх наложены ребра зависимости одних классов от других. Чтобы не рисовать стрелки направления, ребра нарисованы в виде градиентных линий, где зеленый — это начало, а красный — конец ребра. Как видите, граф настолько визуально перегружен, что архитектуру программы невозможно проследить.
Под катом описание метода, решающего эту проблему.
Читать дальше →
Total votes 214: ↑205 and ↓9+196
Comments67

siteTarget — новый счетчик, который измеряет звонки для веб-сайта

Reading time3 min
Views754
siteTarget

Работая последние 4 года на поприще seo, мы все чаще стали отмечать тот факт, что ни мы, ни наши заказчики не знают, какой именно трафик приносит им новых клиентов.

С активными интернет-магазинами все просто и понятно. Пользователи совершают покупки на сайте и отследить источники трафика и достижение целей не составляет труда.

Однако задача большей части сайтов — привлекать новых клиентов к покупке по телефону. И здесь отследить или измерить требуемый трафик практически невозможно. Особенно, если предлагаемая услуга или товар — разового потребления.
Читать дальше →
Total votes 9: ↑7 and ↓2+5
Comments12

Верстка e-mail рассылок — «подводные камни». Часть вторая

Reading time4 min
Views32K
Верстка e-mail рассылок — «подводные камни». Часть вторая
Здравствуйте, уважаемые хабравчане!
Буквально пару дней назад мы опубликовали первую часть топика, посвященного верстке e-mail рассылок, а конкретнее — использованию изображений. Вторая часть посвящена ещё четырем «подводным камням» верстки, которые нам удалось обнаружить.

Второй камень — «Якоря»


Если рассылка большого объема на несколько страниц, появляется необходимость навигации внутри рассылки. Как известно, для такой навигации на html-странице используются «якоря».
Читать дальше →
Total votes 55: ↑42 and ↓13+29
Comments15

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Registered
Activity