Pull to refresh
83
0
Павел Ловцевич @lautsevich

CTO

Send message

Каким бывает фрод в маркетплейсе, как его вычислять и предотвращать. Доклад Яндекса

Reading time 7 min
Views 18K
Прежде чем строить антифрод, надо понять, каким на сервисе бывает фрод — какие методы злоумышленники выбирают, чтобы получить выгоду и навредить пользователям. Алексей Савостин поделился опытом Яндекс.Маркета в исследовании способов фрода, рассказал о целях (порой изощрённых), которые преследуют фродеры, и о данных, по которым можно определять подозрительную активность.

— Всем привет, меня зовут Алексей Савостин. Я занимаюсь направлением антифрода в Яндекс.Маркете и сегодня расскажу, как мы строили антифрод для маркетплейса «Беру», который с октября стал частью Маркета.
Читать дальше →
Total votes 21: ↑17 and ↓4 +13
Comments 11

Как мы используем item2vec для рекомендаций похожих товаров

Reading time 9 min
Views 14K

Привет, меня зовут Вася Рубцов, я занимаюсь разработкой рекомендательных систем в Авито.


Основная цель площадки для размещения объявлений — помочь продавцам найти покупателей, а покупателям — товары, которые они ищут. В отличие от интернет-магазинов факт продажи происходит за пределами нашей платформы, и мы не можем это отследить. Поэтому ключевой метрикой у нас является «контакт» — это событие нажатия кнопки «показать телефон» на карточке товара, либо начало диалога в мессенджере с продавцом. Из этой метрики мы получаем «байеров» — количество уникальных пользователей в день, которые сделали по крайней мере один контакт.


Два основных продукта, которым занимается отдел рекомендаций в Авито, — это рекомендации для пользователя на главной странице или user2item и блок похожих объявлений на карточке товара или item2item. Треть всех просмотров объявлений и четверть всех контактов происходит с рекомендаций, поэтому рекомендательные движки играют важную роль в Авито.


В статье я расскажу, как мы улучшили наши item2item рекомендации за счёт item2vec и как это повлияло на user2item рекомендации.


Читать дальше →
Total votes 35: ↑35 and ↓0 +35
Comments 29

Доступ к контенту iFrame с другого домена

Reading time 9 min
Views 112K
Сегодня я хочу рассказать о том, как мы в своем проекте indexisto.com сделали аналог инструмента Google Webmaster Marker. Напомню, что Marker это инструмент в кабинете Google Webmaster, который позволяет аннотировать ваши страницы Open Graph тегами. Для этого вы просто выделяете мышкой кусок текста на странице и указываете что это title, а это рейтинг. Ваша страница при этом грузится в Iframe в кабинете вебмастера.



Теперь Google, встретив подобную страницу на вашем сайте, уже знает, что за контент на ней опубликован, и как его красиво распарсить в сущность (статью, товар, видео..)

Нам был нужен подобный функционал. Задача казалась несложной и исключительно клиентсайд. Однако на практике решение лежит на стыке клиентсайда и серверсайда («чистые» JS программисты могу ничего не знать про различные прокси серверы и очень долго подходить к снаряду). При этом я не нашел в интернетах статью которая описывала бы всю технологию от начала до конца. Также хочется сказать спасибо пользователю BeLove и нашим безопасникам за помощь.

Читать дальше →
Total votes 64: ↑61 and ↓3 +58
Comments 35

25 сервисов для продуктивной работы с Gmail

Reading time 8 min
Views 68K


Gmail был запущен в 2004 году и предлагал пользователям 1 Гб для электронной почты. Это было неслыханно по тем временам, к примеру, крупнейший сервис электронной почты Hotmail предлагал лишь несколько мегабайт. В настоящее время Gmail предлагает 7 Гб, Hotmail — 5 Гб, а Yahoo — не ограничивает размер ящика.

Gmail также пользуется популярностью среди коммерческих пользователей из-за того, что быстро работает, надежный и легко настраиваемый. Помимо экспериментальных функций, которые предлагает Google через Google Labs, есть сервисы от сторонних разработчиков, которые улучшают работу с Gmail.

Я составил подборку 25 лучших сервисов, которые сделают более эффективной вашу работы с лучшей почтовой службой от Google и вы сами заметите как увеличится ваша продуктивность работы с Gmail.

Читать дальше →
Total votes 118: ↑85 and ↓33 +52
Comments 70

Синдром рассеянного внимания меняет человечество

Reading time 2 min
Views 3.5K
Молодёжь тупеет? Люди становятся более легкомысленными? Можно сказать и так, но учёные предпочитают использовать другие формулировки: по их мнению, цифровые технологии способствуют возникновению синдрома рассеянного внимания у абсолютного большинства населения. Человеческий мозг не приспособлен для многозадачного режима работы, что уже неоднократно обсуждалось на Хабре. Это понятно. Но теперь врачи говорят, что последствия длительной «многозадачности» уже необратимы. Молодёжь из «цифрового поколения» просто не может сконцентрироваться на чём-то одном на долгое время (они даже не могут прочитать ни одну книгу до конца; для них даже несколько страниц текста — это уже слишком много). Некоторые специалисты считают, что это очень опасная тенденция.

Этой глобальной проблеме посвящена книга “Distracted: эрозия внимания и наступающие тёмные времена” (автор — Мегги Джексон). Может быть, автор где-то сгущает краски, но факты остаются фактами: синдром рассеянного внимания уже сейчас реально приводит к тысячам смертей. Из-за рассеянного внимания в наши дни гибнут сотни людей в ДТП, происходят техногенные аварии, у людей появляются серьёзные ментальные проблемы, а экономика теряет миллиарды долларов по причине понижения эффективности труда.
Читать дальше →
Total votes 77: ↑70 and ↓7 +63
Comments 196

Версия для печати: HTML vs CSS vs JavaScript

Reading time 3 min
Views 1.9K
В век современных технологий, когда все больше и больше сайтов поддерживает Google Gears, или другие способы оффлайнового просмотра документов, создание вменяемых версий для печати отходит на второй план. Тем не менее, огромное количество «мастодонтных» пользователей упрямо распечатывают страницы сайтов, чтобы потом почитать в дороге или дома. Параллельно, естественно, матеря на чем свет стоит разработчиков сайтов, которые не смогли предусмотреть вменяемый способ распечатать только нужную информацию.

Сегодня мы рассмотрим некоторые варианты создания версий для печати, а также обсудим их плюсы и минусы.

Читать дальше →
Total votes 12: ↑12 and ↓0 +12
Comments 27

Краткий обзор Reset CSS в фреймворке Yahoo! YUI

Reading time 3 min
Views 1.3K
Хотя на Хабре уже достаточно хорошего материала по css-фреймворкам, и Yahoo! YUI в частности, хотелось бы отдельно остановиться на Reset CSS. Положительный отзыв о этой библиотеке Вадима Макеева на РИТ-2008 просто вынудил меня скачать её и посмотреть что же там внутри.

Читать дальше →
Total votes 16: ↑13 and ↓3 +10
Comments 26

Total Commander Knowledge Base

Reading time 2 min
Views 1.4K
Думаю, всем известен файловый менеджер Total Commander (несколько лет назад называвшийся Windows Commander). Популярность и удобство этого инструмента под Windows таковы, что многие пользователи просто не представляют себе, как можно пользоваться компьютером без TC. Я — в том числе.
Но также, к сожалению, у многих пользователей возникают различные трудности при работе с TC. Это нормально — ведь за пятнадцать лет своего существования, TC превратился в довольно сложную программу. Безусловно, чтение документации (русская справка для TC сделана даже лучше оригинальной) помогает, но далеко не всегда. Да и не все пользователи догадываются её прочесть…

Вот уже много лет, наряду с официальным форумом TC существует русскоязычный форум поддержки Total Commander. Сообщество помогает решать проблемы, даёт советы, делает переводы и т.д. Количество информации, накопленной за годы, действительно огромно. И это создаёт новую проблему — проблему поиска нужной информации.
Полтора года назад я занялся сбором и упорядочиванием этой информации. Было «перекопано» множество источников — русский форум, официальный форум, ру-борд… Да всего и не упомнишь. В результате появился сборник русскоязычной базы знаний о Total Commander в виде chm-файла.
Через некоторое время было решено сделать онлайн-вариант базы. После преодоления некоторых трудностей, работа была завершена: RU.TCKB Online.
Хотя портирование множества статей на wiki-движок заняло достаточно продолжительное время, я надеюсь, что теперь дело пойдёт быстрее: редактировать статьи смогут все участники комьюнити, а не только я один.

Какую информацию можно найти на RU.TCKB?
Большое количество статей, как для новичков, так и для опытных пользователей.
Ответы на вопросы, оформленные не как простой FAQ, но и как некоторое подобие учебника.
Материалы для разработчиков плагинов, утилит и скриптов.
Описания существующих плагинов и утилит (в настоящее время составляется полный каталог плагинов).
Множество другой полезной информации.


Проект абсолютно некоммерческий, не содержит никакой рекламы. Всё базируется на сплошном энтузиазме и желании помочь ближнему (а также, в некотором роде, и себе — ведь теперь на большинство вопросов можно ответить «RTFM», и дать ссылку).

Приглашаем всех пользователей TC взглянуть, и, возможно, даже поучаствовать.

RU.TCKB Online
Total votes 18: ↑13 and ↓5 +8
Comments 10

Печать из браузера

Reading time 4 min
Views 7.9K
Web наступает. Все больше и больше обычных настольных приложений переезжает в Internet. Уже никого не удивить онлайновым текстовым или графическим редактором. А уж различные многопользовательские комплексы, базы данных, системы отчетности — тут раздолье для веб-технологий. Например, еще несколько лет назад было бы вполне нормально сделать систему регистрации и учета клиентов скажем стоматологической поликлиники или библиотеки в Delphi, добавить базу данных и сетевую часть. Но сейчас такое решение окажется неразумным: гораздо проще, удобнее, а значит и эффективнее использовать все то, что предоставляет нам Web, даже если приложением будут пользоваться только внутри локальной сети. Кроме того, такое решение кроссплатформенное, что актуально в связи с наметившейся тенденцией перехода к свободным ОС. Все что нужно на клиентских компьютерах — наличие браузера, никаких установок, настроек и прочего.

Но у решения все делать в web есть недостаток (даже не один, но я сейчас не буду перечислять все): неудобство при печати отчетов, бланков документов и прочих печатных страниц. Это связано с тем, что веб-страницы рассчитываются прежде всего для отображения на экране монитора и не подтачиваются для печати, что нередко ведет к расползанию печатной страницы. К счастью это все временные трудности и их можно обойти. Можно, например, генерировать отчеты в pdf или doc. Но я считаю это не слишком удобным: пользователю надо устанавливать программы, работающие с этими форматами, каждый раз выкачивать с сервера сгенерированный файл, печатать из сторонней программы, а не браузера. Поэтому стоит приложить усилия к созданию страниц, правильно выводящихся на печать прямо из браузера.
Читать дальше →
Total votes 15: ↑15 and ↓0 +15
Comments 12

ТЗ VS XP и их юридическое оформление

Reading time 4 min
Views 6.4K
В поддержании инициативы при обсуждении habrahabr.ru/blog/copyright/32178.html
решили выложить первую часть договора на разработку сайта и попробовать коллективно его отшлифовать.
для начала остановились на предмете договора, сроках и стоимости.
Читать дальше →
Total votes 24: ↑21 and ↓3 +18
Comments 55

Анимированные иконки сайта, только Firefox?

Reading time 1 min
Views 1.2K
Что-то неверно с кодом? <link href="ico.gif" TYPE="image/gif" REL="icon"> или только движок Mozilla отображает анимированые gif как favicons сайта?

Проверьте сайт www.pokelondon.com

Проверено в браузерах Internet Explorer 7, Firefox 2.0.0.6, Opera 9.23, Opera 9.5 Alpha, Safari 3.0.3 Beta и только в Firefox элемент favicons отображался.

А между прочим на w3.org в стандарте написано:
This document does not discuss in detail how to create a favicon image. However, the format for the image you have chosen must be 16x16 pixels or 32x32 pixels, using either 8-bit or 24-bit colors. The format of the image must be one of PNG (a W3C standard), GIF, or ICO.
С другой стороны написано «The format of the image...», ни слова animated
Total votes 7: ↑7 and ↓0 +7
Comments 18

Google Аnalytics для пользователей из Беларуси

Reading time 1 min
Views 646
Google Analytics — крутейшая система статистики. Только вот из русских поисковиков она в курсе только про Яндекс.
Что, согласитесь, делает её почти бессмысленной когда нужно продвигать сайт для белорусских пользователей.
Когда траф идёт ещё из рамблера, меил.ру, вебальты, тутбая и вообще all.by.
Оказалось — есть решение.
В стандартный код добавляем несколько строчек, и…

<script src=«www.google-analytics.com/urc<wbr />hin.js» type=«text/javascript»>
</script><script type=«text/javascript»>
_uacct = «UA-ХХХХХХХ-Х»;
_uOsr[24]=«mail.ru»; _uOkw[24]=«q»;
_uOsr[25]=«rambler»; _uOkw[25]=«words»;
_uOsr[26]=«webalta»; _uOkw[26]=«q»;
_uOsr[27]=«aport»; _uOkw[27]=«r»;
_uOsr[28]=«tut.by»; _uOkw[28]=«query»;
_uOsr[29]=«all.by»; _uOkw[29]=«query»;

urchinTracker();
</script>

Добавлено выделенное курсивом.
И что я ещё забыл из местных реалий?
Total votes 12: ↑12 and ↓0 +12
Comments 2

Справедливые ожидания вашего технического директора

Reading time 10 min
Views 35K
Я – ваш новый технический директор.

Представьте что мы все временно перенеслись в параллельную вселенную, где я – ваш новый технический директор, и я расскажу вам о своих ожиданиях от коллектива.
Я знаю, что в прошлом у нас были трудности со сроками, качеством кода и удовлетворением нужд клиентов, но как индустрия, как сообщество — мы можем преодолеть их и работать гораздо лучше.

Профессионалы ли мы?

Это главный вопрос. Я расскажу, чего я от вас жду, и это определит ответ на вопрос, профессионалы ли мы.
Читать дальше →
Total votes 111: ↑74 and ↓37 +37
Comments 113

Техническое задание на сайт

Reading time 11 min
Views 697K
UPD: Продолжение статьи с примером техзадания

Не так давно на хабре были две статьи (Согласно техническому заданию и А зачем мне ТЗ? Я и так знаю!) посвященные техническим заданиям. У меня обе статьи вызвали, мягко говоря, недоумение, в особенности статья «Согласно техническому заданию». На мой взгляд, это вообще вредная статья, которая приводит к неверному понимаю сути ТЗ. В связи с этим хочу выразить свой взгляд на этот вопрос. Не буду говорить обо всех тех. заданиях, слишком широка тема, но думаю смогу рассказать о ТЗ на сайт.

То описание технического задания, о котором речь пойдет ниже, не является пересказом ГОСТа, но скорее является его творческой переработкой, хорошо сдобренной горьким опытом. Описанный ниже подход к ТЗ не охватывает все аспекты сайтостроения, но задает общее направление.

Большинство сайтов можно отнести к маленьким и очень маленьким проектам, масштаба единиц человеко-месяцев. В силу малости размеров такие проекты спокойно поддаются хорошему продумыванию и легко реализуются с помощью водопадной модели, достаточно просто не лениться на каждом этапе разработки (от написания ТЗ до сдачи проекта). Применять к этим проектам гибкие методологии разработки нет смысла, а как раз есть смысл применять хорошее ТЗ. К тем сайтам, которые не попадают под водопадную модель не стоит применять описанный ниже подход.

1. Обоснование необходимости ТЗ


А зачем вообще нужно ТЗ на сайт? Заказчик говорит: «Нужен следующий сайт: каталог товаров, корзина, форма заказа, доставка, мы на карте, о нас, обратная связь». Что не ясно? Ничего необычного, всё обыденно и рутинно.

Разработчик отчетливо представляет, что нужно сделать, а сделать, в его понимании нужно вот так:



Далее много букв
Total votes 212: ↑209 and ↓3 +206
Comments 141

© В. И. Пупкин, 2008

Reading time 4 min
Views 82K
Ещё одна мелочь, на которую не вредно обращать внимание — оформление знака охраны авторского права (который часто неграмотно называют «копирайтом»). К сожалению, на сайтах этот элемент подвала страницы зачастую ставят «чтобы был», и оформляют кто во что горазд. Однако, на сей счёт есть не просто сложившиеся правила, а целый ГОСТ Р 7.0.1—2003 (PDF, 652 КБ).

Ничего сложного в оформлении знака охраны авторского права нет, нужно просто знать определённые правила.

Читать дальше →
Total votes 91: ↑85 and ↓6 +79
Comments 138

Управление потоком в CSS: создаём контекст форматирования

Reading time 4 min
Views 5.1K
Управлять потоком можно не только свойствами clear или overflow. Возможно, вы найдёте полезным для себя использование display:inline-block или display:table-cell, способных полностью заменить вам упомянутый overflow, избавляя вас от опасности указания размеров элемента, а также предоставляя дополнительные возможности.

Статья не содержит универсальных решений, но открывает вашему взору дополнительный инструментарий для управления потоком.
Читать дальше →
Total votes 66: ↑63 and ↓3 +60
Comments 34

Clear или overflow:hidden — очистка всего потока или создание контекста форматирования?

Reading time 2 min
Views 34K
clear и overflowСвойство clear со значениями left, right, both действительно очищает поток в отличие от overflow со значеним hidden, которое создаёт отдельный контекст форматирования для выбранного элемента, тем самым локализуя действие свойства float внутри элемента к которому применён.

Читать дальше →
Total votes 130: ↑120 and ↓10 +110
Comments 75

Основы BASH. Часть 1

Reading time 5 min
Views 1.4M
Безусловно, все те кто общается с ОС Linux хоть раз да имели дело(во всяком случае слышали точно) с командной оболочкой BASH. Но BASH не только командная оболочка, это еще и превосходный скриптовый язык программирования.
Цель этой статьи — познакомить поближе юзеров с bash, рассказать про синтаксис, основные приемы и фишки языка, для того чтобы даже обычный пользователь смог быстренько написать простой скрипт для выполнения ежедневной(-недельной, -месячной) рутинной работы или, скажем, «на коленке» наваять скриптик для бэкапа директории.
Читать дальше →
Total votes 146: ↑135 and ↓11 +124
Comments 114

Ускорение нарезки макета в Photoshop

Reading time 1 min
Views 34K
При создании html-макета страницы иногда приходится иметь дело с множеством однотипных картинок. Например, выпало верстать фотоальбом. Нужно нарезать порядка двадцати «превьюшек», потом их всех поименовать и сохранить. Рутина.

Для того, что бы быстрее разделать со всем этим — используем несколько хитростей.
Читать дальше →
Total votes 81: ↑68 and ↓13 +55
Comments 73

Information

Rating
Does not participate
Location
Минск, Минская обл., Беларусь
Date of birth
Registered
Activity