Блог компании Авито
Data Mining
Python
Алгоритмы
Машинное обучение
Комментарии 8
-7
Лучше бы боролись с мошенниками, риэлторами, они указывают один дом, а на картинках другой дом, особо сильных нейронок не надо чтоб сравнить с картинкой на Яндекс картах (понарамой) данного дома.
0
Здравствуйте. Вы правы, качественный контент — важный аспект нашей работы, именно поэтому мы уделяем большое значение проверкам объявлений и пользователей на соответствие правилам сайта Авито.

Вместе с тем для пользователей всегда доступна возможность написать нам и сообщить о подозрительном объявлении. Сделать это можно через форму обратной связи на сайте: support.avito.ru/request. Ваша заявка будет обработана, а о результатах вы получите ответ на почту.
0
Лучше бы была возможность оставлять отзыв о продавце и какой-нибудь метод доверенной оплаты. Это радикально снизит долю мошенников. Я например обжегшись уже не рискну б/у электронику брать какой бы хорошей цена ни казалась.
0
Добрый вечер.

А как у вас всё организационно устроено? В том плане, если я правильно понял, вам разрешили писать свои микросервисы на Python, которые будут отвечать за некоторый набор действий (например, предоставлять API для рекомендации). Но люди, которые понимают в ML, не всегда понимают, как писать Бэкенд (обратное утверждение ещё более сильное, конечно же). Поэтому не понятно, как Data Scientist специалисты пишут бэкенд?

Или у вас команда состоит срезу из нескольких ролей, и есть те, кто может обеспечить качество сервиса?
0
Добрый вечер!

У нас полноценная команда, где есть как и Data Scientist'ы, так и бэкэнд-разработчики. Но мы придерживаемся такого подхода, что свою модель DS должны дотащить до прода сами (конечно, с помощью разработчиков), при этом качество кода должно соответствовать всем принятым в компании стандартам. Это облегчает дальнейшую поддержку микросервисов, так как все члены команды понимают устройство сервиса независимо от других исправить возникшие проблемы.
0
Как я понимаю, конечные конфиги, которые вырабатывают бандиты, работают на сфинксе.
Каким образом вы обрабатываете искажения результатов, полученные в результате разности данных в индексе на разных нодах? Не может ли сложиться ситуации, что конфиг будет отвергнут из-за того, что результаты его запроса были на ноде, которая не успела обновить свой индекс?
0
Конфиг — это набор параметров, исходя из которого формируется запрос в сфинкс. Т.е. сфинкс не знает ничего про конфиги, они хранятся на стороне сервиса. Вопрос разности данных на нодах сфинкса мы не исследовали, но предположу, что это может повлечь немного различающуюся выдачу для двух одинаковых запросов, но относительно конфигов оно скорее будет равномерно размазано и не повлияет на работу бандитов.
Только полноправные пользователи могут оставлять комментарии. , пожалуйста.