Как стать автором
Обновить

Комментарии 33

Пожалуйста, если возможно, покажите, как соединять задания через GUI.

Пример того, как соединять задания через GUI можно посмотреть в этой инструкции от Яндекс.Толоки.
и много желающих фоткать счётчик за 5 рублей?
Вот мне тоже сложно представить, чтобы я поперся с ванную делать в неудобном месте фотку счетчика за 5-6 руб. Может тут какая хитрость есть?
я тут посчитал. Если у человека зп 40 тыс, то в минуту на работе он получает 4 руб 17 копеек. 0,01$ =0.64 руб. тут я ошибся, не 5 рублей, а 64 копейки.

Задание мелкое, его надо прочитать, понять что от тебя хотят. Оказаться в этот момент дома, а не в метро к примеру. Если в метро, то отложить это задание до приезда домой. Дома вспомнить о задании, открыть дверь, сфотографировать счётчик. Это очень сложно для 64 копеек. Нет, если бы у меня было тысяча счётчиков, я бы их стал фоткать за 64 копейки каждый, но ради одного это слишком дёшево.

А если их все равно уже сфоткал для отправки в УК и они вот рядом лежат в картинках? Причем сразу два.

Данное задание довольно легкое, имеет простую инструкцию, не содержит пула обучения. Такие задания люди выполняют на много охотнее, чем сложные задания с десятистраничной инструкцией и долгим процессом обучения. Плюс практически у каждого человека есть счетчик в квартире. Поэтому процент желающих выполнить задание довольно большой. Единственная проблема: количество пользователей мобильной версии Толоки в несколько раз меньше, чем пользователей десктопной версии. На данный момент в Толоке зарегистрировано 4 миллиона человек, DAU более 25к человек.
Довольно интересный факт для пользователей каршеринга Яндекс.Драйв. Если в начале аренды вы фотографируете повреждения/царапины на автомобиле, то полученные фотографии первым делом загружаются в Толоку и люди оценивают присланные изображения.image
Я в недоумении.

Допустим это задания потоковые, человек не тормоз, интернет работает быстро. 5 секунд на задание. 1 цент — 125 секунд. 20 дней по 8 часов = 46$ или 2700 рублей. или 13500 рублей если на задание тратить 1 секунду. лажа какая-то
В основе бизнес-модели Яндекс.Толоки лежит принцип использования труда людей, которые не умеют считать деньги и время. Поскольку таких дофига — проект успешен.
НЛО прилетело и опубликовало эту надпись здесь
По-моему ценник на задания не яндекс выставляет, а раз люди делают такие задания за 1 цент, зачем кто-то будет платить больше.
В таких системах в основном работают следующие категории людей:
1) привязанные к дому (домохозяйки, мамы, бабушки, инвалиды)
2) ковыряющиеся в носу во время основной работы (начальник идет — свернул браузер)
3) люди с временными проблемами с трудоустройством (ищут работу, только что уволили, а кушать хочется)
4) обобщенный пункт: люди, которые еще по каким-то причинам не могут устроиться на нормальную работу

Также стоит учитывать в целом экономическое состояние местности, где человек проживает, в некоторых местах люди готовы работать за любые деньги, почему так развит подобный аутсорс в индии и пр.

Безусловно. Что не отменяет тупости занятия чем-угодно на фултайм за 2700 рублей в месяц.
Я не понял расчётов.
5 секунд на задание. 1 цент — 125 секунд.
За задание же дают один цент, то есть «1 цент — 5 секунд». В итоге выходит ~73728 р. или в пять, соответственно, раз больше, если делать за секунду.

Комментарий про яндекс драйв был изменён. Там изначально было указано 25 изображений 1 цент.

На самом деле там есть какое-то количество заданий именно от яндекса, с более-менее вменяемой оплатой, на бутылку пива за часик сельскому жителю заработать вполне вариант. По крайней мере раньше так было, как сейчас не знаю. А вот такие хитрые товарищи как автор статьи, который предлагает за, минимум, минуту работы один цент, вызывают у большинства вменяемых толокеров недоумение. Впрочем, если кто-то за такие деньги этим занимается, и результат заказчика устраивает, то кто я такой чтобы осуждать.
# "Не баг, а фича": добавлять через API задания в пул можно только тогда,
# когда сам пул создан через API

На сколько я знаю, разницы быть не должно. kucev можете подсказать, как проявляется невозможность добавить задания в пул через API, если он создан через интерфейс?
В случае, когда пул создается не через API, а через интерфейс, в настройках пула отсутствует блок «Количество заданий на странице». Если добавлять в такой пул задания через API, то задания добавляются, но при этом пользователи их не видят.image
Рома, привет! Это действительно очень не очевидное поведение, которое стоит исправить. Дело в том, что если ты хочешь, чтобы Толока сама формировала страницы из твоего набора отдельных заданий, нужно задать настройки умного смешивания. Сейчас это можно сделать через интерфейс. Чтобы просто сохранить настройки, не заливая задания через UI, сейчас есть work-around: можно загрузить фейковый файлик. :)
Артем, попробовал загрузить через интерфейс пустой файлик (без заданий) и выбрать «Умное смешивание». Все получилось, после этого действия загрузка заданий через API стала работать. Спасибо за очень интересный и простой способ решения проблемы!)image

А как быть если счетчик стоит так что нормально не сфоткать? Сможет распознать?

Боюсь, что в таком случае нейронная сеть распознать счетчик не сможет.
Но это не точно :)
Очень впечатляющая статья. Данный сервис работает только в России? Или по всему миру тоже?
Или в других странах есть аналоги?

Например я пишу приложение обучающее правильному произношению на иностранном языке. Алгоритм автоматически определяет правильно ли обучаемый произнёс слово. Для обучения алгоритма нужен датасет со словами произнесёнными носителями языка. Похоже что Яндекс.Толока очень удобный инструмент для создания этого датасета. Но можно ли с помощью него нанимать людей в других странах?

Ваша задача несколько сложнее, чем описанная в статье. Распознавать цифры на картинке способен практически любой человек, а вот грамотно произносить слова способно много меньшее количество людей.

Во первых мне нужно произносить простые слова. В идеале состоящие из одного слога.
Во вторых, мне нужно не грамотно, а так как принято произносить в повседневном общении.
гуглите «Amazon Mechanical Turk»
forvo не то. Там слишком мало произношений на отдельное слово, не больше десятка. Для тренировочного датасета маловато будет. У меня немного слов, но на каждое слово нужно много вариантов произношения.
А нельзя ли тогда брать видеоролики с субтитрами, например, с ютуба, и автоматически нарезать на слова?
Данный сервис работает по всему миру, но в основном в Толоке люди из России и из стран СНГ, также есть небольшая часть людей из Турции. Как мне кажется, для вашей задачи больше подойдет «Amazon Mechanical Turk», чем «Яндекс.Толока».
НЛО прилетело и опубликовало эту надпись здесь
К сожалению, при такой постановке задачи хороший датасет собрать не получится.

Зато получилось бы собрать реальный датасет, с которым пришлось бы столкнуться на практике. А так Вы получили эталонный датасет, обучили на нем сеть, запустили продукт и внезапно он стал спотыкаться на каждой второй фотке, присланной живыми людьми.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий