Pull to refresh

Comments 11

Проект категорически не имеет прикладного значения? Наверное, стоит попробовать обсудить и этот вопрос…

Хороший вопрос.


Готовы ли учёные платить за оцифровку? Думаю, что нет.


Можно ли малой кровью адаптировать его для разметки чего-нибудь ещё? Ну, вероятно можно адаптировать для каких-нибудь похожих полевых исследований.


Более практические и прибыльные вещи? Без гадкой бумаги но с потребностью ручной разметки. Сходу не могу придумать. В городах обычно можно поставить камеру и обрабатывать видео.

Можно, при знании английского, попробовать получить какой-нибудь международный грант.
Это получится у того кто в теме и знает как и у кого можно получать гранты. То есть Вам нужно найти биолога, который уже получал гранты, и знает как это делать.
Найдёте — киньте ему ссылку на эту статью :-). В целом, я её с таким прицелом и написал.
У меня знакомых учёных-биологов нет :(
Попробуйте спросить вот тут https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%D0%B0:%D0%91%D0%B8%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F (Проект Биология в Википедии) — там кто-нибудь должен знать.
Готовы ли учёные платить за оцифровку? Думаю, что нет.
Просто за оцифровку, пожалуй, не заплатят. Если вдуматься, то из маршрутов полетов можно извлечь много ценной информации. Я не специалист, но сходу: 1. Миграции вирусов. 2. Влияние климата, антропогенных факторов. 3. Наносимый вред с\х…
Миграции вирусов… Наносимый вред с\х…

Последователь Мао Цзэдуна?

О том что есть польза, Вам в голову не приходило?

Точность распознавания указанных заметок и не будет выше 60-70% никогда. Потому что при написании загогулин на бегу 30% из них получаются равно похожими на 2-3 цифры. Когда человек вынужден прищуриваться, применять логику ("Дрозд умеет летать 110 км/ч? Нет? Значит, это не 11 а 4") — значит данные катастрофически зашумлены. Распознают и худшее, но в контексте. А без контекста — нет.
Я это к чему… Нужно создать контекст. Нужно переходить к следующему этапу с обратной связью. Обработанные данные нужно собрать, положить в базу, математически выявить аномальные и невозможные величины, отметить их на сканах. Далее распознать заново, с разными настройками. Если вновь не помогло, данные нужно оценить: на сколько именно эта запись полезна для науки. И самые ценные записи просмотреть вручную, остальные просто выбросить.
А на будущее выдать птичьим вуайеристам нормальные анкеты, чтобы такого не было. Клеточки для цифр радикально исправляют ситуацию.

Ну, на деле для машинной части можно сделать много лучше, чем 66%. Контекст-то имеется. Цифры всегда идут в одном порядке (пусть и не натуральном), и в целом распознаются хорошо. То есть, там где распознаётся А, там же и Д (с схожими вероятностями), но не Ю.


Тут вполне можно было бы сделать 95%.


С маркерами, естественно, так хорошо не выйдет.


Но вообще неплохо было эта хотя бы техпроцессу с ручной разметкой наладить.


Уже массу времени бы сэкономило, да новые возможности для аналитики дало.

Sign up to leave a comment.

Articles