Comments 12
Мы несколько лет назад размеченную базу изображений, которая использовалась в одной более-менее удачной научно-исследовательской работе, выложили в UCI Machine Learning Repository. Призываю поступать аналогичным образом тех, у кого в результате дипломов и диссертаций появляются оригинальные размеченные изображения, видео, аудио и т.п.
Что я предлагаю сделать? Наверное, осознать, что базы размеченных изображений, да и вообще данных, сами по себе представляют науку. Т.е. они так же, как научные статьи по результатам исследований, представляют из себя научные знания. Звучит странно, но пример ImageNet показывает, как такая база может послужить общему прогрессу в конкретном направлении.
Спасибо за ссылку!
Во многих случаях, где надо определить "что это такое", поможет приложение, концентрирующее знания конкретной науки. К примеру, агроном видит личинку жука. Смартфоном делает фото и получает несколько возможных ответов. По каждому ответу он смотрит изображения из базы и принимает решение, что же это за насекомое. Тут же смотрит, надо ли с ним бороться, какова опасность. Тут же посылает свою находку в центр.
Похожие приложения — для рыбаков. Для биологов. Для лесников. Для охотников, егерей. Для грибников :)
Для коллекционеров разных мастей: марок, значков, картин, наклеек, посуды, автомобилей. Для этнографов.
Если растения и животные определяются по внешним признакам, то по приведенным вами фотографиям максимум что можно сделать это расположить их по степени увеличения содержания органического вещества.
Я к тому, что не самый удачный пример
Jane's warship recognition guide?
http://royallib.com/book/folkner_kit/spravochniki_dgeyn_boevie_korabli.html
Я очень надеюсь. Но в реальности здесь не так просто. Не представляю, что бизнес будет финансировать, к примеру, создание базы данных изображений насекомых или растений. Эта работа требует много времени, участия академической науки, массы людей с фотоаппаратами, ИТшников. Т.е.координировать людей в совершенно разных средах. Институты — у них своя структура коммуникации, организации, финансирования. Бизнес — своя.
Стимулы сделать окончательный результат д.б.разными, гремучая смесь энтузиазма и денег.
С ImageNet получилось потому, что там был локальный минимум. Сошлись: сильное желание в акад.среде, сделать эту базу; была сильная конкуренция; было несколько попыток, под которые нашлись деньги; и т.д. Т.е.довольно случайное сочетание.
Делать подобные базы по академическим направлениям, — тут скорее всего все упрется в… Кстати, командные системы управления здесь могут опередить "демократические". Россия и Китай здесь могут опередить "партнеров". :)
Распознавание образов и научное знание