Как стать автором
Обновить

Комментарии 35

НЛО прилетело и опубликовало эту надпись здесь
занимательно. Но так можно много страниц пропустить.
НЛО прилетело и опубликовало эту надпись здесь
Ну можно добавить алгоритм пропущенных страниц (по номерам в углу или где-то еще), который будет в конце сканирования просить показать их еще.

Хотя, мне кажется, технология, основанная на человеческом факторе, выглядит немного странной.
Ну вообще можно использовать и такую личталку, которая деньги считает…
Ну или МРТ, КТ, ПЭТ :)
да и ветхие документы не полистаешь
работал вот с такими несколько лет назад — около 2000 сканов/день
А вот такой аппарат умеет работать с ветхими экземплярами? elarobot.ru/
Да и сейчас выпускается значительное количество печатных изданий, которое вряд ли кто способен сканировать полностью, хотя бы на выполнение десятитысячной части этой задачи кто подрядился.

А на кой хрен сканировать то, что изначально в издательстве в электронном виде есть?
Ну надо же что-то изобретать и распиливать бюджет…

А если серьезно, то вроде как все книги защищены авторскими правами и правами издательств, так что такое сканирование — нарушение закона.
С чего вдруг сканирование — нарушение закона?
А глазами сканировать книжки-то ещё можно?
Провожу аналогию с вашими пунктами:
— копирование кассет/дисков;
— просмотр видео, прослушивание аудио.

Так понятнее?
Мне понятно, что вы путаетесь.

Я сколько угодно могу снимать видеокамерой изображение с телевизора у себя дома.
Может, это фетиш такой — снимать на камеру телевизор.

А вот если я решу этот камрип распространить — тогда это будет незаконно.
Законч читайте, больше нечего сказать. А уж как вы поступаете — это ваши тараканы.
Процитируйте закон, если не сложно.
Возможно, у вас он какой-то другой, и тогда я ошибаюсь.
Сканирование (профессиональное) не нарушает законов т.к. делается по лиц.договору с правообладателем. Или обрабатываются книги на которые А.П. не распространяются
А вы уверены, что все официально?.. Я не спорю, что возможно оформить официальное сканирование (в таком случае легче даже оформить договор на получение электронной копии, чем покупать аппарат для сканирования и тратить кучу человеко-часов). Но… в нашей стране часто спрашивают разрешение?..
Относительно оборудования представленного выше — Эларовский сканер и это японское существо, да я уверен что там все официально. Такое оборудование проф.ориентировано именно на обработку большого объема книг. А большие объемы в черную и без договора никто не возьмется делать.

Покупать сканер за 16-17 тыс у.е. чтобы оцифровать книжки для саттелитов / выкладывания на шару, да даже и за деньги в инете / раздаче друзьям совершенно экономически невыгодно.

Пиратской оцифровкой занимаются в основном любители. И оборудование у них совершенно другое.
В этом мире много что ориентировано изначально на профессиональную сферу, а используется в пиратстве…

Смотря какой доход потом получат эти пираты. 16 тыс. у.е. не такие уж и большие деньги для нормального проекта. Зато не надо будет в ручную фотографировать или сканировать на обычном сканере (человеко-часы тоже стоят денег).

Про все остальное спорить не буду.
Ну молотком тоже можно и гвоздь забить и по голове кому нибудь настучать. В зависимости от «проекта» ;)

16k$ — разово, не считая обслуживания.
человеко-часов в любом случае много уйдет: пост обработка образа / индексация / распознавание / верстка и тп.
Не думаю, что такой аппарат нуждается в частом, многочасовом, квалифицированном обслуживании. Лампу поменять, линзу настроить — может любой человек с головой на плечах. Конечно если какие-то важные запчасти менять — то да.

Человеко-часы на обработку я не учитываю, т.к. она и там и тут будет примерно равной. Зато именно на этап съемки уйдет в разы, в десятки раз меньше человеко-часов. Плюс, если брать аппарат из топика, то там программа сама расправляет страницы, т.к. обработки вообще никакой не нужно.
аппарат из топика я думаю _много_ больше 16k стоит…
+ пока как я понимаю это лишь прототип и появится на рынке еще не скоро.
Ну да, наверно. Учитывая какой объектив там стоит… Он один обойдется недешево. Плюс ПО, на сколько я понимаю, идет в связке с аппаратом и отделять его было бы не разумно.
если не ошибаюсь, новость не нова.
Я в своё время, когда школьником был и читать не очень любил, хотел научиться таким пролистыванием книги читать, чтобы бежать гулять :)
А мне очень не хватало поиска по бумажной книге. Я хотел по ней научиться гуглить, хотя в те годы и слова такого не было, равно как и интернета :)
Значит сверхбыструю и создающую 3д снимок камеру изобрели, а переворачивают все равно руками? =)
Вспомнилось как №5 из «Короткого замыкания» инструкцию читал
Не инструкцию, а все книги в доме.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
а распознавалке совсем не обязательно идти в ногу со сканом.
Обычно при больших объемах оцифровки книг операторы работают раздельно:
1. первичная массовая оцифровка (одна группа)
2. обработка материалов и рескан брака (вторая группа, включается в работу во вторую смену, когда первая уже наработала материал).

Большинство книг кстати очень сложно быстро распознать ввиду того что в тексте встречаются сложные формулы, изображения.
я сейчас читаю «конец радуг», там как раз был эпизод, когда герой зашел в подвал библиотечный, а там в большой шредер (типа который ветки измельчать может) книжки бросают

оказалось — цифруют: шредер измельчает книжку на кусочки, которые, пролетая в трубе, фотографируются кучей камер, цифруются, а потом быстрые компьютеры (которые настолько быстрые, что им делать нечего уже) складывают пазл из кусочков в картинку исходной страницы, которая распознается в текст

а чего, красивая идея :)
да, у японцев прототипы не то что наши телефоны с наклейками:)
В промышленных масштабах не проще-ли срезать переплет у книги и сканировать как стопку бумаги уже существующими сканерами и потом прогонять через уже существующие OCR?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Изменить настройки темы

Истории