Pull to refresh

Comments 37

Думается, что есть смысл включить в поиск и последние страницы книги, так, на всякий случай.
Честно говоря не встречал книг, где, если ISBN и написан, то он не на первых страницах. Вы встречали?
Если да, то, действительно, стоит…
Честно говоря, никогда не обращал на это специального внимания, просто всякая служебная информация печатается как на первых, так и на последних страницах
конечно встречал, многие самодеятельные сканы зачастую начинаются сразу с содержания (иногда с вотермарка), а обложка, аннотация и введение идут в конце
Спасибо. Учту.

Правда скрипт всё равно не будет работать для нераспознанных сканов…
А можно узнать, для чего этот номер нужен и как его можно будет использовать на практике (для чего) и вообще что он из себя предстовляет в кореном смысле?
По нему можно найти любую книгу :) А если точнее, то почитайте википедию, там каждая циферка расписана :)
в общем для систематизации, каталогизации и упрощения поиска книги в Интернете
Уникальный идентификатор книги. По нему можно найти любую книгу и, что важнее, найти её подробное описание. С полным списком авторов, годом издания, полным названием и т.п. Более того, существуют сайты, который предоставляют API для этого.

Я собираюсь написать программу каталогизатор книг. Аналог calibre, который мне не нравится.

Так вот, в программе достаточно будет указать на книгу, а информация о ней будет получена полностью автоматически.
когда напишите — не забудте поделится ;)
Вообще-то есть (http://extracoder.com/genesis/index.html). Можете скачать этот индекс кинг (http://extracoder.com/SharedFilesDownload.aspx?pageid=25&fileid=8&mid=37), он не содержит рекламы и прочего хламья и поставить на свой сайт.

А на форуме (http://gen.lib.rus.ec) есть так же битторрент файлы для скачивания всех эти книг. И это не считая того, что можно качать по прямым ссылкам.

Локальный API пока в разработке, есть только пробные версии, там на форуме всё написано.
А на чём намерены писать? У меня уже есть каталогизатор с импортом данных из амазона и планирую его расширять, всё на пхп.
Python, C, GTK+
По Unix традиции функционал и интерфейс будут отделены.
Web-морда тоже планируется, но не в первую очередь.

А что за катогизатор у вас? Он выложен в интернет?
У меня была цель быстрой каталогизации существующей базы книг — был сделан краулер, который индексировал базу книг, по имени папки пытался логически определить всё что мог, потом пытался вычитать ISBN из файлов в папке и если удавалось тянул с амазона всю информацию о книге + категории по версии амазона. Ну и предоставлял вебморду для сотрудников библиотеки которые далее вручную разбирали книги которые не удалось опознать автоматически. В открытом доступе его нету, если интересно могу поискать скринкаст
Да. Интересно. Буду благодарен.

Эта программа использовалась именно в библиотеке? Что за библиотеки у нас держат электронные книги?
Из-за «сотрудников библиотеки» я подумал что речь о реальных библиотеках.
Прошу прощения, неудачно выразился. Имелась в виду электронная библиотека, не публичная. Я попробую выдернуть оттуда что-то наглядное
Есть поиск по ISBN и добавление книг в базу с ozon.ru, shop.top-kniga.ru, kniga.ru и knigainfo.ru.
Меняемся?
Международный стандартный номер книги или ISBN (англ. International Standard Book Number) — уникальный номер книжного издания, необходимый для распространения книги в торговых сетях и автоматизации работы с изданием. Наряду с индексами ББК, УДК и авторским знаком, ISBN является частью так называемого издательского пакета… © Wikipedia.org ;)
Есть аналогичная софтина для виндовс и если не ошибаюсь линукс от активистов RuBoard
Что касается скрипта он не полностью соответствует стандарту ISBN и не опознаёт символ X в нём.
Спасибо. Учту про символ X.

А что за программа от активистов RuBoard не подскажете? Версии чисто под Windows\MacOS меня не интересуют.
Я не уверен предоставляется ли исходный код, но бесплатно распостранялась собранная версия командлайновая которая получая параметром путь к PDF книге сканировала её на предмет нахождения петтерна ISBN-10 и возвращала в случае нахождения. Собственно ничего особенного, но для конечного пользователя проще в использовании. Для проф. пользования я бы рекомендовал сделать собственный парсер с учётом различного написания ISBN кода и исправленным определением X
forum.ru-board.com/topic.cgi?forum=31&topic=5629&glp
может понадобиться регистрация

а также

torrents.ru/forum/viewtopic.php?t=693551
творчество в этой теме вылилось сюда: Library Genesis gen.lib.rus.ec

Вы не можете комментировать чаще, чем 1 раз в 5 минут
очень даже могу
gen.lib.rus.ec/

карма кагбэ номекает мне, что пора валить с хабра?
;-D
Результат специально сделан YAML-совместимым? Если да, то почему бы не упомянуть об этом?
Нет. Это банально распечатка Python-овского массива. Про YAML я узнал только что от вас.
И префиксы перед массивами. Видите, как здорово получилось!
Вот пример работы с системой (внутреннее название BookDozer). Основная масса книг распознаются и каталогизируются автоматически. Но для особых случаев предусмотрена и ручная обработка:
www.youtube.com/watch?v=-dGIvOUYI6o
Альтернативно — полуавтоматическая обработка книги, для которой ISBN не нашёлся ни в самой ебуке ни в сопутствующих файлах:
www.youtube.com/watch?v=zD1akDx19zY
Only those users with full accounts are able to leave comments. Log in, please.