Занимался я как-то сканированием самых старых книг из библиотеки Шрилы БВ Нараяны Махараджа, некоторые из них принадлежали Бхактисиддханте Сарасвати и были переданы Бхакти Прагьяне Кешаве Госвами. Естественно, к делу подошел очень тщательно. Месяц только ушел только на выбор методов и стандарта сканирования. Некоторые книги были изданы в конце 1800-х годов и при открытии страницы могли треснуть и рассыпаться. Приходилось работать скальпелем и собирать мозайки. Несколько книг выложены на
http://indianbooks.ru/library/
В качестве эталона можно посмотреть последнюю внизу.
Почему не DJVU? Многие индусы еще не знают что это такое, а с Адобом они выросли с детства (90% дух.литературы в Индии создаются в PageMaker).
Так вот, я пишу это все к тому, что
1) поделиться своим методом: Никаких фотоаппаратов, только сканер. С самого начала сканируется как black&white с высоким разрешением. Особо тщательный подход к соотношениям черного-белого – к балансу между зернышками на бумаге и отсутствием потерь тонких линий в буквах. Сканировал через файнридер, удобно что есть автомат (когда он сам туда сюда сканер гоняет, а ты только страницы переворачиваешь и вовремя прикладываешься), а также разрезалка разворотов. Сохранял в ТИФы с компрессией CCITT Group 4 (или 3, не помню). Потом обрезал поля ручками, то есть мышкой под текст каждую страницу. Обрезание быстрее всего давалось в Акробате (импорт каталога в пдф, обрезание, экспорт обратно в тифф). Но исходник оставался в Акробате, экспорт изображений нужен был только для того, чтобы вычислить максимальную ширину и максимальную высоту, среди обрезанных страничек. Отдельно узнать макс.высоту среди 700 фото, например, мне тогда удавалось только в ThumbsPlus. Сейчас возможно этому научились Explorer Windows7 или Adobe Bridge, не проверял. После выяснения цифр, экспортированные фото удаляются, возвращаемся к компиляции в Акробат. Следующая цель – сделать все страницы одного размера. Для этого создаем поля из расчета максимально возможной в обрезанном текстовом блоке высоты и ширины. Ну и далее и-бучные фишки: подогнать соответствие нумерации страниц со сканами, сделать оглавление, воткнуть цветную обложку, добавить распознавание текста (если книга на рус или англ.), дать людям возможность вносить пометки (открыть для комментирования), сохранить совместимость со старыми версиями Ридера (некоторые еще сидят на первых пнях с Акробат Ридером 5.0). За 7 лет наверняка появились более продвинутые методы, но я описал, как я делал это во Вриндаване в 2003-м.
2) У меня есть около сотни гигов сырых сканов, в основном книги на санскрите, хинди и бенгали (Сандарбхи, Гопала-чампу, Гармонист, Гаудия и др.) Не знаю, когда руки доберутся сделать из них и-буки. Если вы умеете собирать качественные книги со сканов в DJVU или Акробате и если вам интересно работать с книгами, на указанных языках, то могу делегировать проекты по созданию индийских электронных книг и передать исходники. Еще раз оговорюсь, среди сканов практически ничего нет на русском или английском - только хинди, бенгали, санскрит.