Приветствую всех. Сейчас много книг в формате DjVu и попадаются низкого качество. Можно ли изменить качество текста, естественно в лучшую сторону.
какой гражданин придумал этот формат вообще? Я пару въюверов попробовал, поплевался и решил никогда больше не качать в этом формате. И это гавно ещё призвано конкурировать с pdf , ересь. адоб хоть бесплатный вьювер хорошего качества предоставляет. Экономней мол, да в наше время пара лишних десятков метров ничего не решает, и это если сам pdf ничем не обжимать. Фтопку DjVu однозначно.
jCronuz Таких утелит нету. Формат очень интерестный. Незнаю где вы видели в низком качестве. Могу только посоветовать увеличить зум. 6arrep Вам нравиться таскать книги в pdf по 50 и более метров? Как помне если книга в 10 раз меньше и выгледит лучши то это однозначно плюс. Мне читалки нравятся. Если вам не нравятся ну чтож напишите свою. Формат открытый.
Pavia посоветуй правильную бесплатную (крякнутую) читалку, хочу посмотреть что ты считаешь выглядит лучше чем pdf Кстати офис pdf понимает уже, и внёмже можно обжать его по самые помидоры в плоть до автоопределения текста и сохранении его как такового...
jCronuz DjVu - это по сути набор картинок (обычно отсканированных), сжатых определенным алгоритмом. В каком качестве сканировалось, такого и результат будет. Если хочется улучшить, то можно разобрать файл djvu на эти самые отдельные картинки/страницы, обработать их по вкусу и собрать обратно. Достаточно легко убрать мусор, выровнять текст и поля. При желании можно пересчитать в другое разрешение, но польза сомнительна. Практически невозможно изменить цветность, например перегнать серый в ч/б. В общем смотря что не нравится. 6arrep Пара десятков помножить на пару сотен/тысяч книг.. pdf на 50 MB даже по почте не переслать нормально. Уже довольно давно книги сканируются только в djvu. Для чтения пользуюсь обычно WinDjVu.
Видел книгу в DjVu формате, так там качество сканирования было написано 200 dpi, вот качество как у PDF'ок. А в основном низкокачественные, зато весят в пределах 10 метров, но бывают и исключения. Вот ни когда не встречал конвертера, какого нибудь, в прошлый раз посоветовали ABBY FineReader, нашел только 150 метровый, который скачать не смог. На sourceforge находил djvu конвертеры под линукс, которые не возможно было скачать. В общем уже столько времени существует этот формат, а до сих пор нет конвертеров для него, в текстовый формат.
jCronuz Есть утилита djvuOCR распаковывает в BMP и передает в ABBY FineReader на распознование. На самом деле можно было бы ускорить распознование так как сам формат по сути содержит уже распознанные страницы. Текст разбивается на изоброжения символов среди которых ищются похожии символы. А далее текст книги по сути представляет из себя набор этих символов и положение их дубликатов на странице. Разумеется это все еще сжимается. Остается только распознать символы. Сейчас не слежу за тем что там твориться. Возможно что-то изменилось.
jCronuz Djvu - это формат для сканированных книг в виде картинок, поэтому альтернативы распознавания через FineReader или нечто подобное нет. Иногда Djvu файл может содержать обычный текст, наложенный на картинку, и тогда текст легко копируется через стандартный буфер обмена, но сначала его кто-то должен распознать (через FineReader и т.п.) и наложить - поэтому такие книги встречаются редко, хотя желающие их создавать всё таки есть.