Измеения качество текста в DjVU

Тема в разделе "WASM.SOFTWARE", создана пользователем JCronuz, 27 июн 2008.

  1. JCronuz

    JCronuz New Member

    Публикаций:
    0
    Регистрация:
    26 сен 2007
    Сообщения:
    1.240
    Адрес:
    Russia
    Приветствую всех.

    Сейчас много книг в формате DjVu и попадаются низкого качество. Можно ли
    изменить качество текста, естественно в лучшую сторону.
     
  2. nds

    nds Member

    Публикаций:
    0
    Регистрация:
    16 июл 2007
    Сообщения:
    157
    попробуй разные режимы отображения(например только текст)
     
  3. 6arrep

    6arrep New Member

    Публикаций:
    0
    Регистрация:
    10 мар 2006
    Сообщения:
    92
    Адрес:
    London
    какой гражданин придумал этот формат вообще? Я пару въюверов попробовал, поплевался и решил никогда больше не качать в этом формате. И это гавно ещё призвано конкурировать с pdf , ересь. адоб хоть бесплатный вьювер хорошего качества предоставляет.
    Экономней мол, да в наше время пара лишних десятков метров ничего не решает, и это если сам pdf ничем не обжимать. Фтопку DjVu однозначно.
     
  4. Pavia

    Pavia Well-Known Member

    Публикаций:
    0
    Регистрация:
    17 июн 2003
    Сообщения:
    2.409
    Адрес:
    Fryazino
    jCronuz
    Таких утелит нету. Формат очень интерестный.
    Незнаю где вы видели в низком качестве. Могу только посоветовать увеличить зум.

    6arrep
    Вам нравиться таскать книги в pdf по 50 и более метров? Как помне если книга в 10 раз меньше и выгледит лучши то это однозначно плюс. Мне читалки нравятся. Если вам не нравятся ну чтож напишите свою. Формат открытый.
     
  5. 6arrep

    6arrep New Member

    Публикаций:
    0
    Регистрация:
    10 мар 2006
    Сообщения:
    92
    Адрес:
    London
    Pavia
    посоветуй правильную бесплатную (крякнутую) читалку, хочу посмотреть что ты считаешь выглядит лучше чем pdf
    Кстати офис pdf понимает уже, и внёмже можно обжать его по самые помидоры в плоть до автоопределения текста и сохранении его как такового...
     
  6. Stiver

    Stiver Партизан дзена

    Публикаций:
    0
    Регистрация:
    18 дек 2004
    Сообщения:
    812
    Адрес:
    Germany
    jCronuz

    DjVu - это по сути набор картинок (обычно отсканированных), сжатых определенным алгоритмом. В каком качестве сканировалось, такого и результат будет. Если хочется улучшить, то можно разобрать файл djvu на эти самые отдельные картинки/страницы, обработать их по вкусу и собрать обратно. Достаточно легко убрать мусор, выровнять текст и поля. При желании можно пересчитать в другое разрешение, но польза сомнительна. Практически невозможно изменить цветность, например перегнать серый в ч/б. В общем смотря что не нравится.

    6arrep
    Пара десятков помножить на пару сотен/тысяч книг.. pdf на 50 MB даже по почте не переслать нормально. Уже довольно давно книги сканируются только в djvu. Для чтения пользуюсь обычно WinDjVu.
     
  7. 2FED

    2FED New Member

    Публикаций:
    0
    Регистрация:
    20 фев 2008
    Сообщения:
    1.002
    http://file007.mylivepage.com/chunk7/57604/52/DJVUCNTL_601_EN.EXE
     
  8. JCronuz

    JCronuz New Member

    Публикаций:
    0
    Регистрация:
    26 сен 2007
    Сообщения:
    1.240
    Адрес:
    Russia
    Видел книгу в DjVu формате, так там качество сканирования было написано 200 dpi, вот качество как у PDF'ок. А в основном низкокачественные, зато весят в пределах 10 метров, но бывают и исключения.

    Вот ни когда не встречал конвертера, какого нибудь, в прошлый раз посоветовали ABBY FineReader, нашел только 150 метровый, который скачать не смог.

    На sourceforge находил djvu конвертеры под линукс, которые не возможно было скачать.
    В общем уже столько времени существует этот формат, а до сих пор нет конвертеров для него, в текстовый формат.
     
  9. Pavia

    Pavia Well-Known Member

    Публикаций:
    0
    Регистрация:
    17 июн 2003
    Сообщения:
    2.409
    Адрес:
    Fryazino
    jCronuz
    Есть утилита djvuOCR распаковывает в BMP и передает в ABBY FineReader на распознование. На самом деле можно было бы ускорить распознование так как сам формат по сути содержит уже распознанные страницы. Текст разбивается на изоброжения символов среди которых ищются похожии символы. А далее текст книги по сути представляет из себя набор этих символов и положение их дубликатов на странице. Разумеется это все еще сжимается. Остается только распознать символы.

    Сейчас не слежу за тем что там твориться. Возможно что-то изменилось.
     
  10. Y_Mur

    Y_Mur Active Member

    Публикаций:
    0
    Регистрация:
    6 сен 2006
    Сообщения:
    2.494
  11. Y_Mur

    Y_Mur Active Member

    Публикаций:
    0
    Регистрация:
    6 сен 2006
    Сообщения:
    2.494
    jCronuz
    Djvu - это формат для сканированных книг в виде картинок, поэтому альтернативы распознавания через FineReader или нечто подобное нет. Иногда Djvu файл может содержать обычный текст, наложенный на картинку, и тогда текст легко копируется через стандартный буфер обмена, но сначала его кто-то должен распознать (через FineReader и т.п.) и наложить - поэтому такие книги встречаются редко, хотя желающие их создавать всё таки есть.