Смотрю различные парсеры для pdf и складывается такая картина: Одна группа идиoтов создает говно-формат pdf, для этого говноформата говнософт. Вторая группа идиoтов создает говноисходники для отображения говноформата. Опенсорсное решение: Размер исходников в килобайтах: Для желающих приобрести говна за деньги: Все глючит сжирает тонны ресурсов, и нихрена не работает.
Ну всегда есть другая группа, которая ничего не создает, а только постит свое негодование по богом забытым форумам.
Ого Delphi, кстати как скачать книжку по Delphi для "коллекции" с archive.org? Которая тоже в формате PDF, с набором картинок внутри без OCR, такие PDF слишком тяжелые, для древнего компа. Инструкции слишком заморочены и нужна установка петухона. Вот эту например https://archive.org/details/usingdelphi30000unse/
Если я правильно помню, то PDF начинался как закрытый формат документов для Adobe и изначально с ними работал только Adobe Reader. А раз формат был закрытый и под один набор программ, то и делать его удобных не было необходимости.
PDF 2.0 Invented by Adobe Systems and first released in 1993, Adobe’s PDF version 1.7 became ISO 32000-1 in 2008. Since then, over 40 members of ISO TC 171 SC 2 WG 8 from 20 countries have contributed to development of the PDF specification. https://pdfa.org/pdf-2-0-the-worldwide-standard-for-electronic-documents-has-evolved/
разве вообще етсь сколь угодно приближенный опенс-сорс формат? разве только ODT - https://en.wikipedia.org/wiki/OpenDocument но у него иная цель
Что такого есть в .pdf, чего нет в .html кроме aнального огораживания вроде водяных знаков? Все картинки, векторную графику можно засунуть внутрь .html файла, и доп. файлы не создавать. Есть таблицы, есть форматирование, есть графика, буквы например.
Ну может то, что в html это все у вас будет отдельными файлами и на принтер не отправишь, а pdf это единый контейнер как для текста и графики, так и для всяких новых видов анимаций итд, чтобы это можно было скинуть одним куском на принтер и распечатать статическую версию. Опять же PDF - Portable Document Format т.е. целью было перенести мультимедиа документ в неизменном виде на разные платформы и устройства. Т.е. не редактировать, а только перенести
Ворд-процессоры - это отдельный класс программ, которые нужно изучать, и которые часто не понятны программистам. Я с куда большим удовольствием пишу в формате Markdown в Obsidian, чем в либре оффисе или (боже упаси) ворде.