Успехи русскоязычных программистов

Тема в разделе "WASM.HEAP", создана пользователем masm32, 1 июн 2008.

  1. masm32

    masm32 New Member

    Публикаций:
    0
    Регистрация:
    26 фев 2008
    Сообщения:
    147
    !!! я же ясно сказал - пока могу только пункт 1.
    насчёт дурдома - сам такой : все люди делятся на дураков и подлецов ( которые тоже дураки ) 2-3% действительно умных людей можно не учитывать вообще....как будто их нет
     
  2. SWR

    SWR New Member

    Публикаций:
    0
    Регистрация:
    11 май 2006
    Сообщения:
    226
    Адрес:
    Russia
    1) pdf вывести на печать, а там либо файнридер или в джвю
    2) с увелич. разрешением фото проги уже есть. но на фото накладываются очень жесткие ограничении.
    второй пункт практически не решаем (лубий битый кадр убьет весь результат), да и оптичиские коррекции сильно портят картинку (уменьшают четкость).
     
  3. kaspersky

    kaspersky New Member

    Публикаций:
    0
    Регистрация:
    18 май 2004
    Сообщения:
    3.006
    masm32
    >> вот только смысл? подобных программ уже есть больше одной
    > смешно, особенно на фоне бесконечного количества антивирусов
    антивирусы являются специфичным продуктом, качество которого потребитель оценить не в состоянии, что приводит к появлению на рынке большого кол-ва откровенного дерьма. с распознаванием это не прокатит. если прога ничего не распознает, ей никто не будет пользоваться, даже если ее раздавать даром.

    но мне просто интересно - зачем писать такую прогу, если можно доработать уже готовые? библиотеки для работы с глифами в опенсорсах наблюдаются в большом кол-ве. чтение pdf вообще не проблема. файн-ридер - отстой. у меня к HP сканеру прилагается какой-то ORC, явно нерусского производства, но русский он (среди прочи других языков) распознает намного лучше, процент ошибок меньше, лучше сохраняется форматирование.

    > Распознавалки ПДФ есть, платные,
    ты что?! или лихнух уже не дружит с pdf? :derisive: да и pdf не настолько сложный формат, чтобы не разобрать его руками, если лень изучать чужие библиотеки, которые если GPL, то возникают проблемы с продажей твоей проги. не уверен, что можно быстро найти библиотеку для pdf с BSD лицензией, но вообще-то если поискать...

    > работаю очень медленно и вообще плохо,
    > кириллицу как правило не считают за шрифт...
    кириллица не имеет особых проблем с распознаванием...
    во всяком случае распознать знак процента, написанный курсивом и то сложнее ;)

    > так не поймёшь что... опен тоже есть,
    > но исходников что-то не видел... и опять - с, с++ или даже дельфи...
    ключевое слово - глифы. на си++ программ валом. чуть меньше на си.
    на дельфи - не видел. почти все под никсы, но портируются под вынь
    без особых проблем... хотя если это C99 то... ну там да... под вынь
    трудности с компиляцией могут быть...

    > а нужна она - есть хорошие проги для чтения,
    > но им же нужен текстовый файл или уод...
    полностью автоматизировать процесс распознавания не научился еще никто.
    так что это кропотливая ручная работа по любому...

    > В астрономии существует метод - берутся 2 фотопластинки,
    > совмещаются и делается ещё одна фотопластинка.
    и не только фотопластинки. цифровые видеокамеры рулят.
    в плане повышения разрешения за счет наложения.
    четвертьпиксельная точность - это уже давно стандарт де-факто.
    достаточно в среднем снять 16 кадров неподвижного объекта
    или программно компенсировать движение, но тогда может
    потребоваться и больше 16ти кадров... и такие проги даже
    встраиваются в микрокод многих камер, что не есть секрет ;)

    > но ... хочется надеяться на лучшее.
    любой даже самый задрипанный сканер обеспечивает разрешение вполне достаточно для распознавания и потому танцев с бубном делать не надо. если у тебя есть готовый отсканенный pdf с низким разрешением, то... там применяются совсем другие алгоритмы.
    не уверен, что я смогу их описать в двух словах, но общий смысл таков, что там задействуется слоговая азбука, т.е. распознание идет не по символам, а по слогам с поиском наилучего соотвествия. допустим, если в тексте встречаются только слоги A1B, A2B и A3B, то второй символ выбирается среди трех вариантов, а не среди всех букв алфавита, что позволяет уверенно распознавать тексты низкого разрешения и сильно "зашумленные" или с "выпавшими" пикселями. и все это уже есть. конкретно библиотек для распознавания отсканированного текста я там быстро не назову, меня больше интересует распознавание субтитров, где своя специфика, но основные принципы - все те же.
     
  4. masm32

    masm32 New Member

    Публикаций:
    0
    Регистрация:
    26 фев 2008
    Сообщения:
    147
    Всё, крылья моей мечте подрезали окончательно

    идея #3

    звук фоно нравится людям, потому-что он никогда не бывает ...одинаковый
    мп3 - очищенный , профильтрованый и так далее надоедает очень быстро, так же как и однообразные звуки левых синтезаторов..

    написать бы плэйер, который будет иммитировать магнитофон ( катушечный ) - небольшая, не заметная на слух, но фиксируемая подсознанием девиация частоты, и параметров усилителя .. плюс возможность - немного замедлять или ускорять воспроизведение ( и запоминать в новом файле это). Прикольно, но отчётливо помню композиции, который слушал на своих магнитофонах когда-то давным давно - некоторые звучали намного лучшее, после того как плёнка вытягивалась.... немножко...
     
  5. DEEP

    DEEP Андрей

    Публикаций:
    0
    Регистрация:
    27 апр 2008
    Сообщения:
    491
    Адрес:
    г. Владимир
    Фига себе о_0 у меня тоже прога к НР сканеру прилагалась. Называется dpe_ocr. Создаёт просто шедевриальный компот из кириллицы и латиницы в почти что каждом слове (напр, постоянно распознаёт Ы как bl (BL), а Л - как JI). Более того, некоторые буквы (даже латиницу!) в упор не узнаёт. Ну уж о шрифтах вообще молчу, тут просто пестня =\ Плюс постоянно загаживает своими словарями "узнанных символов" всю папку МоиДокументы. Короче, файнридер - просто идеал по сравнению с данным продуктом!

    ЗЫЖ: Наверное, дело в том что модели разные...
     
  6. _basmp_

    _basmp_ New Member

    Публикаций:
    0
    Регистрация:
    10 июл 2005
    Сообщения:
    2.939
    masm32
    О еще один жирик!
    В смысле не учитывать?! Так все-ж только на них и держится. Дураки, так вообще левый балласт, мешают только. Генофонд тс. Да и побольше умных чем 3%. Тут следует учитывать, что каждый судит о других по себе и никто не будет необосновано рвать жилы для повышения своего статуса в глазах первого встречного. Даже если встречный - зарвавшийся наглец.
     
  7. masm32

    masm32 New Member

    Публикаций:
    0
    Регистрация:
    26 фев 2008
    Сообщения:
    147
    просьба Фоменко не трогать - это истинный учёный, неслабый математик и художник ещё к тожу же. Стандартная хронология - бредятина, которую сочинили попы... для рабов.
     
  8. _basmp_

    _basmp_ New Member

    Публикаций:
    0
    Регистрация:
    10 июл 2005
    Сообщения:
    2.939
    masm32
    Да кто-ж его трогает? Кому охота дерьмо в руки брать?
     
  9. Stiver

    Stiver Партизан дзена

    Публикаций:
    0
    Регистрация:
    18 дек 2004
    Сообщения:
    812
    Адрес:
    Germany
    masm32

    Хватит позориться. Закрыли бы уже тему..
     
  10. kaspersky

    kaspersky New Member

    Публикаций:
    0
    Регистрация:
    18 май 2004
    Сообщения:
    3.006
    DEEP
    > Фига себе о_0 у меня тоже прога к НР сканеру прилагалась. Называется dpe_ocr
    у меня HP 1200 купленный лет не помню сколько тому назад. сравнивал с тогдашним файном, обнаружив две большие разницы ;) возможно, сейчас файн ушел вперед, но HP распознавал очень нехило. куда уж лучше, включая таблицы со сложным форматированием. может модули и разные, хз. сканер брал в местном магазине под заказ с московского склада, так что крайне маловероятно, что это была какая-то спец-поставка ;) там только это... из кучи языков я сразу удалил все на хрен, оставив только кирилицу и латиницу, причем там кириллический алфавит излишне полный (см. википедию :derisive: его тоже пришлось урезать. до этого он действительно делал какую-то кашу из символов (сейчас что-то такое смутно вспоминается), но там все это настраиваемое...

    masm32
    > мп3 - очищенный, профильтрованый и так далее надоедает очень быстро,
    > так же как и однообразные звуки левых синтезаторов..
    слушай heimataerde и LAme-immortelle - долго не надоест ;)

    > написать бы плэйер, который будет иммитировать магнитофон ( катушечный )
    > небольшая, не заметная на слух, но фиксируемая подсознанием девиация
    > частоты, и параметров усилителя ..
    подсознание тут с какого боку? кури faq на предмет психологии восприятия :derisive:
    а такие дела могут даже дерьмовые карты имитировать. у меня на эпошке
    какой-то встроенный звук, так вот там в настройках карты можно включать
    эффекты такого рода, пользуюсь любым плеером, т.к. это делается на уровне
    драйвера, а может и железа - я не вникал в эти подробности, потому как мне
    хочется получить чистый звук. аппаратный эквалайзер порадовал, потому как
    стало возможным крутить его при проигрывании сидюков обычным плеером, но
    сам звук - просто ужасный, я давно туда воткнул бластер за двести баксов
    (знаю, что дрянь, но я не меломан, а по моим ушам медведь потоптался,
    но меня такое качество устраивает, а вот встроенный звук - рррррргав!!!!)

    не помню где видел рекламный слоган смысл которого типа так,
    что не надо ничего придумать, просто посетите выставку в китае.
    типа все уже придумано за вас :derisive:))

    и это... идеи генерировать это, конечно, хорошо, но написать такую программу лучше.
    типа плагин для того же winamp. а тягаться с бобиками цифре тяжело. цифровой сигнал,
    точнее оцифрованный, имеет совсем другую природу, нежели аналоговый, что чуткие
    уши меломанов сразу чувствуют (мои нет). ну это как если вместо непрерывного
    спектра телевизор дает только три цвета, смесь которую наш глаз воспринимает
    как бы "натурально", но с теми оговорками, что цветовосприятие у всех разное.
    а кто-то даже видит четыре цвета, а не три. так что все одно фигня получается.
    добится качественной цветопередачи таким образом невозможно в принципе.
    цифровой звук (в лучшем случае!) разбивает исходный аналоговый сигнал
    на ряд гармоник различных частот, которые при обратном преобразовании
    дают нечто похожее на оригинал, но в действительности ни фига подобного,
    т.к. исходный сигнал ни разу не гармоничный и потому к нему строго говоря
    фурье-преобразование применять нельзя. то есть можно, конечно, но вот...
    качество... о качестве придется забыть...
     
  11. masm32

    masm32 New Member

    Публикаций:
    0
    Регистрация:
    26 фев 2008
    Сообщения:
    147
    спасибо :dntknw:( тема зарыта Х
     
  12. _basmp_

    _basmp_ New Member

    Публикаций:
    0
    Регистрация:
    10 июл 2005
    Сообщения:
    2.939
    нгновенно-воспринимаемые гармоники у некоторых могут доходить до 300КГц (читал в какой-то старой книжке по звуку). Звуковух под частоты > 600КГц просто нет. Кроме того от компа наводки..
     
  13. _basmp_

    _basmp_ New Member

    Публикаций:
    0
    Регистрация:
    10 июл 2005
    Сообщения:
    2.939
  14. _basmp_

    _basmp_ New Member

    Публикаций:
    0
    Регистрация:
    10 июл 2005
    Сообщения:
    2.939
  15. _basmp_

    _basmp_ New Member

    Публикаций:
    0
    Регистрация:
    10 июл 2005
    Сообщения:
    2.939
    masm32
    Вместо идее-генераторства попробуйте начать снизу. Войдите в какой-нибудь опенсорцовый проект кодером, скриптером или сайторисователем. Или даже наборщиком текстов (для доков например). Большая польза будет. И вам. И всем кто не вам.
     
  16. kero

    kero Модератор SOURCES & 2LZ Команда форума

    Публикаций:
    0
    Регистрация:
    4 апр 2006
    Сообщения:
    1.074
    Адрес:
    Москва
    Граждане русскоязычные программисты, не будьте же такими садистами!
    Учитесь у партизана: пришел и пристрелил несчастного, чтоб не мучился.