Распарсить html

Тема в разделе "WASM.ZEN", создана пользователем darkcoder, 4 окт 2007.

  1. darkcoder

    darkcoder New Member

    Публикаций:
    0
    Регистрация:
    7 фев 2007
    Сообщения:
    58
    Люди есть ли готовые механизмы для того чтобы:
    1.Получить все ссылки на странице, с полными путями(регексп не предлагть).
    2.Распаристь джавскрипт и выполнить.
    Интересует как реализовать на unix сервере.
     
  2. n0name

    n0name New Member

    Публикаций:
    0
    Регистрация:
    5 июн 2004
    Сообщения:
    4.336
    Адрес:
    Russia
    2. только через реализацию интерпретатора.
     
  3. darkcoder

    darkcoder New Member

    Публикаций:
    0
    Регистрация:
    7 фев 2007
    Сообщения:
    58
    Неужели нельзя прикрутить как нибудь Тброзверь например, и из него выдрать результат от джаваскрипта?
     
  4. IceStudent

    IceStudent Active Member

    Публикаций:
    0
    Регистрация:
    2 окт 2003
    Сообщения:
    4.300
    Адрес:
    Ukraine
    darkcoder
    Во-первых, не проще ли взять движок Мозиллы, например? Во-вторых, как ты себе представляешь
    ? JS в браузере — это не вещь в себе, ему требуется доступ к DOM страниц и непосредственно к браузеру.
     
  5. nobodyzzz

    nobodyzzz New Member

    Публикаций:
    0
    Регистрация:
    13 июл 2005
    Сообщения:
    475
    на сколько готовое? просто либа для какого-нибудь языка?(Тогда вопрос для какого? =)
    вот может http://www.codeguru.com/vb/vb_internet/html/article.php/c4815/ это поможет
     
  6. UbIvItS

    UbIvItS Well-Known Member

    Публикаций:
    0
    Регистрация:
    5 янв 2007
    Сообщения:
    6.242
    darkcoder
    если нужно выдрать код js из страницы, то, впринцепи, ничего сверх сложного тут нет: он обычно идёт обособленным блоком.
     
  7. device

    device Reflection

    Публикаций:
    0
    Регистрация:
    26 апр 2007
    Сообщения:
    1.198
    Адрес:
    RF
    Ну ну.... А про KJSCmd никто не слышал, что ли?
     
  8. device

    device Reflection

    Публикаций:
    0
    Регистрация:
    26 апр 2007
    Сообщения:
    1.198
    Адрес:
    RF
    Можно, учи ПЕЛРЕЬД
     
  9. n0name

    n0name New Member

    Публикаций:
    0
    Регистрация:
    5 июн 2004
    Сообщения:
    4.336
    Адрес:
    Russia
    а про DOM тоже наверно никто не слышал?
     
  10. t00x

    t00x New Member

    Публикаций:
    0
    Регистрация:
    15 фев 2007
    Сообщения:
    1.921
    там чёрт ногу сломит :)
    годится для простенького парсинга.
     
  11. device

    device Reflection

    Публикаций:
    0
    Регистрация:
    26 апр 2007
    Сообщения:
    1.198
    Адрес:
    RF
    Я хотел сказать GTKHTML
     
  12. darkcoder

    darkcoder New Member

    Публикаций:
    0
    Регистрация:
    7 фев 2007
    Сообщения:
    58
    спасибо всем за советы
    EmbeddedWb делает все это