Распарсить html

Discussion in 'WASM.ZEN' started by darkcoder, Oct 4, 2007.

  1. darkcoder

    darkcoder New Member

    Blog Posts:
    0
    Joined:
    Feb 7, 2007
    Messages:
    58
    Люди есть ли готовые механизмы для того чтобы:
    1.Получить все ссылки на странице, с полными путями(регексп не предлагть).
    2.Распаристь джавскрипт и выполнить.
    Интересует как реализовать на unix сервере.
     
  2. n0name

    n0name New Member

    Blog Posts:
    0
    Joined:
    Jun 5, 2004
    Messages:
    4,336
    Location:
    Russia
    2. только через реализацию интерпретатора.
     
  3. darkcoder

    darkcoder New Member

    Blog Posts:
    0
    Joined:
    Feb 7, 2007
    Messages:
    58
    Неужели нельзя прикрутить как нибудь Тброзверь например, и из него выдрать результат от джаваскрипта?
     
  4. IceStudent

    IceStudent Active Member

    Blog Posts:
    0
    Joined:
    Oct 2, 2003
    Messages:
    4,300
    Location:
    Ukraine
    darkcoder
    Во-первых, не проще ли взять движок Мозиллы, например? Во-вторых, как ты себе представляешь
    ? JS в браузере — это не вещь в себе, ему требуется доступ к DOM страниц и непосредственно к браузеру.
     
  5. nobodyzzz

    nobodyzzz New Member

    Blog Posts:
    0
    Joined:
    Jul 13, 2005
    Messages:
    475
    на сколько готовое? просто либа для какого-нибудь языка?(Тогда вопрос для какого? =)
    вот может http://www.codeguru.com/vb/vb_internet/html/article.php/c4815/ это поможет
     
  6. UbIvItS

    UbIvItS Well-Known Member

    Blog Posts:
    0
    Joined:
    Jan 5, 2007
    Messages:
    6,242
    darkcoder
    если нужно выдрать код js из страницы, то, впринцепи, ничего сверх сложного тут нет: он обычно идёт обособленным блоком.
     
  7. device

    device Reflection

    Blog Posts:
    0
    Joined:
    Apr 26, 2007
    Messages:
    1,198
    Location:
    RF
    Ну ну.... А про KJSCmd никто не слышал, что ли?
     
  8. device

    device Reflection

    Blog Posts:
    0
    Joined:
    Apr 26, 2007
    Messages:
    1,198
    Location:
    RF
    Можно, учи ПЕЛРЕЬД
     
  9. n0name

    n0name New Member

    Blog Posts:
    0
    Joined:
    Jun 5, 2004
    Messages:
    4,336
    Location:
    Russia
    а про DOM тоже наверно никто не слышал?
     
  10. t00x

    t00x New Member

    Blog Posts:
    0
    Joined:
    Feb 15, 2007
    Messages:
    1,921
    там чёрт ногу сломит :)
    годится для простенького парсинга.
     
  11. device

    device Reflection

    Blog Posts:
    0
    Joined:
    Apr 26, 2007
    Messages:
    1,198
    Location:
    RF
    Я хотел сказать GTKHTML
     
  12. darkcoder

    darkcoder New Member

    Blog Posts:
    0
    Joined:
    Feb 7, 2007
    Messages:
    58
    спасибо всем за советы
    EmbeddedWb делает все это