Парсер сохраненный сайтов.

Тема в разделе "WASM.NETWORKS", создана пользователем Kira, 4 фев 2008.

  1. Kira

    Kira New Member

    Публикаций:
    0
    Регистрация:
    24 янв 2008
    Сообщения:
    17
    Такая проблема.
    Есть много сохраненных индекс файлов главных страниц.
    Задача такая ходить по каталогам и парсить файлы.
    Ну ладно парсить файлы на нахождение нужной инфы не такая уж и проблема.
    Я не знаю как ходить по каталога.
    Папки в таком виде =>
    например сайт mail.ru сохраняется в папке M в ней папка A потом идет папка mail.ru и в ней уже index.html
    соответственно сайт типа wasm.ru сохранится в папке W->A->wasm.ru->index.ru
    и так далее.
    В общем под компилятор gcc или qmake нужна функция которая в данной папке возвращает массив имен папок которые есть в папке-параметре.
    Помогите плз найти не могу.
    П.С.
    Тока щас подумал что это вроде как не в этой теме, но это продолжение моего интернет-приложения...
     
  2. rmn

    rmn Well-Known Member

    Публикаций:
    0
    Регистрация:
    23 ноя 2004
    Сообщения:
    2.348
    под винду? FindFirstFile/FindNextFile
     
  3. Kira

    Kira New Member

    Публикаций:
    0
    Регистрация:
    24 янв 2008
    Сообщения:
    17
    ой сорьки под линух
    а FindFirstFile/FindNextFile это наверно виновские только...
     
  4. boobl

    boobl New Member

    Публикаций:
    0
    Регистрация:
    10 фев 2008
    Сообщения:
    18
    http://www.gsp.com/cgi-bin/man.cgi?section=3&topic=opendir

    opendir открываем папку
    readdir или readdir_r читаем запись в каталоге одну за другой пока не нарвемся на NULL.