Поиск с учетом морфологии языка

Тема в разделе "WASM.HEAP", создана пользователем _DEN_, 30 авг 2011.

  1. _DEN_

    _DEN_ DEN

    Публикаций:
    0
    Регистрация:
    8 окт 2003
    Сообщения:
    5.383
    Адрес:
    Йобастан
    Привет.

    Если у кого-то был подобный опыт - пожалуйста, поделитесь. Нужно сделать поиск по сайту с учетом морфологии языка. Фишка в том, что поиск нужно делать из PHP-скрипта на самом сервере, чтобы результаты поиска выводить на самом сайте в его собственной верстке и без iframe-ов.

    Есть Google JSON API, которым можно было бы делать такой поиск, однако у этого API есть ограничение - 8 результатов за один запрос, и максимум 8 страниц, то есть - только 64 первых результата. API работает через сервер гугла и его индекс. Не устраивает ограничение, и то, что приходится делать запросы на внешний сервер.

    Есть Яндекс.Сервер, который работает локально, не затрагивая сервак и индекс самого Яндекса, однако, это немного не то - по правилам использования нужно чтобы на сайте была брендированная Яндексовская формочка поиска, и еще несколько неприятных мелочей.

    Вообще, в идеале мне нужно такое: есть набор пар "ID -> Текст", есть поисковая строка запроса. Нужно по строке получить набор ID, в котором встречается искомая строка с учетом морфологии языка.

    Что можно посоветовать кроме Google и Яндекса?
     
  2. wsd

    wsd New Member

    Публикаций:
    0
    Регистрация:
    8 авг 2007
    Сообщения:
    2.824
    _DEN_
    привет )
    может это и не совсем то, но глянь http://lucene.apache.org/
     
  3. 100gold

    100gold New Member

    Публикаций:
    0
    Регистрация:
    26 фев 2010
    Сообщения:
    165
    Есть ещё http://sphinxsearch.com/ и http://xapian.org/
    Для PHP наверное более удобен будет sphinx
     
  4. _DEN_

    _DEN_ DEN

    Публикаций:
    0
    Регистрация:
    8 окт 2003
    Сообщения:
    5.383
    Адрес:
    Йобастан
    wsd

    Ага, спасибо, похоже на правду. Попробую повтыкать.