Вести поиск не по ключевым словам а по смыслу запроса. Кто-нибудь занимался чем-нибудь подобным, интересно обсудить эту тему. При поиске в гугле например, вводится запрос, далее он просто проверятся на прдемет совпадения ключевых слов, если они найдены ресурс попадает в список результатов, при этом никто не проверят подходит по смыслу или нет, в результате можно надеется только на релевантность, но точность отсутсвует.
Я так понимаю, ты о Information Extraction? Технология google - это из области Information Retrieval. Я немного ковырялся, но до каких-то результатов не дошел. Ковырял GATE - http://gate.ac.uk/ предоставляет набор компонент для анализа текста. Как я понял, что может происходить: Мы задаем ключевые слова и набор интересующих нас документов. После синтаксического анализа нужно работать с онтологическим словарем (словарик с описанием понятий и связей между ними предметной области). + нужно будет описание каких-то сценариев или паттернов событий - чтобы можно было понять, что некоторая совокупность действий с некоторой вероятностью описывает какое-то понятие - скорее всего нейронная сеть...
Это называется "семантический поиск". Есть даже такие поисковики. Подробнее о ситуации в этой области можно почитать здесь: http://habrahabr.ru/blog/web30/44032.html
Спасибо за ссылки. Статья пролила свет, все это уже есть, но хуже гугла. Основные трудности с эмуляцией поискового бота который должен понять что искать. Процесс поиска должен походить на общение в аське. Интересно послушать еще какие-нибудь мнения