Собрать список слов текущей локали?

Тема в разделе "WASM.WIN32", создана пользователем Rel, 20 сен 2020.

  1. Rel

    Rel Well-Known Member

    Публикаций:
    2
    Регистрация:
    11 дек 2008
    Сообщения:
    5.241
    Задался таким странным вопросом, не спрашивайте зачем). Интересует на операционной системе семейства Windows собрать наиболее большой список уникальных слов на языке текущей системы. То есть, если система русская, то слова должны быть русскими.

    Пока пришло в голову пробрутфорсить коды ошибок, попихать их функции FormatMessage, забирать от нее сообщения об ошибках, разбивать по словам и собирать уникальные. Какие еще варианты тут можно придумать?
     
  2. M0rg0t

    M0rg0t Well-Known Member

    Публикаций:
    0
    Регистрация:
    18 окт 2010
    Сообщения:
    1.574
    Rel, если я правильно понял задачу, то имхо лучше пройтись по всем файлам (или конкретным, если известно где оно лежит) в system32, и поискать все utf-16 строки, дальше выбрать только русские, дальше только уникальные.
     
  3. youneuoy

    youneuoy New Member

    Публикаций:
    0
    Регистрация:
    7 сен 2020
    Сообщения:
    10
    наверное при таком подходе стоит пройтись по файлам в папке документов, по папке с загрузками и по разным файлам, список которых можно взять в реестре(файлы, для которых Comdlg32 использовался, папки установленных программ и т.д.). Думаю в этих местах обязательно что-то будет. Можно и вообще все файлы проверить или хотя бы названия всех папок(хотя возможно это стоит делать только если язык системы - английский).
     
  4. Pavia

    Pavia Well-Known Member

    Публикаций:
    0
    Регистрация:
    17 июн 2003
    Сообщения:
    2.409
    Адрес:
    Fryazino
  5. Rel

    Rel Well-Known Member

    Публикаций:
    2
    Регистрация:
    11 дек 2008
    Сообщения:
    5.241
    Дело в том, что таскать с собой словари - слишком утяжелит софт, выкачивать их - тоже ну такое себе решение. Хотелось бы составить словарь с помощью средств текущей операционной системы.