Привет всем. Последнее время интенсивно пользуюсь пакетом Statistica и встроенными в него нейросетевыми возможностями. Так вот задаю диапазон сетей который нужно создать и обучить а потом прогнрамма оставляет Н-лучших сетей. Как выбрать ту которая дает самый праивльный результат. В литературе написанно по гистограмме остатков. Т.е. они должны быть распредленны по нормальному закону распределения. Я так раньше и делал, но столкнулся стем что визуально бывает 3-4 сети одна лучше другой и уже так не определиш где график "нормальней". Дальше в литературе пошли опечатки поэтому интересуюсь. Там есть 3 покзателя меры обучения сети - ошибка обучения, контрольная ошибка, и тестовая ошибка. По идее чем ближе ошибка обучния к контрольной ошибке тем лучше обученна сеть? Осли ошибка обучения выше нежели контрольная то сеть ндообученна? И если наоборот ошибка обучения ниже то сеть переобученна? Как к этим умозаключениям подключить тестовую ошибку? Получается просто такая интересная картина, 5 лучших сетей часто адют диаметрально противоположные результаты. Но срдеи них обязательно есть результат который ну очень хорошо повторяет то что будет завтра, провернно неоднократно. Самое главно сейчас научится предварительно нахдить эту самую правдивую сеть.
Это конечно конструктивно. Но боевой инструент пока пакет Statistica и там на выходе такого результата нет. Там 3 основных критерия ошибка обучения. контрольная ошибка и тестовя ошибка.
Самое интресное открытие в том что в statistica snn, самый главный критерий который определяет качество прогнозирование, ото тестовая ошибка все остальное мишура. Для других программ по идее тоже все просто нужно придумать заковыристую функцию, протабулироватьее на 100 значений и скормить эти данные сети. А потом проверить прогноз на следующие 10 значений. И там уже смотреть по критериям сетей.