Главная страница Случайная лекция Мы поможем в написании ваших работ! Порталы: БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика Мы поможем в написании ваших работ! |
Оценка качества регрессионной модели в целом
Под качеством регрессионной модели понимается значимость модели в целом и её параметров, а также ошибка моделирования. Для оценки качества модели в целом используется коэффициент детерминации, который в общем случае определяется как где - общая дисперсия результатного признака, - остаточная дисперсия, - дисперсия объясняющей части общей дисперсии.
Чем ближе к 1, тем выше качество регрессионной модели. В случае линейной регрессии:
где - определитель матрицы парных коэффициентов корреляции, - определитель матрицы межфакторной корреляции.
Для двухфакторной модели
Другим способом оценки качества регрессионной модели в целом является использование F-критерия Фишера, определяемого как
Тем самым величина F-критерия связана с коэффициентом детерминации, а именно
где m – число параметров при переменной х, в линейной модели совпадает с числом включенных в модель факторов; n – число наблюдений. Для двухфакторной (парной) модели
Значение полученного фактического F-критерия сравнивается с табличным значением на уровне α = 0,05, и если , то модель в целом считается значимой (существенной).
2.9. Оценка значимости факторов, включаемых в модель множественной регрессии Кроме значимости уравнения регрессии в целом, оценивается так же значимость каждого фактора, включенного в регрессионную модель. Незначимые факторы включать в модель нецелесообразно. Для оценки значимости коэффициентов регрессии используется t-критерий Стьюдента: , где – СКО коэффициента регрессии , которое может быть определено как При использовании пакета программ статистического анализа программа наряду с регрессионной моделью выведет сообщения о значимости как всей зависимости в целом, так и о значимости каждого параметра модели. Пусть необходимо построить модель по следующим данным:
Будет получено следующее решение: Зависимость
Ниже можно сделать выводы. В целом модель существенна, т.к. , т.е. объясняющая дисперсия гораздо больше остаточной. Действительно, так как , то:
(ошибки округления).
t - статистика в данном случае показывает, во сколько раз значение параметра больше, чем СКО параметра. Если значение параметра меньше, чем СКО параметр, то параметр незначим, даже если параметр больше СКО, но , то это превышение недостаточно. Только параметр является значительным, так как (в 7,42 раза) и . Таким образом, значимость модели в целом достигается лишь за счет параметра .
Проанализируем переменные. Матрица парных коэффициентов:
Видно, что очень сильная связь между y и , остальные коэффициенты корреляции незначимы. Вообще говоря, целесообразно рассмотреть парную модель , где . Получим , F=170,81, , т.е. модель в целом значима.
Так как для , то этот параметр незначим (в данном случае, т.е. в случае парной регрессии, значимость параметра a, и значимость модели в целом совпадает), незначим в силу малого числа наблюдений. Этот пример наглядно показывает, что учет множества факторов не всегда приводит к адекватной модели, наоборот, сокращение числа факторов может улучшить модель.
В рассмотренном примере легко перейти от приведенных коэффициентов к структурным:
Откуда: или
Например, уравнение в структурной форме:
Приведенная форма: обратный переход дает прежние значения коэффициентов a11, a22, b12 , b21.
Дата добавления: 2014-03-19; просмотров: 1395; Нарушение авторских прав Мы поможем в написании ваших работ! |