![]() Главная страница Случайная лекция ![]() Мы поможем в написании ваших работ! Порталы: БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика ![]() Мы поможем в написании ваших работ! |
Стандартная ошибка оценкиОчевидно, величины ошибок, полученных в процессе оценки Y по X, характеризуют точность оценивания. Для рассматриваемых данных, то есть n пар значений X и Y, разности между фактическими значениями Y и предсказанными значениями
Один из нескольких возможных способов измерения точности предсказания Y по X – применение дисперсии n ошибок оценки ei. Она не будет зависеть от среднего значения, всегда равного нулю, и от количества остатков, потому что используется операция деления на n – 1. Дисперсия n оценок
В конечном счете
Уравнение (8.6) дает дисперсию ошибки оценки в терминах дисперсии Y и rху. Положительное значение квадратного корня из дисперсии ошибки оценки называется стандартной ошибкой оценки:
Стандартную ошибку оценки можно применить для определения пределов в окрестности предсказанного значения 1. Около 69% объектов будут иметь фактические значения, лежащие в пределах одной se от их предсказанного значения 2. Около 95% будут иметь фактические значения, лежащие в пределах двух se от их 3. Примерно 99,7% будут иметь фактические значения, лежащие в пределах трех se от Эти утверждения обоснованны, так как если справедливо допущение о двумерной нормальности, то распределение фактических значений Y нормальное относительно среднего b0 + b1X со стандартным отклонением se для любого X. (Обратите внимание, что, хотя среднее нормального распределения Y меняется от одного значения X к другому, стандартное отклонение sе не зависит от X). Эти соотношения показаны на рис. 8.3. Рис. 8.3 – Пример стандартной ошибки оценки, sе, на четырех уровнях X, Связи b0 и b1 с другими описательными статистиками Как задачи подбора «наилучшей» линии предсказания, так и измерения корреляции двух переменных касаются пары переменных для группы объектов. В обоих случаях данные можно представить на диаграмме рассеивания. Есть несколько интересных соотношений между rxy, sx, sy и коэффициентами b0 и b1 для прямой метода наименьших квадратов.
то есть b1 равен ковариации X и Y, деленной на дисперсию X. Ковариация X и Υ для данных табл. 8.1 составляет 27,211, а Вспомните, что
то получим b1:
Дисперсия предсказываемых значений, то есть значений
Измерение нелинейных связей между переменными, корреляционное отношение η2 Этот параграф приведен здесь ради полноты и логической последовательности. Вы поймете его лучше после прочтения главы 15 об однофакторном дисперсионном анализе.
Рис. 8.4 – Связь между возрастом и характеристикой 28 людей
Мы уже говорили, что произведение моментов Пирсона r измеряет лишь степень линейной связи между X и Y, теперь укажем еще описательную меру, применяемую в том случае, когда связь между X и Y преимущественно нелинейна. В качестве примера нелинейной связи рассмотрим данные рис. 8.4, показывающие связь возраста X с результатами Y вспомогательного теста цифра-знак шкалы интеллекта взрослых Векслера (WAIS). Данные рис. 8.4 представлены в табл. 8.2. Из рис. 8.4 видно, что результаты растут линейно от 10 до 22 лет, достигают пика и затем довольно быстро уменьшаются. Таблица 8.2 WAIS – Вспомогательный тест цифра-знак, располагающий по шкале оценки 28 лиц в восьми возрастных группах с равным шагом
Мера линейной или нелинейной связи X и Υ обозначается η2 (читается «эта в квадрате») и называется корреляционным отношением. Корреляционное отношение определяется так:
где Для первого значения X находим отклонения соответствующих значений относительно их среднего и вычисляем сумму квадратов этих отклонений. Например, первая сумма квадратов в табл. 8.2 есть (7 – 8,60)2 + (8 – 8,60)2 + (9 – 8,60)2 + (9 – 8,60)2 + (10 – 8,60)2. Этот процесс повторяется для каждого значения X. Так, для X = 14 имеем: (8 – 9,50)2 + (9 – 9,50)2 + (10 – 9,50)2 + (11 – 9,50)2. Для последней группы, Х = 38, сумма квадратичных отклонений значений Y относительно их среднего равна (8 – 8)2 = 0, поскольку есть только одно значение. Наконец, складываем эти суммы квадратов отклонений для всех значений X. В результате имеем SSвнутри. (Если вы читаете этот раздел после главы 15, то обратите внимание, что SSвнутри есть «внутригрупповая сумма квадратов» в однофакторном дисперсионном анализе с неравными п). Для данных табл. 8.2 величина SSобщая равна 54,68, а SSвнутри = 24,87. Отсюда значение
Последующие соображения касаются интерпретации Важно отметить, что Величину
Уравнение (8.12) показывает, что Как и в случае
Дата добавления: 2014-11-01; просмотров: 703; Нарушение авторских прав ![]() Мы поможем в написании ваших работ! |