Студопедия

Главная страница Случайная лекция


Мы поможем в написании ваших работ!

Порталы:

БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика



Мы поможем в написании ваших работ!




Стандартная ошибка оценки

Читайте также:
  1. I 4. Условия эффективности педагогической оценки
  2. Алгоритм оценки научной публикации по разделам статьи Название
  3. Анализ предложенных критериев оценки эффективности вибрационного формования порошковых сред
  4. Балльная структура оценки
  5. Балльно-рейтинговая система оценки успеваемости
  6. Балльно-рейтинговая система оценки учебных достижений студентов
  7. Бухгалтерский и налоговый учет переоценки и продажи акций, обращающихся на ОРЦБ
  8. Важный момент отчета — обоснование выбора тех или иных методов оценки.
  9. Виды кислотности, методы определения и оценки
  10. Виды педагогической оценки

Очевидно, величины ошибок, полученных в процессе оценки Y по X, характеризуют точность оценивания. Для рассматриваемых данных, то есть n пар значений X и Y, разности между фактическими значениями Y и предсказанными значениями являются мерами ошибок, которые появились бы при использовании X для оценки Y. Эти ошибки называются ошибками оценки. Формула для ошибки i-гo объекта есть:

. (8.4)

Один из нескольких возможных способов измерения точности предсказания Y по X – применение дисперсии n ошибок оценки ei. Она не будет зависеть от среднего значения, всегда равного нулю, и от количества остатков, потому что используется операция деления на n – 1. Дисперсия n оценок называется дисперсией ошибки оценки и обозначается символом .

. (8.5)

В конечном счете

. (8.6)

Уравнение (8.6) дает дисперсию ошибки оценки в терминах дисперсии Y и rху.

Положительное значение квадратного корня из дисперсии ошибки оценки называется стандартной ошибкой оценки:

. (8.7)

Стандартную ошибку оценки можно применить для определения пределов в окрестности предсказанного значения , в которые, вероятно, попадает фактическое значение для объекта. Если можно предположить, что объекты взяты из совокупности, приблизительно описываемой двумерным нормальным распределением (см. § 6.7), то можно сформулировать следующие утверждения. В большой группе объектов, для которых используется уравнение предсказания:

1. Около 69% объектов будут иметь фактические значения, лежащие в пределах одной se от их предсказанного значения .

2. Около 95% будут иметь фактические значения, лежащие в пределах двух se от их .

3. Примерно 99,7% будут иметь фактические значения, лежащие в пределах трех se от .

Эти утверждения обоснованны, так как если справедливо допущение о двумерной нормальности, то распределение фактических значений Y нормальное относительно среднего b0 + b1X со стандартным отклонением se для любого X. (Обратите внимание, что, хотя среднее нормального распределения Y меняется от одного значения X к другому, стандартное отклонение sе не зависит от X). Эти соотношения показаны на рис. 8.3.

Рис. 8.3 – Пример стандартной ошибки оценки, sе, на четырех уровнях X,
когда можно предположить двумерное нормальное распределение X и Υ

Связи b0 и b1 с другими описательными статистиками

Как задачи подбора «наилучшей» линии предсказания, так и измерения корреляции двух переменных касаются пары переменных для группы объектов. В обоих случаях данные можно представить на диаграмме рассеивания.

Есть несколько интересных соотношений между rxy, sx, sy и коэффициентами b0 и b1 для прямой метода наименьших квадратов.

, (8.8)

то есть b1 равен ковариации X и Y, деленной на дисперсию X. Ковариация X и Υ для данных табл. 8.1 составляет 27,211, а = 38,408. Отношение sxy/ = 0,708, значению b1, найденному из уравнения (8.2).

Вспомните, что . Таким образом, если мы просто умножим это уравнение на

,

то получим b1:

. (8.9)

. (8.10)

Дисперсия предсказываемых значений, то есть значений , равна квадрату коэффициента корреляции X и Y, умноженному на дисперсию Y. Например, rxy для данных табл. 8.1 равен 0,861; = 25,958. Поэтому дисперсия 20 предсказанных значений Y равна:

.

Измерение нелинейных связей между переменными, корреляционное отношение η2

Этот параграф приведен здесь ради полноты и логической последовательности. Вы поймете его лучше после прочтения главы 15 об однофакторном дисперсионном анализе.

 

 

Рис. 8.4 – Связь между возрастом и характеристикой 28 людей
по вспомогательному тесту цифра-знак (WAIS)

 

Мы уже говорили, что произведение моментов Пирсона r измеряет лишь степень линейной связи между X и Y, теперь укажем еще описательную меру, применяемую в том случае, когда связь между X и Y преимущественно нелинейна. В качестве примера нелинейной связи рассмотрим данные рис. 8.4, показывающие связь возраста X с результатами Y вспомогательного теста цифра-знак шкалы интеллекта взрослых Векслера (WAIS). Данные рис. 8.4 представлены в табл. 8.2.

Из рис. 8.4 видно, что результаты растут линейно от 10 до 22 лет, достигают пика и затем довольно быстро уменьшаются.

Таблица 8.2

WAIS – Вспомогательный тест цифра-знак, располагающий по шкале оценки 28 лиц в восьми возрастных группах с равным шагом

Возраст с точностью до ближайшего года
 
 
     
             
Среднее возрастных групп: 8,60 9,50 10,50 11,50 10,00 9,00 8,67 8,00
Общее среднее всех значений =

 

Мера линейной или нелинейной связи X и Υ обозначается η2 (читается «эта в квадрате») и называется корреляционным отношением. Корреляционное отношение определяется так:

, (8.11)

где , то есть сумма квадратов отклонений каждого значения Υ от среднего всех п значений Y, a SSвнутри получена следующим образом.

Для первого значения X находим отклонения соответствующих значений относительно их среднего и вычисляем сумму квадратов этих отклонений. Например, первая сумма квадратов в табл. 8.2 есть (7 – 8,60)2 + (8 – 8,60)2 + (9 – 8,60)2 + (9 – 8,60)2 + (10 – 8,60)2. Этот процесс повторяется для каждого значения X. Так, для X = 14 имеем: (8 – 9,50)2 + (9 – 9,50)2 + (10 – 9,50)2 + (11 – 9,50)2. Для последней группы, Х = 38, сумма квадратичных отклонений значений Y относительно их среднего равна (8 – 8)2 = 0, поскольку есть только одно значение. Наконец, складываем эти суммы квадратов отклонений для всех значений X. В результате имеем SSвнутри. (Если вы читаете этот раздел после главы 15, то обратите внимание, что SSвнутри есть «внутригрупповая сумма квадратов» в однофакторном дисперсионном анализе с неравными п).

Для данных табл. 8.2 величина SSобщая равна 54,68, а SSвнутри = 24,87. Отсюда значение есть

.

Последующие соображения касаются интерпретации . Коэффициент – заметьте, что Y предшествует запятой, а X следует за ней, – является мерой степени предсказания Υ по X с помощью «наилучшим образом подобранной» линии, либо прямой, либо кривой.

Важно отметить, что и обычно будут иметь разные значения. Это противоречит известным нам случаям, когда rxy = ryx. Мы можем смириться с фактом, что может не быть равным , интуитивно обратившись к данным табл. 8.2. Если человеку 10 лет, то можно довольно уверенно предсказать, что его оценка по шкале цифра-знак равна ≈8,60. Однако, если известно, что оценка Y равна 8, то возраст X может быть как малым, около 10, так и большим, около 38 лет. Значит, можно довольно хорошо предсказать Y по X, но нельзя хорошо прогнозировать X по Y. Эти обстоятельства отражаются на величинах = 0,545 и , которую мы не вычисляли, но которая близка к нулю.

Величину надо сравнивать с , а не с . Мы знаем, что , или

. (8.12)

Уравнение (8.12) показывает, что (1 минус сумма квадратов отклонений Y относительно прямой предсказания) делится на . Уравнение (8.11) показывает, что (1 минус сумма квадратов отклонений Y относительно кривой предсказания, проходящей через средние значения Y для каждого значения X) разделен на . Кривая предсказания Υ по X показана на рис. 8.4.

Как и в случае , должна быть меньше или равна единице и больше или равна нулю. Кроме того, . Разность является мерой степени нелинейности линии наилучшего сглаживания для предсказания Y по X.



<== предыдущая страница | следующая страница ==>
ПРЕДСКАЗАНИЕ И ОЦЕНИВАНИЕ | МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

Дата добавления: 2014-11-01; просмотров: 703; Нарушение авторских прав




Мы поможем в написании ваших работ!
lektsiopedia.org - Лекциопедия - 2013 год. | Страница сгенерирована за: 0.003 сек.