Главная страница Случайная лекция Мы поможем в написании ваших работ! Порталы: БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика Мы поможем в написании ваших работ! |
Точечные и интервальные оценки
Точность интервальной оценки параметра, измеряемого при выборочном исследовании, определяется двумя показателями: а) интервалом, в котором ожидается обнаружить оцениваемый параметр; б) вероятностью обнаружения этого параметра в данном интервале. Эти два показателя объединяет понятие доверительного интервала. Для описания метода нахождения доверительного интервала рассмотрим следующий пример. Группа студентов университета разрабатывает проект по созданию университетского ланч-клуба «Метро У» (гибрида студенческой столовой и фешенебельного ресторана). Поскольку студенты, помимо фонтана творческих идей и безудержного энтузиазма, имеют еще и достаточно здравого смысла, они решают провести мониторинг ряда параметров, на основании чего и принять решение об организации работы предполагаемого заведения. Предположим, что в качестве измеряемого параметра выступает «Предпочтительное время обеда» . Допустим, что нам не известны характеристики генеральной совокупности и значения измеряемого параметра. Если бы эти данные были известны, не было бы необходимости проводить выборочное исследование. Как правило, такие данные не доступны, или их получение связано с большими затратами временных, финансовых, технических и др. ресурсов. Предположим далее, что проведено 4 выборочных измерения (N1, N2, N3, N4). Объем каждой выборки - 10 элементов. Выборки формировались в результате случайного повторного отбора. (Предположение о формировании 4 выборок исследований, а не одной, состоящей, например, из 40 элементов, сделано в учебных целях). Результаты выборочных исследований представлены в таблице. в данном случае среднее значение измеряемого параметра рассчитывается не как среднее арифметическое (сумма значений признаков объектов, деленное на количество объектов), а как среднее арифметическое взвешенное, поскольку данные сгруппированы.
Число одинаковых значений признака в ряду распределения называется частотой и обычно обозначается f. Среднее арифметическое взвешенное определяется по формуле: ,
Согласно центральной предельной теореме - одной из основных теорем теории вероятностей и статистики - распределение средних значений выборок, извлекаемых из одной и той же совокупности, при достаточно большом п соответствует нормальному распределению. Среднее значение всех выборочных средних равно среднему значению совокупности, а стандартное отклонение выборочных средних определяется по следующей формуле (предполагается, что выборка формируется в результате случайного повторного отбора).
Естественным образом возникает вопрос о том, какой объем выборки может считаться «большим». Известно эмпирическое правило, согласно которому принимается, что если объем выборки (N)равен 100 или более, то применима центральная предельная теорема, и допущение о нормальности распределения всех возможных выборочных средних может быть принято. Если же Nменьше 100, то нужно иметь веские доказательства нормальности распределения генеральной совокупности, и только в этом случае можно полагать, что распределение, которому подчиняются выборочные статистики, является нормальным. Следовательно, нормальность распределения выборочных статистик гарантируется путем использования довольно больших выборок. Мы видим, что стандартное отклонение по генеральной совокупности зависит от стандартного отклонения по выборке и ее объема. Например, если стандартное отклонение по выборке s=0,74 и n=10, то стандартное отклонение по генеральной совокупности равно Если стандартное отклонение по выборке уменьшается в два раза, то оцениваемое изменение по генеральной совокупности также уменьшается в два раза:
При увеличении количества респондентов в 4 раза, при том же самом значении стандартного отклонения по выборке, мы можем обеспечить увеличение точности в 2 раза: При бесповторном случайном отборе ошибка выборки рассчитывается как Очевидно, что для применения этой формулы (и этого механизма отбора соответственно) нам должна быть известна численность генеральной совокупности N. При нормальном распределении данных большая их часть (68,27%) располагается в пределах одного стандартного отклонения (z=l) по обе стороны от среднего значения, вне зависимости от величины стандартного отклонения (что следует из закона нормального распределения случайной величины). Это означает, что с вероятностью 0,68 среднее значение параметра по генеральной совокупности будет попадать в интервал:
. Зная формулу, описывающую закон нормального распределения, можно определить значения z, которые соответствуют различным значениям вероятности попадания среднего значения параметра по генеральной совокупности в интервал (см. таблицу).
Определяя стандартное отклонение выборочных средних по характеристикам первой выборки в нашем примере, получим (Для сравнения: стандартное отклонение средних, рассчитанное как среднее арифметическое по 4 выборкам . Т
Теперь мы можем сделать содержательный вывод о необходимом объеме выборки. Для определения необходимого количества элементов в выборке мы должны задать доверительный интервал, который включает в себя: - интервал, в котором ожидается обнаружить оцениваемый параметр, - вероятность, с которой ожидается обнаружить оцениваемый параметр в определенном интервале. Доверительный интервал определяется как
Дата добавления: 2015-07-26; просмотров: 234; Нарушение авторских прав Мы поможем в написании ваших работ! |