![]() Главная страница Случайная лекция ![]() Мы поможем в написании ваших работ! Порталы: БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика ![]() Мы поможем в написании ваших работ! |
МАТЕМАТИЧЕЧСКАЯ СТАТИСТИКА
Выборочный метод
Для установления закономерностей, которым подчинены случайные события и случайные величины, теория вероятности, как и любая другая наука, обращается к опыту – наблюдениям, измерениям, экспериментам. Результаты наблюдений за случайными величинами объединяются в наборы статистических данных. Задачей математической статистики, раздела современной теории вероятностей, является разработка методов сбора и обработки статистических данных, а также их анализа с целью установления законов распределения наблюдаемых случайных величин [8, 9].
1. Генеральная и выборочная совокупность данных Генеральной совокупностью является набор всех мыслимых статистических данных, при наблюдениях случайной величины:
Наблюдаемая случайная величина Х называется признаком или фактором выборки. Генеральная совокупность есть статистический аналог случайной величины, ее объем N обычно велик, поэтому из нее выбирается часть данных, называемая выборочной совокупностью или просто выборкой
Использование выборки для построения закономерностей, которым подчинена наблюдаемая случайная величина, позволяет избежать ее сплошного (массового) наблюдения, что часто бывает ресурсоемким процессом, а то и просто невозможным. Однако выборка должна удовлетворять следующим основным требованиям: - выборка должна быть представительной, т.е. сохранять в себе пропорции генеральной совокупности, - объем выборки должен быть небольшим, но достаточным для того, чтобы полученные результаты ее анализа обладали необходимой степенью надежности. В табл. 1 приводятся примеры генеральных и выборочных совокупностей. Таблица 1
Отметим, что в более строгом смысле выборку можно представить как многомерную случайную величину
2. Статистическое распределение выборки. Выборочный ряд, полигон, гистограмма и комулянта выборки Возможные значения элементов выборки Упорядоченный по возрастанию значений набор вариант совместно с соответствующими им частотами называется вариационно-частотным рядом выборки:
Ломаная линия, соединяющая точки вариационно-частотного ряда на плоскости Пример 1. Пусть дана выборка полуденных температур месяца мая своим вариационно-частотным рядом, приведенным в табл. 2: Таблица 2
На рис.10.1 приводится полигон частот рассматриваемой выборки.
Рис.10.1 Полигон частот Вариационно-частотный ряд имеет существенный недостаток, а именно, ненаглядность полигона в случае малой повторяемости вариант, например, при наблюдении непрерывного признака его повторяемость в выборке маловероятна. Более общей формой описания элементов выборки, является гистограмма выборки. Для ее построения, разобьем интервал значений выборки
Совокупность интервалов, наблюдаемой в выборке случайной величины и соответствующих им частот, называется гистограммой выборки.
Для частот гистограммы выполнены следующие условия нормировки:
Число интервалов гистограммы mдолжно быть оптимальным, чтобы, с одной стороны, была достаточной повторяемость интервалов, а с другой стороны не должны сглаживаться особенности выборочной статистики. Рекомендуется значение Пример 2. Наблюдаемые значения полуденной температуры месяца мая разбиты на 6 интервалов, соответствующая гистограмма задана следующей табл. 3: Таблица 3
Гистограмма наблюдаемых температур приводится на рис. 10.2.
Рис. 10.2 Гистограмма частот
Выборочной или эмпирической функцией распределения называется функция
В нашем примере выборочная функция распределения (иногда называемая комулянтой) приводится на рис.10.3. При увеличении объема выборки относительная частота события приближается к вероятности этого события (теорема Бернулли), поэтому выборочная функция распределения
Это утверждение строго доказано и носит форму теоремы Гливенко [7]. Рис. 10.3 Комулянта частот 3. Выборочные характеристики Помимо полигона и гистограммы выборка характеризуется следующими числовыми величинами: Основные характеристики
отклонение (выборочный стандарт).
Дополнительные характеристики
Часто используются моменты 3-го и 4-го порядков в следующей форме:
В статистической практике рассматриваются так же групповые характеристики, например, в интервальных группах гистограммы выборки вычисляются средние интервальные значения и дисперсии.
Пример 3.Рассмотрим вычисление выборочных характеристик для выборки, представленной в примере 1. У этой выборки объема Таблица 4 В последующих столбцах табл. 4, в соответствие с методом сводных таблиц, приводится расчет выборочных моментов и выборочных характеристик через варианты и частоты выборки:
Причем выполняется
Отметим, что все приведенные числовые характеристики являются случайными величинами, поскольку получены по элементам случайно взятой выборки. На элементах другой выборки наблюдений над той же случайной величиной
Выборочные распределения Если наблюдаемая случайная величина
и построим из них случайные величины Пирсона Тогда получим [9,10]:
Отсюда видно, что случайная величина выборочной дисперсии DВ распределена пропорционально «Хи-квадрат» случайной величине с n степенями свободы, а отклонение выборочного среднего от математического ожидания распределено пропорционально t-величине Стьюдента с n-1 степенью свободы. При сравнении двух выборок объемов n1 и n2 часто используется случайная величина Фишера со степенями свободы n1 и n2 :
1. Распределения Стьюдента и Пирсона Распределения величин
Графический вид функций плотности представлен ниже на рис. 11.1, 11.2 для различного количества степеней свободы. Рис.11.1 Кривые «Хи-квадрат» распределения Рис.11.2 Кривые распределения Стьюдента
Числовые характеристики распределений «Хи-квадрат» и Стьюдента следующие:
Можно заметить, что с ростом числа степеней свободы, указанные распределения будут приближаться к нормальному распределению, что соответствует центральной предельной теореме теории вероятностей. 2. Таблицы распределения выборочных величин
Обычно выборочные распределения задаются таблично в виде левосторонних функций распределения
Рис.11.3 Правосторонняя квантиль
В статистическом комплексе программ MS Excel-2007 эти распределения представлены следующими функциями:
Фишера,
Для работы с нормальной случайной величиной имеются следующие полезные функции:
параметрами
Ф
Дата добавления: 2014-08-09; просмотров: 624; Нарушение авторских прав ![]() Мы поможем в написании ваших работ! |