|
Доказательство.Date: 2015-10-07; view: 436.
По Теореме умножения вероятностей получаем:
Тогда если Для нахождения вероятности P(A) используем формулу полной вероятности.
Если до испытания все гипотезы равновероятны с вероятностью
Повторение испытаний. Формула Бернулли.
Если производится некоторое количество испытаний, в результате которых может произойти или не произойти событие А, и вероятность появления этого события в каждом из испытаний не зависит от результатов остальных испытаний, то такие испытания называются независимыми относительно события А. Допустим, что событие А наступает в каждом испытании с вероятностью Р(А)=р. Определим вероятность Рт,п того, что в результате п испытаний событие А наступило ровно т раз. Эту вероятность в принципе можно посчитать, используя теоремы сложения и умножения вероятностей, как это делалось в рассмотренных выше примерах. Однако, при достаточно большом количестве испытаний это приводит к очень большим вычислениям. Таким образом, возникает необходимость разработать общий подход к решению поставленной задачи. Этот подход реализован в формуле Бернулли. (Якоб Бернулли (1654 – 1705) – швейцарский математик)
Пусть в результате п независимых испытаний, проведенных в одинаковых условиях, событие А наступает с вероятностью Р(А) = р, а противоположное ему событие Обозначим Ai – наступление события А в испытании с номером i. Т.к. условия проведения опытов одинаковые, то эти вероятности равны. Если в результате п опытов событие А наступает ровно т раз, то остальные п-т раз это событие не наступает. Событие А может появиться т раз в п испытаниях в различных комбинациях, число которых равно количеству сочетаний из п элементов по т. Это количество сочетаний находится по формуле:
Вероятность каждой комбинации равна произведению вероятностей:
Формула Бернулли важна тем, что справедлива для любого количества независимых испытаний, т.е. того самого случая, в котором наиболее четко проявляются законы теории вероятностей.
Пример. По цели производится 5 выстрелов. Вероятность попадания для каждого выстрела равна 0,4. Найти вероятность того, что в цель попали не менее трех раз.
Вероятность не менее трех попаданий складывается из вероятности пяти попаданий, четырех попаданий и трех попаданий. Т.к. выстрелы независимы, то можно применить формулу Бернулли вероятности того, что в т испытаниях событие в вероятностью р наступает ровно п раз.
В случае пяти попаданий из пяти возможных:
Четыре попадания из пяти выстрелов:
Три попадания из пяти:
Окончательно, получаем вероятность не менее трех попаданий из пяти выстрелов:
Случайные величины.
Выше рассматривались случайные события, являющиеся качественной характеристикой случайного результата опыта. Для получения количественной характеристики вводится понятие случайной величины.
Определение. Случайной величинойназывается величина, которая в результате опыта может принимать то или иное значение, причем заранее известно какое именно. Случайные величины можно разделить на две категории.
Определение. Дискретной случайной величиной называется такая величина, которая в результате опыта может принимать определенные значения с определенной вероятностью, образующие счетное множество (множество, элементы которого могут быть занумерованы). Это множество может быть как конечным, так и бесконечным. Например, количество выстрелов до первого попадания в цель является дискретной случайной величиной, т.к. эта величина может принимать и бесконечное, хотя и счетное количество значений.
Определение. Непрерывной случайной величиной называется такая величина, которая может принимать любые значения из некоторого конечного или бесконечного промежутка. Очевидно, что число возможных значений непрерывной случайной величины бесконечно.
Для задания случайной величины недостаточно просто указать ее значение, необходимо также указать вероятность этого значения.
Закон распределения дискретной случайной величины.
Определение. Соотношение между возможными значениями случайной величины и их вероятностями называется законом распределения дискретнойслучайной величины. Закон распределения может быть задан аналитически, в виде таблицы или графически. Таблица соответствия значений случайной величины и их вероятностей называется рядом распределения. Графическое представление этой таблицы называется многоугольником распределения. При этом сумма все ординат многоугольника распределения представляет собой вероятность всех возможных значений случайной величины, а, следовательно, равна единице.
Пример. По цели производится 5 выстрелов. Вероятность попадания для каждого выстрела равна 0,4. Найти вероятности числа попаданий и построить многоугольник распределения.
Вероятности пяти попаданий из пяти возможных, четырех из пяти и трех из пяти были найдены выше по формуле Бернулли и равны соответственно:
Аналогично найдем:
Представим графически зависимость числа попаданий от их вероятностей.
При построении многоугольника распределения надо помнить, что соединение полученных точек носит условный характер. В промежутках между значениями случайной величины вероятность не принимает никакого значения. Точки соединены только для наглядности.
Пример. Вероятность хотя бы одного попадания в мишень стрелком при трех выстрелах равна 0,875. Найти вероятность попадания в мишень при одном выстреле.
Если обозначить р – вероятность попадания стрелком в мишень при одном выстреле, то вероятность промаха при одном выстреле, очевидно, равна (1 – р). Вероятность трех промахов из трех выстрелов равна (1 – р)3. Эта вероятность равна 1 – 0,875 = 0,125, т.е. в цель не попадают ни одного раза. Получаем:
Пример. В первой коробке содержится 10 шаров, из них 8 белых; во второй коробке 20 шаров, из них 4 белых. Из каждой коробки наугад извлекли по одному шару, а затем из этих двух шаров наугад берут один шар. Найти вероятность того, что этот шар белый.
Вероятность того, что взятый из первой коробки шар белый - Вероятность того, что взятый из второй коробки шар белый - Вероятность того, что повторно выбран шар, извлеченный из первой коробки и вероятность того, что повторно выбран шар, извлеченный из второй коробки, равны 0,5. Вероятность того, что повторно выбран шар, извлеченный из первой коробки, и он белый - Вероятность того, что повторно выбран шар, извлеченный из второй коробки, и он белый - Вероятность того, что повторно будет выбран белый шар, равна
Пример. Имеется пять винтовок, три из которых снабжены оптическим прицелом. Вероятность того, что стрелок поразит цель при выстреле из винтовки с оптическим прицелом, равна 0,95, для винтовки без оптического прицела эта вероятность равна 0,7. Найти вероятность того, что цель будет поражена, если стрелок произведет один выстрел из наугад выбранной винтовки.
Вероятность того, что выбрана винтовка с оптическим прицелом, обозначим Вероятность того, что выбрали винтовку с оптическим прицелом, и при этом цель была поражена Аналогично, вероятность того, что выбрали винтовку без оптического прицела, и при этом цель была поражена Окончательная вероятность поражения цели равна сумме вероятностей Р1 и Р2, т.к. для поражения цели достаточно, чтобы произошло одно из этих несовместных событий.
Пример. Трое охотников одновременно выстрелили по медведю, который был убит одной пулей. Определить вероятность того, что медведь был убит первым стрелком, если вероятности попадания для этих стрелков равны соответственно 0,3, 0,4, 0,5.
В этой задаче требуется определить вероятность гипотезы уже после того, как событие уже совершилось. Для определения искомой вероятности надо воспользоваться формулой Бейеса. В нашем случае она имеет вид:
В этой формуле Н1, Н2, Н3 – гипотезы, что медведя убьет первый, второй и третий стрелок соответственно. До произведения выстрелов эти гипотезы равновероятны и их вероятность равна P(H1/A) – вероятность того, что медведя убил первый стрелок при условии, что выстрелы уже произведены (событие А).
Вероятности того, что медведя убьет первый, второй или третий стрелок, вычисленные до выстрелов, равны соответственно:
Здесь q1 = 0,7; q2 = 0,6; q3 = 0,5 – вероятности промаха для каждого из стрелков, рассчитаны как q = 1 – p, где р – вероятности попадания для каждого из стрелков.
Подставим эти значения в формулу Бейеса:
Пример. Последовательно послано четыре радиосигнала. Вероятности приема каждого из них не зависят от того, приняты ли остальные сигналы, или нет. Вероятности приема сигналов равны соответственно 0,2, 0,3, 0,4, 0,5. Определить вероятность приема трех радиосигналов.
Событие приема трех сигналов из четырех возможно в четырех случаях:
Для приема трех сигналов необходимо совершение одного из событий А, В, С или D. Таким образом, находим искомую вероятность:
Пример. Двадцать экзаменационных билетов содержат по два вопроса, которые не повторяются. Экзаменующийся знает ответы только на 35 вопросов. Определить вероятность того, что экзамен будет сдан, если для этого достаточно ответить на два вопроса одного билета или на один вопрос одного билета и на указанный дополнительный вопрос из другого билета.
В общей сложности имеется 40 вопросов (по 2 в каждом из 20 билетов). Вероятность того, что выпадает вопрос, на который ответ известен, очевидно, равна Для того, чтобы сдать экзамен, требуется совершение одного из трех событий: 1) Событие A – ответили на первый вопрос (вероятность
2) Событие В – на первый вопрос ответили (вероятность
3) Событие С – на первый вопрос не ответили (вероятность
Вероятность того, что при заданных условиях экзамен будет сдан равна:
Пример. Имеются две партии однородных деталей. Первая партия состоит из 12 деталей, 3 из которых - бракованные. Вторая партия состоит из 15 деталей, 4 из которых – бракованные. Из первой и второй партий извлекают по две детали. Какова вероятность того, что среди них нет бракованных деталей.
Вероятность оказаться не бракованной для первой детали, извлеченной из первой партии, равна Вероятность оказаться не бракованной для первой детали, извлеченной из второй партии, равна
Вероятность того, что среди четырех извлеченных деталей нет бракованных, равна: .
Рассмотрим тот же пример, но несколько с другим условием.
Пример. Имеются две партии однородных деталей. Первая партия состоит из 12 деталей, 3 из которых - бракованные. Вторая партия состоит из 15 деталей, 4 из которых – бракованные. Из первой партии извлекаются наугад 5 деталей, а из второй – 7 деталей. Эти детали образуют новую партию. Какова вероятность достать из них бракованную деталь?
Для того, чтобы выбранная наугад деталь была бы бракованной, необходимо выполнение одного из двух несовместных условий: 1) Выбранная деталь была из первой партии (вероятность -
2) Выбранная деталь была из второй партии (вероятность -
Окончательно, получаем:
Пример. В урне 3 белых и 5 черных шаров. Из урны вынимают наугад два шара. Найти вероятность того, что эти шары не одного цвета.
Событие, состоящее в том, что выбранные шары разного цвета произойдет в одном из двух случаев: 1) Первый шар белый (вероятность - 2) Первый шар черный (вероятность -
Окончательно получаем: Биноминальное распределение.
Если производится п независимых испытаний, в каждом из которых событие А может появиться с одинаковой вероятностью р в каждом из испытаний, то вероятность того, что событие не появится, равна q = 1 – p. Примем число появлений события в каждом из испытаний за некоторую случайную величину Х.
Чтобы найти закон распределения этой случайной величины, необходимо определить значения этой величины и их вероятности.
Значения найти достаточно просто. Очевидно, что в результате п испытаний событие может не появиться вовсе, появиться один раз, два раза, три и т.д. до п раз.
Вероятность каждого значения этой случайной величины можно найти по формуле Бернулли.
Эта формула аналитически выражает искомый закон распределения. Этот закон распределения называется биноминальным.
Пример. В партии 10% нестандартных деталей. Наугад отобраны 4 детали. Написать биноминальный закон распределения дискретной случайной величины Х – числа нестандартных деталей среди четырех отобранных и построить многоугольник полученного распределения.
Вероятность появления нестандартной детали в каждом случае равна 0,1. Найдем вероятности того, что среди отобранных деталей:
1) Вообще нет нестандартных.
2) Одна нестандартная.
3) Две нестандартные детали.
4) Три нестандартные детали.
5) Четыре нестандартных детали.
Построим многоугольник распределения.
Пример. Две игральные кости одновременно бросают 2 раза. Написать биноминальный закон распределения дискретной случайной величины Х – числа выпадений четного числа очков на двух игральных костях.
Каждая игральная кость имеет три варианта четных очков – 2, 4 и 6 из шести возможных, таким образом, вероятность выпадения четного числа очков на одной кости равна 0,5. Вероятность одновременного выпадения четных очков на двух костях равна 0,25. Вероятность того, что при двух испытаниях оба раза выпали четные очки на обеих костях, равна:
Вероятность того, что при двух испытаниях один раз выпали четные очки на обеих костях:
Вероятность того, что при двух испытаниях ни одного раза не выпаде четного числа очков на обеих костях:
Распределение Пуассона. (Симеон Дени Пуассон (1781 – 1840) – французский математик)
Пусть производится п независимых испытаний, в которых появление события А имеет вероятность р. Если число испытаний п достаточно велико, а вероятность появления события А в каждом испытании мало (p£0,1), то для нахождения вероятности появления события А k раз находится следующим образом.
Сделаем важное допущение – произведение пр сохраняет постоянное значение:
Практически это допущение означает, что среднее число появления события в различных сериях испытаний (при разном п) остается неизменным.
По формуле Бернулли получаем:
Найдем предел этой вероятности при п®¥.
Получаем формулу распределения Пуассона:
Если известны числа l и k, то значения вероятности можно найти по соответствующим таблицам распределения Пуассона.
Числовые характеристики дискретных случайных величин.
Закон распределения полностью характеризует случайную величину. Однако, когда невозможно найти закон распределения, или этого не требуется, можно ограничиться нахождением значений, называемых числовыми характеристиками случайной величины. Эти величины определяют некоторое среднее значение, вокруг которого группируются значения случайной величины, и степень их разбросанности вокруг этого среднего значения.
Определение. Математическим ожиданием дискретной случайной величины называется сумма произведений всех возможных значений случайной величины на их вероятности.
Математическое ожидание существует, если ряд, стоящий в правой части равенства, сходится абсолютно.
С точки зрения вероятности можно сказать, что математическое ожидание приближенно равно среднему арифметическому наблюдаемых значений случайной величины.
Свойства математического ожидания. 1) Математическое ожидание постоянной величины равно самой постоянной.
2) Постоянный множитель можно выносить за знак математического ожидания.
3) Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий.
Это свойство справедливо для произвольного числа случайных величин.
4) Математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых.
Это свойство также справедливо для произвольного числа случайных величин.
Пусть производится п независимых испытаний, вероятность появления события А в которых равна р.
Теорема. Математическое ожидание М(Х) числа появления события А в п независимых испытаниях равно произведению числа испытаний на вероятность появления события в каждом испытании.
Однако, математическое ожидание не может полностью характеризовать случайный процесс. Кроме математического ожидания надо ввести величину, которая характеризует отклонение значений случайной величины от математического ожидания. Это отклонение равно разности между случайной величиной и ее математическим ожиданием. При этом математическое ожидание отклонения равно нулю. Это объясняется тем, что одни возможные отклонения положительны, другие отрицательны, и в результате их взаимного погашения получается ноль.
Определение. Дисперсией (рассеиванием) дискретной случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания.
Пример. Для рассмотренного выше примера закон распределения случайной величины имеет вид:
Найти математическое ожидание и дисперсию случайной величины.
Математическое ожидание случайной величины равно:
Возможные значения квадрата отклонения:
Тогда
Дисперсия равна:
Однако, на практике подобный способ вычисления дисперсии неудобен, т.к. приводит при большом количестве значений случайной величины к громоздким вычислениям. Поэтому применяется другой способ.
Вычисление дисперсии.
Теорема. Дисперсия равна разности между математическим ожиданием квадрата случайной величины Х и квадратом ее математического ожидания.
Доказательство. С учетом того, что математическое ожидание М(Х) и квадрат математического ожидания М2(Х) – величины постоянные, можно записать:
Применим эту формулу для рассмотренного выше примера:
Свойства дисперсии.
1) Дисперсия постоянной величины равна нулю.
2) Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат.
3) Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин.
4) Дисперсия разности двух независимых случайных величин равна сумме дисперсий этих величин.
Справедливость этого равенства вытекает из свойства 2.
Теорема. Дисперсия числа появления события А в п независимых испытаний, в каждом из которых вероятность р появления события постоянна, равна произведению числа испытаний на вероятности появления и непоявления события в каждом испытании.
Среднее квадратическое отклонение.
Определение. Средним квадратическим отклонениемслучайной величины Х называется квадратный корень из дисперсии.
Теорема. Среднее квадратичное отклонение суммы конечного числа взаимно независимых случайных величин равно квадратному корню из суммы квадратов средних квадратических отклонений этих величин.
Пример. Завод выпускает 96% изделий первого сорта и 4% изделий второго сорта. Наугад выбирают 1000 изделий. Пусть Х – число изделий первого сорта в данной выборке. Найти закон распределения, математическое ожидание и дисперсию случайной величины Х.
Выбор каждого из 1000 изделий можно считать независимым испытанием, в котором вероятность появления изделия первого сорта одинакова и равна р = 0,96. Таким образом, закон распределения может считаться биноминальным.
Пример. Найти дисперсию дискретной случайной величины Х – числа появлений события А в двух независимых испытаниях, если вероятности появления этого события в каждом испытании равны и известно, что М(Х) = 0,9.
Т.к. случайная величина Х распределена по биноминальному закону, то
Пример. Производятся независимые испытания с одинаковой вероятностью появления события А в каждом испытании. Найти вероятность появления события А, если дисперсия числа появлений события в трех независимых испытаниях равна 0,63.
По формуле дисперсии биноминального закона получаем:
Пример. Испытывается устройство, состоящее из четырех независимо работающих приборов. Вероятности отказа каждого из приборов равны соответственно р1=0,3; p2=0,4; p3=0,5; p4=0,6. Найти математическое ожидание и дисперсию числа отказавших приборов.
Принимая за случайную величину число отказавших приборов, видим что эта случайная величина может принимать значения 0, 1, 2, 3 или 4. Для составления закона распределения этой случайной величины необходимо определить соответствующие вероятности. Примем
1) Не отказал ни один прибор.
2) Отказал один из приборов.
3) Отказали два прибора.
4) Отказали три прибора.
5) Отказали все приборы.
Получаем закон распределения:
Математическое ожидание:
Дисперсия:
Функция распределения.
Во всех рассмотренных выше случаях случайная величина определялась путем задания значений самой величины и вероятностей этих значений. Однако, такой метод применим далеко не всегда. Например, в случае непрерывной случайной величины, ее значения могут заполнять некоторый произвольный интервал. Очевидно, что в этом случае задать все значения случайной величины просто нереально. Даже в случае, когда это сделать можно, зачастую задача решается чрезвычайно сложно. Рассмотренный только что пример даже при относительно простом условии (приборов только четыре) приводит к достаточно неудобным вычислениям, а если в задаче будет несколько сотен приборов? Поэтому встает задача по возможности отказаться от индивидуального подхода к каждой задаче и найти по возможности наиболее общий способ задания любых типов случайных величин.
Пусть х – действительное число. Вероятность события, состоящего в том, что Х примет значение, меньшее х, т.е. Х < x, обозначим через F(x).
Определение. Функцией распределения называют функцию F(x), определяющую вероятность того, что случайная величина Х в результате испытания примет значение, меньшее х.
Функцию распределения также называют интегральной функцией. Функция распределения существует как для непрерывных, так и для дискретных случайных величин. Она полностью характеризует случайную величину и является одной из форм закона распределения. Для дискретной случайной величины функция распределения имеет вид:
Знак неравенства под знаком суммы показывает, что суммирование распространяется на те возможные значения случайной величины, которые меньше аргумента х. Функция распределения дискретной случайной величины Х разрывна и возрастает скачками при переходе через каждое значение хi.
Так для примера, рассмотренного выше, функция распределения будет иметь вид:
Свойства функции распределения..
1) значения функции распределения принадлежат отрезку [0, 1].
2) F(x) – неубывающая функция.
3) Вероятность того, что случайная величина примет значение, заключенное в интервале (a, b) , равна приращению функции распределения на этом интервале.
4) На минус бесконечности функция распределения равна нулю, на плюс бесконечности функция распределения равна единице.
5) Вероятность того, что непрерывная случайная величина Х примет одно определенное значение, равна нулю. Таким образом, не имеет смысла говорить о каком – либо конкретном значении случайной величины. Интерес представляет только вероятность попадания случайной величины в какой – либо интервал, что соответствует большинству практических задач.
Плотность распределения.
Функция распределения полностью характеризует случайную величину, однако, имеет один недостаток. По функции распределения трудно судить о характере распределения случайной величины в небольшой окрестности той или иной точки числовой оси.
Определение. Плотностью распределения вероятностей непрерывной случайной величины Х называется функция f(x) – первая производная от функции распределения F(x).
Плотность распределения также называют дифференциальной функцией. Для описания дискретной случайной величины плотность распределения неприемлема. Смысл плотности распределения состоит в том, что она показывает как часто появляется случайная величина Х в некоторой окрестности точки х при повторении опытов. После введения функций распределения и плотности распределения можно дать следующее определение непрерывной случайной величины.
Определение.Случайная величина Х называется непрерывной, если ее функция распределения F(x) непрерывна на всей оси ОХ, а плотность распределения f(x) существует везде, за исключением( может быть, конечного числа точек.
Зная плотность распределения, можно вычислить вероятность того, что некоторая случайная величина Х примет значение, принадлежащее заданному интервалу.
Теорема. Вероятность того, что непрерывная случайная величина Х примет значение, принадлежащее интервалу (a, b), равна определенному интегралу от плотности распределения, взятому в пределах от a до b.
Доказательство этой теоремы основано на определении плотности распределения и третьем свойстве функции распределения, записанном выше.
Геометрически это означает, что вероятность того, что непрерывная случайная величина примет значение, принадлежащее интервалу (a, b), равна площади криволинейной трапеции, ограниченной осью ОХ, кривой распределения f(x) и прямыми x=a и x=b.
Свойства плотности распределения.
1) Плотность распределения – неотрицательная функция.
2) Несобственный интеграл от плотности распределения в пределах от - ¥ до ¥ равен единице.
Пример. Случайная величина подчинена закону распределения с плотностью:
Требуется найти коэффициент а, построить график функции плотности распределения, определить вероятность того, что случайная величина попадет в интервал от 0 до
Построим график плотности распределения:
Для нахождения коэффициента а воспользуемся свойством
Находим вероятность попадания случайной величины в заданный интервал.
Пример. Задана непрерывная случайная величина х своей функцией распределения f(x).
Требуется определить коэффициент А, найти функцию распределения, построить графики функции распределения и плотности распределения, определить вероятность того, что случайная величина х попадет в интервал
Найдем коэффициент А.
Найдем функцию распределения: 1) На участке
2) На участке
3) На участке
Итого: Построим график плотности распределения: f(x)
Построим график функции распределения:
F(x)
Найдем вероятность попадания случайной величины в интервал
Ту же самую вероятность можно искать и другим способом:
Числовые характеристики непрерывных случайных величин.
Пусть непрерывная случайная величина Х задана функцией распределения f(x). Допустим, что все возможные значения случайной величины принадлежат отрезку [a,b].
Если возможные значения случайной величины рассматриваются на всей числовой оси, то математическое ожидание находится по формуле:
При этом, конечно, предполагается, что несобственный интеграл сходится. Определение. Дисперсией непрерывной случайной величины называется математическое ожидание квадрата ее отклонения.
По аналогии с дисперсией дискретной случайной величины, для практического вычисления дисперсии используется формула:
Определение. МодойМ0 дискретной случайной величины называется ее наиболее вероятное значение. Для непрерывной случайной величины мода – такое значение случайной величины, при которой плотность распределения имеет максимум.
Если многоугольник распределения для дискретной случайной величины или кривая распределения для непрерывной случайной величины имеет два или несколько максимумов, то такое распределение называется двухмодальным или многомодальным. Если распределение имеет минимум, но не имеет максимума, то оно называется антимодальным.
Определение. Медианой MD случайной величины Х называется такое ее значение, относительно которого равновероятно получение большего или меньшего значения случайной величины.
Геометрически медиана – абсцисса точки, в которой площадь, ограниченная кривой распределения делится пополам. Отметим, что если распределение одномодальное, то мода и медиана совпадают с математическим ожиданием.
Определение. Начальным моментомпорядка k случайной величины Х называется математическое ожидание величины Хk.
Для дискретной случайной величины:
Для непрерывной случайной величины: Начальный момент первого порядка равен математическому ожиданию.
Определение. Центральным моментомпорядка k случайной величины Х называется математическое ожидание величины
Для дискретной случайной величины: Для непрерывной случайной величины:
Центральный момент первого порядка всегда равен нулю, а центральный момент второго порядка равен дисперсии. Центральный момент третьего порядка характеризует асимметрию распределения.
Определение.Для характеристики островершинности и плосковершинности распределения используется величина, называемая эксцессом.
Кроме рассмотренных величин используются также так называемые абсолютные моменты: Абсолютный начальный момент: Абсолютный центральный момент: Абсолютный центральный момент первого порядка называется средним арифметическим отклонением.
Пример. Для рассмотренного выше примера определить математическое ожидание и дисперсию случайной величины Х.
Пример. В урне 6 белых и 4 черных шара. Из нее пять раз подряд извлекают шар, причем каждый раз вынутый шар возвращают обратно и шары перемешивают. Приняв за случайную величину Х число извлеченных белых шаров, составить закон распределения этой величины, определить ее математическое ожидание и дисперсию.
Т.к. шары в каждом опыте возвращаются обратно и перемешиваются, то испытания можно считать независимыми (результат предыдущего опыта не влияет на вероятность появления или непоявления события в другом опыте). Таким образом, вероятность появления белого шара в каждом опыте постоянна и равна Таким образом, в результате пяти последовательных испытаний белый шар может не появиться вовсе, появиться один раз, два, три, четыре или пять раз. Для составления закона распределения надо найти вероятности каждого из этих событий.
1) Белый шар не появился вовсе:
2) Белый шар появился один раз:
3) Белый шар появиться два раза:
4) Белый шар появиться три раза:
5) Белый шар появиться четыре раза:
6) Белый шар появился пять раз:
Получаем следующий закон распределения случайной величины Х.
При решении практических задач зачастую точно найти закон распределения случайной величины довольно сложно. Однако, все происходящие процессы, связанные со случайными величинами, можно разделить на несколько типов, каждому из которых можно поставить в соответствие какой – либо закон распределения. Выше были рассмотрены некоторые типы распределений дискретной случайной величины такие как биноминальное распределение и распределение Пуассона. Рассмотрим теперь некоторые типы законов распределения для непрерывной случайной величины.
Равномерное распределение.
Определение. Непрерывная случайная величина имеет равномерноераспределение на отрезке [a, b], если на этом отрезке плотность распределения случайной величины постоянна, а вне его равна нулю.
Постоянная величина С может быть определена из условия равенства единице площади, ограниченной кривой распределения.
0 a b x
Получаем
Найдем функцию распределения F(x) на отрезке [a,b].
F(x)
0 a b x
Для того, чтобы случайная величина подчинялась закону равномерного распределения необходимо, чтобы ее значения лежали внутри некоторого определенного интервала, и внутри этого интервала значения этой случайной величины были бы равновероятны.
Определим математическое ожидание и дисперсию случайной величины, подчиненной равномерному закону распределения.
Вероятность попадания случайной величины в заданный интервал:
Показательное распределение.
где l - положительное число.
Найдем закон распределения.
Графики функции распределения и плотности распределения:
l 1
0 x 0 x
Найдем математическое ожидание случайной величины, подчиненной показательному распределению.
Результат получен с использованием того факта, что
Для нахождения дисперсии найдем величину М(Х2).
Дважды интегрируя по частям, аналогично рассмотренному случаю, получим:
Тогда
Итого:
Видно, что в случае показательного распределения математическое ожидание и среднее квадратическое отклонение равны.
Также легко определить и вероятность попадания случайной величины, подчиненной показательному закону распределения, в заданный интервал.
Показательное распределение широко используется в теории надежности.
Допустим, некоторое устройство начинает работать в момент времени t0=0, а через какое– то время t происходит отказ устройства. Обозначим Т непрерывную случайную величину – длительность безотказной работы устройства. Таким образом, функция распределения F(t) = P(T<t) определяет вероятность отказа за время длительностью t. Вероятность противоположного события (безотказная работа в течение времени t) равна R(t) = P(T>t) = 1 – F(t).
Определение. Функцией надежностиR(t) называют функцию, определяющую вероятность безотказной работы устройства в течение времени t.
Часто на практике длительность безотказной работы подчиняется показательному закону распределению. Вообще говоря, если рассматривать новое устройство, то вероятность отказа в начале его функционирования будет больше, затем количество отказов снизится и будет некоторое время иметь практически одно и то же значение. Затем (когда устройство выработает свой ресурс) количество отказов будет возрастать. Другими словами, можно сказать, что функционирование устройства на протяжении всего существования (в смысле количества отказов) можно описать комбинацией двух показательных законов (в начале и конце функционирования) и равномерного закона распределения.
Функция надежности для какого- либо устройства при показательном законе распределения равна:
Данное соотношение называют показательным законом надежности. Важным свойством, позволяющим значительно упростить решение задач теории надежности, является то, что вероятность безотказной работы устройства на интервале времени t не зависит от времени предшествующей работы до начала рассматриваемого интервала, а зависит только от длительности времени t. Таким образом, безотказная работа устройства зависит только от интенсивности отказов l и не зависит от безотказной работы устройства в прошлом.
Так как подобным свойством обладает только показательный закон распределения, то этот факт позволяет определить, является ли закон распределения случайной величины показательным или нет.
Нормальный закон распределения.
Определение. Нормальнымназывается распределение вероятностей непрерывной случайной величины, которое описывается плотностью вероятности
Нормальный закон распределения также называется законом Гаусса. Нормальный закон распределения занимает центральное место в теории вероятностей. Это обусловлено тем, что этот закон проявляется во всех случаях, когда случайная величина является результатом действия большого числа различных факторов. К нормальному закону приближаются все остальные законы распределения.
Можно легко показать, что параметры
Найдем функцию распределения F(x).
График плотности нормального распределения называется нормальной кривойили кривой Гаусса. Нормальная кривая обладает следующими свойствами:
1) Функция определена на всей числовой оси.
2) При всех х функция распределения принимает только положительные значения.
3) Ось ОХ является горизонтальной асимптотой графика плотности вероятности, т.к. при неограниченном возрастании по абсолютной величине аргумента х, значение функции стремится к нулю.
4) Найдем экстремум функции.
Т.к. при y' > 0 при x < m и y' < 0 при x > m , то в точке х = т функция имеет максимум, равный
5) Функция является симметричной относительно прямой х = а, т.к. разность (х – а) входит в функцию плотности распределения в квадрате.
6) Для нахождения точек перегиба графика найдем вторую производную функции плотности.
При x = m + s и x = m - s вторая производная равна нулю, а при переходе через эти точки меняет знак, т.е. в этих точках функция имеет перегиб. В этих точках значение функции равно
Построим график функции плотности распределения.
Построены графики при т =0 и трех возможных значениях среднего квадратичного отклонения s = 1, s = 2 и s = 7. Как видно, при увеличении значения среднего квадратичного отклонения график становится более пологим, а максимальное значение уменьшается.. Если а > 0, то график сместится в положительном направлении, если а < 0 – в отрицательном.
При а = 0 и s = 1 кривая называется нормированной. Уравнение нормированной кривой:
Функция Лапласа.
Найдем вероятность попадания случайной величины, распределенной по нормальному закону, в заданный интервал.
Обозначим
Тогда
которая называется функцией Лапласаили интегралом вероятностей.
Значения этой функции при различных значениях х посчитаны и приводятся в специальных таблицах. Ниже показан график функции Лапласа.
Функция Лапласа обладает следующими свойствами:
1) Ф(0) = 0;
2) Ф(-х) = - Ф(х);
3) Ф(¥) = 1.
Функцию Лапласа также называют функцией ошибок и обозначают erf x.
Ниже показан график нормированной функции Лапласа.
При рассмотрении нормального закона распределения выделяется важный частный случай, известный как правило трех сигм. Запишем вероятность того, что отклонение нормально распределенной случайной величины от математического ожидания меньше заданной величины D:
Если принять D = 3s, то получаем с использованием таблиц значений функции Лапласа:
Т.е. вероятность того, что случайная величина отклонится от своего математического ожидание на величину, большую чем утроенное среднее квадратичное отклонение, практически равна нулю. Это правило называется правилом трех сигм. Не практике считается, что если для какой – либо случайной величины выполняется правило трех сигм, то эта случайная величина имеет нормальное распределение.
Пример. Поезд состоит из 100 вагонов. Масса каждого вагона – случайная величина, распределенная по нормальному закону с математическим ожидание а = 65 т и средним квадратичным отклонением s = 0,9 т. Локомотив может везти состав массой не более 6600 т, в противном случае необходимо прицеплять второй локомотив. Найти вероятность того, что второй локомотив не потребуется.
Второй локомотив не потребуется, если отклонение массы состава от ожидаемого (100×65 = 6500) не превосходит 6600 – 6500 = 100 т. Т.к. масса каждого вагона имеет нормальное распределение, то и масса всего состава тоже будет распределена нормально. Получаем:
Пример. Нормально распределенная случайная величина Х задана своими параметрами – а =2 – математическое ожидание и s = 1 – среднее квадратическое отклонение. Требуется написать плотность вероятности и построить ее график, найти вероятность того, Х примет значение из интервала (1; 3), найти вероятность того, что Х отклонится (по модулю) от математического ожидания не более чем на 2. Плотность распределения имеет вид:
Построим график:
Найдем вероятность попадания случайной величины в интервал (1; 3).
Найдем вероятность отклонение случайной величины от математического ожидания на величину, не большую чем 2.
Тот же результат может быть получен с использованием нормированной функции Лапласа.
Центральная предельная теорема Ляпунова.
Теорема. Если случайная величина Х представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то Х имеет распределение, близкое к нормальному. На практике для большинства случайных величин выполняются условия теоремы Ляпунова.
Система случайных величин.
Рассмотренные выше случайные величины были одномерными, т.е. определялись одним числом, однако, существуют также случайные величины, которые определяются двумя, тремя и т.д. числами. Такие случайные величины называются двумерными, трехмерными и т.д. В зависимости от типа, входящих в систему случайных величин, системы могут быть дискретными, непрерывными или смешанными, если в систему входят различные типы случайных величин. Более подробно рассмотрим системы двух случайных величин.
Определение. Законом распределения системы случайных величин называется соотношение, устанавливающее связь между областями возможных значений системы случайных величин и вероятностями появления системы в этих областях.
Определение. Функцией распределения системы двух случайных величин называется функция двух аргументов F(x, y), равная вероятности совместного выполнения двух неравенств X<x, Y<y.
Отметим следующие свойства функции распределения системы двух случайных величин:
1) Если один из аргументов стремится к плюс бесконечности, то функция распределения системы стремится к функции распределения одной случайной величины, соответствующей другому аргументу.
2) Если оба аргумента стремятся к бесконечности, то функция распределения системы стремится к единице.
3) При стремлении одного или обоих аргументов к минус бесконечности функция распределения стремится к нулю.
4) Функция распределения является неубывающей функцией по каждому аргументу.
5) Вероятность попадания случайной точки (X, Y) в произвольный прямоугольник со сторонами, параллельными координатным осям, вычисляется по формуле:
Плотность распределения системы двух случайных величин.
Определение. Плотностью совместного распределениявероятностей двумерной случайной величины (X, Y) называется вторая смешанная частная производная от функции распределения.
Двумерная плотность распределения неотрицательна и двойной интеграл с бесконечными пределами от двумерной плотности равен единице.
По известной плотности совместного распределения можно найти плотности распределения каждой из составляющих двумерной случайной величины.
Условные законы распределения.
Как было показано выше, зная совместный закон распределения можно легко найти законы распределения каждой случайной величины, входящей в систему. Однако, на практике чаще стоит обратная задача – по известным законам распределения случайных величин найти их совместный закон распределения. В общем случае эта задача является неразрешимой, т.к. закон распределения случайной величины ничего не говорит о связи этой величины с другими случайными величинами. Кроме того, если случайные величины зависимы между собой, то закон распределения не может быть выражен через законы распределения составляющих, т.к. должен устанавливать связь между составляющими. Все это приводит к необходимости рассмотрения условных законов распределения.
Определение. Распределение одной случайной величины, входящей в систему, найденное при условии, что другая случайная величина приняла определенное значение, называется условным законом распределения.
Условный закон распределения можно задавать как функцией распределения так и плотностью распределения. Условная плотность распределения вычисляется по формулам:
Условная плотность распределения обладает всеми свойствами плотности распределения одной случайной величины.
Условное математическое ожидание.
Определение. Условным математическим ожиданиемдискретной случайной величины Y при X = x (х – определенное возможное значение Х) называется произведение всех возможных значений Y на их условные вероятности.
Для непрерывных случайных величин:
где f(y/x) – условная плотность случайной величины Y при X=x.
Условное математическое ожидание M(Y/x)=f(x) является функцией от х и называется функцией регрессии Х на Y. Пример. Найти условное математическое ожидание составляющей Y при X= x1=1 для дискретной двумерной случайной величины, заданной таблицей:
Аналогично определяются условная дисперсия и условные моменты системы случайных величин.
Зависимые и независимые случайные величины.
Случайные величины называются независимыми, если закон распределения одной из них не зависит от того какое значение принимает другая случайная величина. Понятие зависимости случайных величин является очень важным в теории вероятностей. Условные распределения независимых случайных величин равны их безусловным распределениям. Определим необходимые и достаточные условия независимости случайных величин.
Теорема. Для того, чтобы случайные величины Х и Y были независимы, необходимо и достаточно, чтобы функция распределения системы (X, Y) была равна произведению функций распределения составляющих.
Аналогичную теорему можно сформулировать и для плотности распределения:
Теорема. Для того, чтобы случайные величины Х и Y были независимы, необходимо и достаточно, чтобы плотность совместного распределения системы (X, Y) была равна произведению плотностей распределения составляющих.
Определение. Корреляционным моментом mxyслучайных величин Х и Y называется математическое ожидание произведения отклонений этих величин.
Практически используются формулы:
Для дискретных случайных величин:
Для непрерывных случайных величин:
Корреляционный момент служит для того, чтобы охарактеризовать связь между случайными величинами. Если случайные величины независимы, то их корреляционный момент равен нулю. Корреляционный момент имеет размерность, равную произведению размерностей случайных величин Х и Y. Этот факт является недостатком этой числовой характеристики, т.к. при различных единицах измерения получаются различные корреляционные моменты, что затрудняет сравнение корреляционных моментов различных случайных величин. Для того, чтобы устранить этот недостаток применятся другая характеристика – коэффициент корреляции.
Определение. Коэффициентом корреляции rxy случайных величин Х и Y называется отношение корреляционного момента к произведению средних квадратических отклонений этих величин.
Коэффициент корреляции является безразмерной величиной. Коэффициент корреляции независимых случайных величин равен нулю.
Свойство: Абсолютная величина корреляционного момента двух случайных величин Х и Y не превышает среднего геометрического их дисперсий.
Свойство: Абсолютная величина коэффициента корреляции не превышает единицы.
Случайные величины называются коррелированными, если их корреляционный момент отличен от нуля, и некоррелированными, если их корреляционный момент равен нулю. Если случайные величины независимы, то они и некоррелированы, но из некоррелированности нельзя сделать вывод о их независимости. Если две величины зависимы, то они могут быть как коррелированными, так и некоррелированными. Часто по заданной плотности распределения системы случайных величин можно определить зависимость или независимость этих величин. Наряду с коэффициентом корреляции степень зависимости случайных величин можно охарактеризовать и другой величиной, которая называется коэффициентом ковариации. Коэффициент ковариации определяется формулой:
Пример. Задана плотность распределения системы случайных величин Х и Y.
Выяснить являются ли независимыми случайные величины Х и Y.
Для решения этой задачи преобразуем плотность распределения:
Таким образом, плотность распределения удалось представить в виде произведения двух функций, одна из которых зависит только от х, а другая – только от у. Т.е. случайные величины Х и Y независимы. Разумеется, они также будут и некоррелированы.
Линейная регрессия.
Рассмотрим двумерную случайную величину (X, Y), где X и Y – зависимые случайные величины. Представим приближенно одну случайную величину как функцию другой. Точное соответствие невозможно. Будем считать, что эта функция линейная.
Для определения этой функции остается только найти постоянные величины a и b.
Определение. Функция g(X) называется наилучшим приближением случайной величины Y в смысле метода наименьших квадратов, если математическое ожидание
в этой формуле mx=M(X), my=M(Y),
Величина
называется прямой сренеквадратической регрессииY на Х.
Величина Видно, что если r=±1, то остаточная дисперсия равна нулю, и, следовательно, ошибка равна нулю и случайная величина Y точно представляется линейной функцией от случайной величины Х.
Прямые среднеквадратичной регрессии пересекаются в точке (тх, ту), которую называют центром совместного распределенияслучайных величин Х и Y.
Линейная корреляция.
Если две случайные величины Х и Y имеют в отношении друг друга линейные функции регрессии, то говорят, что величины Х и Y связаны линейной корреляционной зависимостью.
Теорема. Если двумерная случайная величина (X, Y) распределена нормально, то Х и Y связаны линейной корреляционной зависимостью. Закон больших чисел.
Неравенство Чебышева. (Чебышев Пафнутий Львович (1821 – 1824) – русский математик)
На практике сложно сказать какое конкретное значение примет случайная величина, однако, при воздействии большого числа различных факторов поведение большого числа случайных величин практически утрачивает случайный характер и становится закономерным. Этот факт очень важен на практике, т.к. позволяет предвидеть результат опыта при воздействии большого числа случайных факторов. Однако, это возможно только при выполнении некоторых условий, которые определяются законом больших чисел. К законам больших чисел относятся теоремы Чебышева (наиболее общий случай) и теорема Бернулли (простейший случай), которые будут рассмотрены далее.
Рассмотрим дискретную случайную величину Х (хотя все сказанное ниже будет справедливо и для непрерывных случайных величин), заданную таблицей распределения:
Требуется определить вероятность того, что отклонение значения случайной величины от ее математического ожидания будет не больше, чем заданное число e.
Теорема. (Неравенство Чебышева) Вероятность того, что отклонение случайной величины Х от ее математического ожидания по абсолютной величине меньше положительного числа e, не меньше чем
Доказательство этой теоремы приводить не будем, оно имеется в литературе.
Теорема Чебышева.
Теорема. Если Х1, Х2, …, Хn- попарно независимые случайные величины, причем дисперсии их равномерно ограничены (не превышаю постоянного числа С), то, как бы мало не было положительное число e, вероятность неравенства
будет сколь угодно близка к единице, если число случайных величин достаточно велико.
Т.е. можно записать:
Часто бывает, что случайные величины имеют одно и то же математическое ожидание. В этом случае теорема Чебышева несколько упрощается:
Дробь, входящая в записанное выше выражение есть не что иное как среднее арифметическое возможных значений случайной величины. Теорема утверждает, что хотя каждое отдельное значение случайной величины может достаточно сильно отличаться от своего математического ожидания, но среднее арифметическое этих значений будет неограниченно приближаться к среднему арифметическому математических ожиданий. Отклоняясь от математического ожидания как в положительную так и в отрицательную сторону, от своего математического ожидания, в среднем арифметическом отклонения взаимно сокращаются. Таким образом, величина среднего арифметического значений случайной величины уже теряет характер случайности.
Теорема Бернулли.
Пусть производится п независимых испытаний, в каждом из которых вероятность появления события А равно р. Возможно определить примерно относительную частоту появления события А.
Теорема. Если в каждом из п независимых испытаний вероятность р появления события А постоянно, то сколь угодно близка к единице вероятность того, что отклонение относительной частоты от вероятности р по абсолютной величине будет сколь угодно малым, если число испытаний р достаточно велико.
Здесь т – число появлений события А. Из всего сказанного выше не следует, что с увеличением число испытаний относительная частота неуклонно стремится к вероятности р, т.е. В случае, если вероятности появления события А в каждом опыте различны, то справедлива следующая теорема, известная как теорема Пуассона. Теорема. Если производится п независимых опытов и вероятность появления события А в каждом опыте равна рi, то при увеличении п частота события А сходится по вероятности к среднему арифметическому вероятностей рi.
Предельные теоремы.
Как уже говорилось, при достаточно большом количестве испытаний, поставленных в одинаковых условиях, характеристики случайных событий и случайных величин становятся почти неслучайными. Это позволяет использовать результаты наблюдений случайных событий для предсказания исхода того или иного опыта. Предельные теоремы теории вероятностей устанавливают соответствие между теоретическими и экспериментальными характеристиками случайных величин при большом количестве испытаний. В рассмотренном выше законе больших чисел нечего не говорилось о законе распределения случайных величин. Поставим задачу нахождения предельного закона распределения суммы
когда число слагаемых п неограниченно возрастает. Эту задачу решает Центральная предельная теорема Ляпунова, которая была сформулирована выше. В зависимости от условий распределения случайных величин Xi, образующих сумму, возможны различные формулировки центральной предельной теоремы. Допустим, что случайные величины Xi взаимно независимы и одинаково распределены.
Теорема. Если случайные величины Xi взаимно независимы и имеют один и тот же закон распределения с математическим ожиданием т и дисперсией s2, причем существует третий абсолютный момент n3, то при неограниченном увеличении числа испытаний п закон распределения суммы
При доказательстве этой теоремы Ляпуновым использовались так называемые характеристические функции.
Определение. Характеристической функциейслучайной величины Х называется функция
эта функция представляет собой математическое ожидание некоторой комплексной случайной величины Зная закон распределения, можно найти характеристическую функцию по формуле (для непрерывных случайных величин):
Как видим, данная формула представляет собой не что иное, как преобразование Фурье для функции плотности распределения. Очевидно, что с помощью обратного преобразования Фурье можно по характеристической функции найти закон распределения. Введение характеристических функций позволяет упростить операции с числовыми характеристиками случайных величин. В случае нормального распределения характеристическая функция имеет вид:
Сформулируем некоторые свойства характеристических функций:
1) Если случайные величины Х и Y связаны соотношением
где а – неслучайный множитель, то
2) Характеристическая функция суммы независимых случайных величин равна произведению характеристических функций слагаемых.
Случайные величины Xi, рассмотренные в центральной предельной теореме, могут обладать произвольными распределениями вероятностей. Если все эти случайные величины одинаково распределены, дискретны и принимают только два возможных значения 0 или 1, то получается простейший случай центральной предельной теоремы, известный как теорема Муавра – Лапласа.
Теорема. (Теорема Муавра – Лапласа) Если производится п независимых опытов, в каждом из которых событие А появляется с вероятностью р, то для любого интервала (a, b) справедливо соотношение:
где Y – число появлений события А в п опытах, q = 1 – p, Ф(х) – функция Лапласа,
Теорема Муавра – Лапласа описывает поведение биноминального распределения при больших значениях п. Данная теорема позволяет существенно упростить вычисление по формуле биноминального распределения. Расчет вероятности попадания значения случайной величины в заданный интервал
Теорема Муавра – Лапласа очень широко применяется при решении практических задач.
Пример. Вероятность наступления события А в каждом испытании равна 0,3. Используя неравенство Чебышева, оценить вероятность того, что в 10000 испытаниях отклонение относительной частоты появления события А от его вероятности не превзойдет по абсолютной величине 0,01.
Надо определить математическое ожидание и дисперсию числа появления события А при одном опыте. Для события А случайная величина может принимать одно из двух значений: 1- событие появилось, 0- событие не появилось. При этом вероятность значения 1 равна вероятности р=0,3, а вероятность значения 0- равна вероятности ненаступления события А q=1 – p =0,7.
По определению математического ожидания имеем:
Дисперсия:
В случае п независимых испытаний получаем В нашем случае получаем: Вероятность отклонения относительной частоты появления события А в п испытаниях от вероятности на величину, не превышающую e=0,01 равна:
Выражение полученное в результате этих простых преобразований представляет собой не что иное, как вероятность отклонения числа т появления события А от математического ожидания на величину не большую, чем d=100. В соответствии с неравенством Чебышева эта вероятность будет не меньше, чем величина
Пример. Сколько следует проверить деталей, чтобы с вероятностью, не меньшей 0,96, можно было ожидать, что абсолютная величина отклонения относительной частоты годных деталей от вероятности детали быть годной, равной 0,98, не превысит 0,02.
Условие задачи фактически означает, что выполняется неравенство:
Здесь п- число годных деталей, т- число проверенных деталей. Для применения неравенства Чебышева преобразуем полученное выражение:
После домножения выражения, стоящего в скобках, на т получаем вероятность отклонения по модулю количества годных деталей от своего математического ожидания, следовательно, можно применить неравенство Чебышева, т.е. эта вероятность должна быть не меньше, чем величина Таким образом, получаем неравенство
Итого, получаем:
Т.е. для выполнения требуемых условий необходимо не менее 1225 деталей.
Пример. Суточная потребность электроэнергии в населенном пункте является случайной величиной, математическое ожидание которой равно 3000 кВт/час, а дисперсия составляет 2500. Оценить вероятность того, что в ближайшие сутки расход электроэнергии в этом населенном пункте будет от 2500 до 3500 кВт/час.
Требуется найти вероятность попадания случайной величины в заданный интервал:
Крайние значения интервала отклоняются от математического ожидания на одну и ту же величину, а именно – на 500. Тогда можно записать с учетом неравенства Чебышева:
Отсюда получаем:
Т.е. искомая вероятность будет не меньше, чем 0,99.
Пример. Среднее квадратическое отклонение каждой из 2500 независимых случайных величин не превосходит 3. Оценить вероятность того, что абсолютная величина отклонения среднего арифметического этих случайных величин от среднего арифметического их математических ожиданий не превосходит 0,3.
Требуется найти вероятность
Неравенство Чебышева в случае суммы случайных величин имеет вид:
Если среднее квадратическое отклонение не превосходит 3, то, очевидно, дисперсия не превосходит 9. Величина e по условию задачи равна 0,3. Тогда
Пример. Выборочным путем требуется определить среднюю длину изготавливаемых деталей. Сколько нужно исследовать деталей, чтобы с вероятностью, большей чем 0,9, можно было утверждать, что средняя длина отобранных изделий будет отличаться от математического ожидания этого среднего (средняя длина деталей всей партии) не более, чем на 0,001 см.? Установлено, что среднее квадратическое отклонение длины детали не превышает 0,04 см.
По условию если среднее квадратическое отклонение не превышает 0,04, то дисперсия, очевидно, не превышает (0,04)2. Также по условию задано, что
Если преобразовать соотношение, стоящее в скобках и после этого применить неравенство Чебышева, получаем:
Т.е. для достижения требуемой вероятности необходимо отобрать более 16000 деталей. Описанный подход, как видно, позволяет решить множество чисто практических задач.
Пример. Вероятность того, что наудачу выбранная деталь окажется бракованной, при каждой проверке одна и та же и равна 0,2. Определить вероятность того, что среди 50 наугад выбранных деталей бракованных окажется не менее 6.
Для того, чтобы воспользоваться теоремой Муавра - Лапласа найдем математическое ожидание и дисперсию количества бракованных деталей в 50 – ти отобранных:
Фактически в задаче требуется определить вероятность того, что бракованных деталей будет не менее шести, но и, очевидно, не более 50- ти.
Значения функции Лапласа находятся по таблице. Конечно, значения функции Лапласа Ф(10) в таблице нет, но т.к. в таблицах указано, что Ф(3)=1,0000, то все значения от величин, превышающих 3 также равны 1. Дополнительно см. Функция Лапласа.
Пример. Известно, что 60% всего числа изготавливаемых заводом изделий являются изделиями первого сорта. Приемщик берет первые попавшиеся 200 изделий. Чему равна вероятность того, что среди них окажется из от 120 до 150 изделий первого сорта?
Вероятность того, что деталь окажется первого сорта, равна, очевидно, 0,6. Математическое ожидание числа изделий первого сорта равно:
По теореме Муавра - Лапласа получаем:
Пример. Проверкой установлено, что 96% изделий служат не меньше гарантируемого срока. Наугад выбирают 15000 изделий. Найти вероятность того, что со сроком службы менее гарантируемого будет от 570 до 630 изделий.
Вероятность того, что срок службы изделия будет менее гарантированного равна: 1 – 0,96 = 0,04
Математическое ожидание числа таких изделий равно
По теореме Муавра - Лапласа получаем:
Теория массового обслуживания.
Случайные процессы.
Система массового обслуживания состоит из некоторого числа обслуживающих единиц или каналов, работа которых состоит в выполнении поступающих по этим каналам заявок. Примеры систем массового обслуживания весьма распространены на практике. Это различные телефонные станции, ремонтные мастерские и проч. Вид и количество поступающих на эти системы заявок различны и, вообще говоря, случайны. Теория массового обслуживания описывает закономерности функционирования таких систем.
Определение. процесс функционирования системы массового обслуживания называется случайным процессом. Чтобы оптимизировать процесс функционирования системы массового обслуживания его надо изучить и описать математически. Теория массового обслуживания является очень быстро развивающимся разделом теории вероятностей, т.к. ее применение на практике чрезвычайно широко.
Случайный процесс, протекающий в системе массового обслуживания состоит в том, что система в случайные моменты времени переходит из одного состояния в другое. Меняется число заявок, число занятых каналов, число заявок в очереди и проч.
Определение. Если переход системы из одного состояния в другое происходит скачком, а количество состояний системы (конечное или бесконечное) можно пронумеровать, то такая система называется системой дискретного типа.
Если количество возможных состояний счетно, то сумма вероятностей нахождения системы в одном из состояний равна 1.
Совокупность вероятностей pk(t) для каждого момента времени характеризует данное сечение случайного процесса. Случайные процессы со счетным множеством состояний бывают двух типов: c дискретнымили непрерывным временем. Если переходы системы из одного состояния в другое могут происходить только в строго определенные моменты времени, то случайный процесс будет процессом с дискретным временем, а если переход возможен в любой момент времени, то процесс будет процессом с непрерывным временем. Поскольку в реальности заявки на систему массового обслуживания могут поступать в любой момент времени, то большинство реальных систем массового обслуживания будут системами с процессом с непрерывным временем. Для того, чтобы описать случайный процесс в системе с непрерывным временем необходимо прежде всего проанализировать причины, вызывающие изменение состояния системы. Эти причины определяются потоком заявок, поступающих на систему.
Поток событий.
Определение. Потоком событийназывается последовательность событий, происходящих один за другим в какие- то моменты времени.
Характер событий, образующих поток может быть различным, а если события отличаются друг от друга только моментом времени, в который они происходят, то такой поток событий называется однородным. Однородный поток можно изобразить последовательностью точек на оси, соответствующей времени:
t1 t2 tn
t
Определение.Поток событий называется регулярным, если события следует одно за другим через строго определенные промежутки времени.
Определение. Поток событий называется стационарным, если вероятность попадания того ли иного числа событий на участок времени t зависит только от длины участка и не зависит от того, где именно на оси расположен этот участок. Стационарность потока событий означает, что плотность потока постоянна, отсутствуют промежутки времени, в течение которых событий больше чем обычно. Классический пример – “час пик” на транспорте.
Определение. Поток событий называется потоком без последействий, если для любых неперекрещивающихся участков времени число событий, попадающих на один из них, не зависит от числа событий, опадающих на другие. Отсутствие последействий означает, что заявки в систему поступают независимо друг от друга. Поток выходных событий систем массового обслуживания обычно имеет последействие, даже если входной поток его не имеет. Пример – вход пассажиров на станцию метро – поток без последействия, т.к. причины прихода отдельного пассажира не связаны с причинами прихода всех остальных, а выход пассажиров со станции – поток с последействием, т.к. он обусловлен прибытием поезда. Последействие, свойственное выходному потоку следует учитывать, если этот поток в свою очередь является входным для какой- либо другой системы.
Определение. Поток событий называется ординарным, если вероятность попадания на элементарный участок Dt двух или более событий достаточно мало по сравнению с вероятностью попадания одного события. Условие ординарности означает, что заявки на систему приходят по одному, а не парами, тройками и т.д. Однако, если заявки поступают только парами, только тройками и т.д., то такой поток легко свести к ординарному.
Определение. Если поток событий стационарен, ординарен и без последействий, то такой поток называется простейшим (пуассоновским)потоком. Это название связано с тем, что в этом случае число событий, попадающих на любой фиксированный интервал времени, распределено по распределению Пуассона .
В соответствии с этим законом распределения математическое ожидание числа точек, попавших попадающих на участок времени t, имеет вид:
l - плотность потока – среднее число событий в единицу времени.
Вероятность того, что за время t произойдет ровно т событий, равна
Вероятность того, что в течение данного времени не произойдет ни одного события, равна:
Пусть Т – промежуток времени между двумя произвольными соседними событиями в простейшем потоке. Найдем функцию распределения
В соответствии с законом распределения Пуассона, получаем:
Математическое ожидание, дисперсия и среднее квадратическое отклонение этой величины соответственно равны:
Таким образом, для величины Т получили показательный закон распределения.
Пример. В бюро обслуживания в среднем поступает 12 заявок в час. Считая поток заказов простейшим, определить вероятность того, что: а) за 1 минуту не поступит ни одного заказа, б) за 10 минут поступит не более трех заказов.
Сначала найдем плотность (интенсивность) потока, выразив ее в количестве заявок в минуту. Очевидно, эта величина равна Далее находим вероятность того, что за время t = 1 мин не поступит ни одной заявки по формуле:
Вероятность того, что за 10 минут поступит не более трех заказов будет складываться из вероятностей того, что не поступит ни одного заказа, поступит один, два или ровно три заказа.
Пример. В ресторан прибывает в среднем 20 посетителей в час. Считая поток посетителей простейшим, и зная, что ресторан открывается в 11.00, определите: а) вероятность того, что в 11.12 в ресторан придет 20 посетителей при условии, что в 11.07 их было 18 б) вероятность того, что между 11.28 и 11.30 в ресторане окажется новый посетитель, если известно, что предшествующий посетитель прибыл в 11.25.
Для ответ на первый вопрос фактически надо найти вероятность того, что в промежуток от 11.07 до 11.12 (t = 5 минут) придет ровно 2 посетителя. При этом мы знаем интенсивность потока посетителей - l = 20/60 = 1/3 посетителей в минуту. Конечно, данная величина носит условный характер, т.к. посетители не могут приходить по частям. Искомая вероятность равна:
Теперь перейдем ко второму вопросу. Нам не сказано, сколько именно новых посетителей будет в промежутке от 11.28 до 11.30, главное чтобы был хоть один. Эта вероятность равна
Если поток событий нестационарен, то его плотность l уже не является постоянной величиной, а зависит от времени.
Определение. Мгновенной плотностьюпотока событий называется предел отношения среднего числа событий, приходящегося на элементарный отрезок времени (t, t + Dt), к длине этого участка, которая стремиться к нулю.
Как видно из приведенного определения, с учетом того, что среднее число событий на участке времени равно математическому ожиданию, то можно сказать, что мгновенная плотность потока равна производной по времени от математического ожидания числа событий на участке (0, t).
Определение. Нестационарным пуассоновским потокомназывается ординарный поток однородных событий без последействий с переменной плотностью l(t).
Для такого потока число событий, попадающих на участок длины t, начинающийся в точке t0, подчиняется закону Пуассона:
Здесь а – математическое ожидание числа событий на участке от t0 доt + t0 . Оно вычисляется по формуле:
Величина а на только от длины участка t, но и от его положения во времени. Закон распределения промежутка Т между двумя соседними событиями также будет зависеть от того, где на временной оси расположено первое из событий, а также от функции l(t) .
Тогда, соответственно, вероятность появления хотя бы одного события на этом интервале времени будет равна:
Плотность распределения можно найти дифференцированием:
Эта плотность распределения уже не будет показательной. Она зависит от параметра t0 и вида функции l(t). Однако, условие отсутствия последействия в этом виде потока сохраняется.
Поток Пальма.
Поток Пальма еще называют потоком с ограниченным последействием.
Определение. Потоком Пальма называется ординарный поток однородных событий, если промежутки между событиями Т1, Т2, … представляют собой независимые случайные величины.
Если промежутки времени Т1, Т2, … распределены по показательному закону, то поток Пальма становится простейшим потоком. Примером потока Пальма может служить движение колонны автомобилей. Пусть движется колонна автомобилей, каждый из которых, двигаясь с одинаковой скоростью, стремится держаться на некотором заданном расстоянии от впереди идущего автомобиля. Однако, вследствие воздействия множества случайных факторов, это расстояние выдерживается не точно. Тогда времена пересечения каждым автомобилем определенного рубежа Т1, Т2, … будут независимыми случайными величинами и образуют по ток Пальма. Отметим, что если автомобили будут стремиться выдерживать заданное расстояние не от соседней машины, а от головной, то моменты пересечения этого рубежа уже не будут образовывать поток Пальма. Поток Пальма часто получается в качестве выходного потока систем массового обслуживания.
Теорема. (Теорема Пальма) Пусть на систему массового обслуживания поступает поток заявок типа Пальма, причем заявка, заставшая все каналы занятыми, получает отказ (не обслуживается). Если при этом время обслуживания имеет показательный закон распределения, то поток не обслуженных заявок является также потоком типа Пальма.
Этот факт важен, так как на практике получившие отказ заявки обычно перенаправляются на другую систему массового обслуживания, т.е. образуют для этой системы входной поток. Так, если на систему массового обслуживания поступает простейший входной поток, то поток заявок, получивших отказ, уже не будет простейшим, однако, будет потоком с ограниченным последействием.
Потоки Эрланга.
Потоки Эрланга также являются потоками с ограниченным последействием. Они образуются просеиванием простейшего потока. Суть этого просеивания состоит в следующем. Если изобразить на временной оси простейший поток, поставив в соответствие каждому событию некоторую точку, и выбросить из потока каждую вторую точку, то получим поток Эрланга первого порядка. Оставив каждую третью точку и выбросив две промежуточные, получаем поток Эрланга второго порядка и т.д.
Определение. Потоком Эрланга k – порядка называется поток, получаемый из простейшего, если сохранить в простейшем потоке каждую (k + 1) – ю точку, а остальные выбросить.
Очевидно, что простейший поток может рассматриваться как поток Эрланга нулевого порядка.
Пусть имеется простейший поток с интервалами Т1, Т2, … между событиями. Величина Т – промежуток времени между двумя соседними событиями в потоке Эрланга k – го порядка. Очевидно, что
Обозначим fk(t) плотность распределения величины Т для потока Эрланга k – го порядка. Если умножить эту плотность на элементарный отрезок времени dt, мы получим вероятность того, что величина Т примет значение в некоторой сколь угодно малой окрестности точки t- (t, t + dt). На этот участок должна попасть конечная точка промежутка, а предыдущие k точек простейшего потока – на промежуток (0, t). Вероятность первого события равна
Полученный закон распределения называется законом распределением Эрланга k- го порядка. При k = 0 получаем показательный закон распределения.
Математическое ожидание, дисперсия и среднее квадратическое отклонение для распределения Эрланга находятся по формулам:
Плотность потока Эрланга равна
Для промежутка времени между двумя соседними событиями в потоке Т рассмотрим нормированную величину
Закон распределения для такого потока будет иметь вид:
Математическое ожидание и дисперсия будут равны:
Получается, что неограниченном увеличении k нормированный поток Эрланга приближается к регулярному потоку с постоянными интервалами, равными Изменение порядка нормированного потока Эрланга позволяет получить различную степень последействия. Последействие возрастает с увеличением k. На практике это удобно для приближенного представления реального потока с каким – либо последействием потоком Эрланга. При этом порядок этого потока определяется из того соображения, чтобы характеристики потока Эрланга (математическое ожидание и дисперсия) совпадали с характеристиками исходного потока.
Цепи Маркова.
(Андрей Андреевич Марков (1856-1922) – русский математик, академик)
Определение. Процесс, протекающий в физической системе, называется марковским, если в любой момент времени вероятность любого состояния системы в будущем зависит только от состояния системы в текущий момент и не зависит от того, каким образом система пришла в это состояние.
Определение. Цепью Маркова называется последовательность испытаний, в каждом из которых появляется только одно из k несовместных событий Ai из полной группы. При этом условная вероятность pij(s) того, что в s –ом испытании наступит событие Aj при условии, что в (s – 1) – ом испытании наступило событие Ai, не зависит от результатов предшествующих испытаний.
Независимые испытания являются частным случаем цепи Маркова. События называются состояниями системы, а испытания – изменениями состояний системы.
По характеру изменений состояний цепи Маркова можно разделить на две группы.
Определение. Цепью Маркова с дискретным временемназывается цепь, изменение состояний которой происходит в определенные фиксированные моменты времени. Цепью Маркова с непрерывным временемназывается цепь, изменение состояний которой возможно в любые случайные моменты времени.
Определение. Однороднойназывается цепь Маркова, если условная вероятность pij перехода системы из состояния i в состояние j не зависит от номера испытания. Вероятность pij называется переходной вероятностью.
Допустим, число состояний конечно и равно k. Тогда матрица, составленная из условных вероятностей перехода будет иметь вид:
Эта матрица называется матрицей перехода системы. Т.к. в каждой строке содержаться вероятности событий, которые образуют полную группу, то, очевидно, что сумма элементов каждой строки матрицы равна единице. На основе матрицы перехода системы можно построить так называемый граф состояний системы,его еще называют размеченный граф состояний. Это удобно для наглядного представления цепи. Порядок построения граф рассмотрим на примере.
Пример. По заданной матрице перехода построить граф состояний.
Т.к. матрица четвертого порядка, то, соответственно, система имеет 4 возможных состояния.
S1 0,2 0,7
S2 0,4 S4 0,6 0,5
0,1 0,5 S3
На графе не отмечаются вероятности перехода системы из одного состояния в то же самое. При рассмотрении конкретных систем удобно сначала построить граф состояний, затем определить вероятность переходов системы из одного состояния в то же самое (исходя из требования равенства единице суммы элементов строк матрицы), а потом составить матрицу переходов системы.
Пусть Pij(n) – вероятность того, что в результате n испытаний система перейдет из состояния i в состояние j, r – некоторое промежуточное состояние между состояниями i и j. Вероятности перехода из одного состояния в другое pij(1) = pij.
Тогда вероятность Pij(n) может быть найдена по формуле, называемой равенством Маркова:
Здесь т – число шагов (испытаний), за которое система перешла из состояния i в состояние r. В принципе, равенство Маркова есть ни что иное как несколько видоизменная формула полной вероятности. Зная переходные вероятности (т.е. зная матрицу перехода Р1), можно найти вероятности перехода из состояния в состояние за два шага Pij(2), т.е. матрицу Р2, зная ее – найти матрицу Р3, и т.д.
Непосредственное применений полученной выше формулы не очень удобно, поэтому, можно воспользоваться приемами матричного исчисления (ведь эта формула по сути – не что иное как формула перемножения двух матриц). Тогда в общем виде можно записать:
Вообще то этот факт обычно формулируется в виде теоремы, однако, ее доказательство достаточно простое, поэтому приводить его не буду.
Пример. Задана матрица переходов Р1. Найти матрицу Р3.
Определение. Матрицы, суммы элементов всех строк которых равны единице, называются стохастическими. Если при некотором п все элементы матрицы Рп не равны нулю, то такая матрица переходов называется регулярной.
Другими словами, регулярные матрицы переходов задают цепь Маркова, в которой каждое состояние может быть достигнуто через п шагов из любого состояния. Такие цепи Маркова также называются регулярными.
Теорема. (теорема о предельных вероятностях) Пусть дана регулярная цепь Маркова с п состояниями и Р – ее матрица вероятностей перехода. Тогда существует предел
Т.е. матрица состоит из одинаковых строк.
Теперь о величинах ui. Числа u1, u2, …, un называются предельными вероятностями.Эти вероятности не зависят от исходного состояния системы и являются компонентами собственного вектора матрицы РТ (транспонированной к матрице Р). Этот вектор полностью определяется из условий:
Пример. Найдем предельные вероятности для рассмотренного выше примера.
C учетом того, что u1 + u2 = 1, получаем:
Получаем:
d:\111allrefs\temp-lektsiopedia5\lect1.DOC Содежание КВМ Часть 1. Содежание КВМ Часть 2. Содержание КВМ Часть 3.
Содержание: Теория вероятностей. Основные понятия. Операции над событиями. Теорема сложения вероятностей. Условная вероятность. Теорема умножения вероятностей. Формула полной вероятности. Формула Бейеса. Повторение испытаний. Формула Бернулли. Случайные величины. Закон распределения дискретной случайной величины. Биноминальное распределение. Распределение Пуассона. Числовые характеристики дискретной случайной величины. Математическое ожидание. Свойства математического ожидания. Дисперсия. Вычисление дисперсии. Свойства дисперсии. Среднее квадратическое отклонение. Функция распределения. Свойства функции распределения. Плотность распределения. Свойства плотности распределения. Числовые характеристики непрерывной случайной величины. Равномерное распределение. Показательное распределение. Нормальный закон распределения. Функция Лапласа. Правило трех сигм. Центральная предельная теорема Ляпунова. Система случайных величин. Плотность распределения системы двух случайных величин. Условные законы распределения. Условное математическое ожидание. Зависимые и независимые случайные величины. Линейная регрессия. Линейная корреляция. Закон больших чисел. Неравенство Чебышева. Теорема Чебышева. Теорема Бернулли. Предельные теоремы. Характеристические функции. Теория массового обслуживания. Случайные процессы. Поток событий. Нестационарный пуассоновский поток. Поток Пальма. Потоки Эрланга. Цепи Маркова. Матрица переходов и граф состояний. Предельные вероятности.
Ó Ларин Александр Александрович 2001 год. mailto: aalar@yandex.ru
|