Сущность, цели, математическое определение регрессионного анализа

Date: 2015-10-07; view: 457.

Глава 1. Характеристика регрессионного анализа

Регрессионный анализ — статистический метод исследования влияния одной или нескольких независимых переменных X_1, X_2, ..., X_p на зависимую переменную Y. Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные — критериальными. Терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения.

Цели регрессионного анализа:

· Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)

· Предсказание значения зависимой переменной с помощью независимой(-ых)

· Определение вклада отдельных независимых переменных в вариацию зависимой

Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа.

Математическое определение регрессии

Строго регрессионную зависимость можно определить следующим образом. Пусть Y, X_1, X_2, \ldots, X_p — случайные величины с заданным совместным распределением вероятностей. Если для каждого набора значений X_1=x_1, X_2=x_2, \ldots, X_p=x_p определено условное математическое ожидание y(x_1,x_2, \ldots, x_p)=\mathbb{E}(Y \mid X_1=x_1, X_2=x_2, \ldots, X_p=x_p) (уравнение регрессии в общем виде), то функция y(x_1,x_2, \ldots, x_p) называется регрессией величины Y по величинам X_1, X_2,\ldots, X_p, а её график — линией регрессии Y по X_1, X_2, \ldots, X_p, или уравнением регрессии.

Зависимость Y от X_1, X_2, \ldots, X_p проявляется в изменении средних значений Y при изменении X_1, X_2, \ldots, X_p. Хотя при каждом фиксированном наборе значений X_1=x_1, X_2=x_2, \ldots, X_p=x_p величина Y остаётся случайной величиной с определённым распределением.

Для выяснения вопроса, насколько точно регрессионный анализ оценивает изменение Y при изменении X_1, X_2, ..., X_p, используется средняя величина дисперсии Y при разных наборах значений X_1, X_2, ..., X_p (фактически речь идет о мере рассеяния зависимой переменной вокруг линии регрессии).

В матричной форме уравнение регрессии (УР) записывается в виде: Y=BX+U, где U — матрица ошибок. При обратимой матрице X◤X получается вектор-столбец коэффициентов B с учётом U◤U=min(B). В частном случае для Х=(±1) матрица X◤X является рототабельной, и УР может быть использовано при анализе временны́х рядов и обработке технических данных.

<== previous lecture	\|	next lecture ==>
Введение	\|	Статистическое изучение взаимосвязи социально-экономических явлений и процессов

lektsiopedia.org - 2013 год. | Page generation: 0.373 s.