|
Сущность, цели, математическое определение регрессионного анализаDate: 2015-10-07; view: 412. Глава 1. Характеристика регрессионного анализа Регрессионный анализ — статистический метод исследования влияния одной или нескольких независимых переменных X_1, X_2, ..., X_p на зависимую переменную Y. Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные — критериальными. Терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения. Цели регрессионного анализа: · Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными) · Предсказание значения зависимой переменной с помощью независимой(-ых) · Определение вклада отдельных независимых переменных в вариацию зависимой Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа. Математическое определение регрессии Строго регрессионную зависимость можно определить следующим образом. Пусть Y, X_1, X_2, \ldots, X_p — случайные величины с заданным совместным распределением вероятностей. Если для каждого набора значений X_1=x_1, X_2=x_2, \ldots, X_p=x_p определено условное математическое ожидание y(x_1,x_2, \ldots, x_p)=\mathbb{E}(Y \mid X_1=x_1, X_2=x_2, \ldots, X_p=x_p) (уравнение регрессии в общем виде), то функция y(x_1,x_2, \ldots, x_p) называется регрессией величины Y по величинам X_1, X_2,\ldots, X_p, а её график — линией регрессии Y по X_1, X_2, \ldots, X_p, или уравнением регрессии. Зависимость Y от X_1, X_2, \ldots, X_p проявляется в изменении средних значений Y при изменении X_1, X_2, \ldots, X_p. Хотя при каждом фиксированном наборе значений X_1=x_1, X_2=x_2, \ldots, X_p=x_p величина Y остаётся случайной величиной с определённым распределением.
Для выяснения вопроса, насколько точно регрессионный анализ оценивает изменение Y при изменении X_1, X_2, ..., X_p, используется средняя величина дисперсии Y при разных наборах значений X_1, X_2, ..., X_p (фактически речь идет о мере рассеяния зависимой переменной вокруг линии регрессии). В матричной форме уравнение регрессии (УР) записывается в виде: Y=BX+U, где U — матрица ошибок. При обратимой матрице X◤X получается вектор-столбец коэффициентов B с учётом U◤U=min(B). В частном случае для Х=(±1) матрица X◤X является рототабельной, и УР может быть использовано при анализе временны́х рядов и обработке технических данных.
|