|
Розрахунок кореляційної матриціDate: 2015-10-07; view: 481. Рисунок 5.17 – Гістограма залишків рядків Розрахунок кореляційної матриці дає можливість виявити так звані мультиколінеарні фактори, тобто пари факторів, між якими існує значущий кореляційний зв'язок (один фактор залежить від другого та навпаки). Кореляційна матриця є квадратною та містить стільки рядків та стовпчиків, скільки незалежних змінних у рівнянні регресії. Для побудови кореляційної матриці слід натиснути у вікні Multiple Regression Results – Результати множинної регресії(рис. 5.3) кнопку
Рисунок 5.18 – Діалогове вікно описових статистик
Надалі в цьому вікні слід натиснути кнопку
Рисунок 5.19 – Кореляційна матриця 5.4 Швидка побудова графіків парної регресії та їх інтерактивний аналіз за допомогою засобу “пензель” За допомогою графічної підсистеми STATISTICA можна швидко визначити рівняння однофакторних (парних) регресій, тобто регресій, у яких на залежну змінну впливає лише один незалежний фактор
Вид аналітичної функції у цьому випадку може бути різноманітний. У системі STATISTICA передбачений розрахунок рівнянь парних регресій, показаних у таблиці 5.1.
Таблиця 5.1 – Математичні моделі парної регресії
Засіб “пензель” є інструментом для інтерактивного графічного аналізу даних, за допомогою якого можна легко встановити відповідність між точками на графіку та їх числовими значеннями. Можна виділити необхідні точки на графіку та потім виконати одну з наступних дій: помітити їх маркером, тимчасово виключити їх з аналізу, вивести для них помітки, перейти до режиму перегляду координат цих точок.
Розглянемо побудову лінійної регресії та інтерактивний аналіз даних на прикладі залежності між терміном експлуатації вантажного автомобіля (YEAR) та витратами на запасні частини (ZATR_ZAP). Дані про витрати на запасні частини згідно з роками експлуатації автомобіля введені у робочий файл STATISTICA (рис. 5.20).
Для побудови графіку регресії та визначення його коефіцієнтів необхідно виконати наступні дії: 1) відкрити файл даних у будь-якому модулі STATISTICA, тобто ця функція є доступною у всіх статистичних модулях системи; 2) вибрати у головному меню системи пункт Graphs – Графіки, з підпунктами Stats 2D Graphs – Статистичні двомірні графікита Scatterplots – Точковий графік(рис. 5.21);
Рисунок 5.21 – Виклик діалогового вікна побудови точкового графіка
3) на екрані з'являється діалогове вікно 2D Scatterplots – Двомірний точковий графік (рис. 5.21). За допомогою кнопки
Рисунок 5.22 – Діалогове вікно побудови двомірного точкового графіка
4) у списку Fit – Підгонка вибрати необхідну вид модель регресії (табл. 5.1). Для нашого прикладу обираємо лінійну (Linear) модель регресії; 5) у групі опцій STYLE – Стиль за необхідності можна вибрати прямокутну декартову (Normal) чи полярну (Polar) систему координат для побудови графіка; 6) у групі опцій CONFIDENCE BANDS – Довірчі границіможна вказати, виводити (On) чи не виводити на графіку довірчі границі (Off), та якщо виводити, то для якого рівня надійності (Level); 7) кнопка У цьому діалоговому вікні можна: – змінити орієнтацію звичайної системи координат (Standard – Стандартна) на обернену (Reverse – Обернена) у групі опцій X-Y AXIS ORIENTATION – Орієнтація осей системи координат; – вказати найвищу степінь полінома при побудові поліноміальної моделі регресії у групі опцій POLYNOMIAL FIT – Поліноміальна підгонка, яка може змінюватися від 2 до 5; – вибрати десятинну (10) чи натуральну (е) основу логарифму при побудові логарифмічної моделі регресії у групі опцій LOGARITHMIC FIT – Логарифмічна підгонка.
Рисунок 5.23 – Діалогове вікно додаткових опцій графіка
8) після встановлення необхідних параметрів та опцій графіка слід натиснути кнопку ОК діалогового вікна 2D Scatterplots – Двомірні точкові графіки (рис. 5.22). Не екрані з'явиться графік регресії з нанесеними на нього точками – полем регресії (рис. 5.24).
Рисунок 5.24 – Точковий графік лінійної регресії У верхній частині графіка вказане рівняння регресії, таким чином, шукана лінійна залежність має вигляд
Довірчі границі для рівня надійності 0.95 нанесені обабіч лінії регресії пунктирними лініями. Аналізуючи графік бачимо, що точки досить добре лягають на пряму регресію, однак дві точки виходять за границі довірчого інтервалу. Проведемо за допомогою засобу “пензель” інтерактивний аналіз графіку з метою відповісти на наступні запитання: – яким рядкам таблиці відповідають ці точки ? – як зміниться рівняння регресії, якщо ці дві точки виключити з аналізу ? Засіб “пензель” викликається у режимі перегляду графіка за допомогою кнопки Подальші операції з пензлем над точками на графіку проводяться за наступною загальною схемою: – спочатку точки виділяються за допомогою миші (можливі різні способи виділення точок: кожну точку окремо чи групу точок одночасно); – обирається тип операції, яку необхідно провести над виділеними точками; – для відбиття результату операції на графіку натискається кнопка Update – Обновитиз діалогового вікна пензля. Для виділення точок пензель може мати один з наступних виглядів, що встановлюються у групі опцій Brush – Пензельдіалогового вікна пензля: – Point – Точка забезпечує виділення окремих точок за допомогою “прицілу”; – Rectangle – Прямокутникзабезпечує виділення всіх точок заданої прямокутної області графіка; – Lasso – Ласозабезпечує виділення всіх точок, яки потрапили до заданого регіону будь-якої довільної форми. Над виділеними одним з вищеописаних способів точками можна виконати наступні дії, вибір яких здійснюється за допомогою групи опцій Action – Діядіалогового вікна пензля: – Mark – Помітити, при цьому виділені точки будуть відображені за допомогою іншого типу маркеру, чим інші; – Label – Показати мітки, при цьому виділені точки будуть виведені з їх мітками, (іменами випадків, координатами);
– Turn OFF – Виключити точки, при цьому виділені точки будуть тимчасово видалені (тобто, не будуть відображені на графіку та не будуть брати участь у побудові лінії регресії). Вони можуть бути знов виведені за допомогою кнопки De-select All – Відмінити виділення всіх точок чи при переключенні на режим Turn On – Включити за допомогою кнопки Reverse – Обернути (для цього необхідно попередньо вибрати область графіка з виключеними точками); – De-select – Відмінити виділення, при цьому відміняється остання дія над точками графіка. Кнопка Reverse – Обернутизаміняє всі дії над точками на протилежні. Вони стануть відповідно Un-Mark – Не маркувати, Un-Label – Не показувати мітки, Turn ON – Включити точки. Включена опція Auto Update – Автоматичне обновленняприводить до негайного відображення вибраної дії на графіку без необхідності натиснення кнопки Update – Обновити. Для відповіді на питання, яким рядкам даних відповідають точки, що виходять за межі границь надійності, використаємо спосіб виділення точок Point – Точка та за допомогою миші підведемо до них перехрестя ”прицілу” та натиснемо на ліву кнопку миші. Вибрані точки змінять свій колір. Тепер виберемо операцію, яку необхідно виконати над виділеними точками. Вибираємо у діалоговому вікні “пензля” у групі опцій Action – Діятип операції Label – Показати мітки. Натиснемо на кнопку Update – Обновити. Графік буде перерисований та прийме наступний вигляд (рис. 5.26)
Рисунок 5.26 – Відображення міток точок на графіку
Таким чином, дві точки, що виходять за межі границь надійності, відповідають випадкам 10 та 12. Виключимо ці точки з аналізу та з'ясуємо, як це вплине не рівняння регресії. Виділяємо ці дві точки за допомогою “прицілу” та вибираємо у групі опцій Action – Діятип операції Turn OFF–Виключити, після чого натиснемо кнопку Update – Обновити. Перерисований графік матиме вигляд (рис. 5.27).
Рисунок 5.27 – Підгонка лінії регресії без виключених точок
Аналізуючи графік бачимо, що тепер всі точки попадають у границі надійності, а рівняння лінійної регресій має вигляд
|