|
Описова статистикаDate: 2015-10-07; view: 438. Про засоби статистичного аналізу даних Пакет аналізу. До складу Microsoft Excel входить набір засобів аналізу даних (так званий пакет аналізу), призначений для рішення складних статистичних і інженерних задач. Для проведення аналізу даних за допомогою цих інструментів варто указати вхідні дані і вибрати параметри; аналіз буде проведений за допомогою придатної статистичної чи інженерної макрофункції, а результат буде поміщений у вихідний діапазон. Інші засоби дозволяють подати результати аналізу в графічному вигляді. Необхідні знання. Для успішного застосування процедур аналізу необхідні початкові знання в області статистичних і інженерних розрахунків, для яких ці інструменти були розроблені.
Один з інструментів пакета аналізу. Цей засіб аналізу служить для створення одномірного статистичного звіту, що містить інформацію про центральну тенденцію і мінливість вхідних даних. Параметри діалогового вікна "Описательная статистика" (рис 4.6) Ø Входной диапазон.Посилання на діапазон, що містить аналізовані дані. Посилання повинне складатися не менше, ніж із двох суміжних діапазонів даних, дані в яких розташовані в рядках чи в стовпцях.
Рис . 3. Ø Группирование.Встановіть перемикач у положення По стовпцях чи По рядках у залежності від розташування даних у вхідному діапазоні. Ø Метки в первой строке/Метки в первом столбце.Якщо перший рядок вихідного діапазону містить назви рядків або стовпців, установіть прапорець Метки в первой строке. Якщо назви рядків знаходяться в першому стовпці вхідного діапазону, установіть прапорець Метки в первом столбце. Якщо вхідний діапазон не містить міток, то необхідні заголовки у вихідному діапазоні будуть створені автоматично. Ø Уровень надёжности.Встановіть прапорець, якщо у вихідну таблицю необхідно включити рядок для рівня надійності. У поле введіть необхідне значення. Наприклад, значення 95% обчислює рівень надійності середнього зі значимістю 0,05 (рис.4.).
Рис.4. Ø К-й наибольший.Встановіть прапорець, якщо у вихідну таблицю необхідно включити рядок для k-го найбільшого значення для кожного діапазону даних. У відповідному вікні введіть число k. Якщо k дорівнює 1, цей рядок буде містити максимум з набору даних. Ø К-й наименьший.Встановіть прапорець, якщо у вихідну таблицю необхідно включити рядок для k-го найменшого значення для кожного діапазону даних. У відповідному вікні введіть число k. Якщо k дорівнює 1, цей рядок буде містити мінімум з набору даних. Ø Выходной диапазон.Введіть посилання на ліву верхню чарунку вихідного діапазону. Цей інструмент аналізу виводить два стовпці зведень для кожного набору даних. Лівий стовпець містить мітки статистичних даних; правий стовпець містить статистичні дані. Діапазон статистичних даних, який складається із двох стовпців буде виведений для кожного стовпця чи для кожного рядка вхідного діапазону в залежності від положення перемикача Группирование. Ø Новый лист.Встановіть прапорець, щоб відкрити новий лист у книзі і вставити результати аналізу, починаючи з чарунки A1. Якщо в цьому є необхідність, введіть ім'я нового листа в поле, розташоване напроти відповідного положення перемикача. Ø Новая книга.Встановіть перемикач, щоб відкрити нову книгу і вставити результати аналізу в осередок A1 на першому листі в цій книзі. Ø Итоговая статистика.Встановіть прапорець, якщо у вихідному діапазоні необхідно одержати по одному полю для кожного з наступних видів статистичних даних: Среднее, Стандартная ошибка (середнього), Медиана, Мода, Стандартное отклонение, Дисперсия виборки, Ексцес, Асимметричность, Интервал, Минимум, Максимум, Сумма, Счёт, Наибольшее (#), Наименшее (#), Уровень надёжности.
Приклад 4.1. Визначити тісноту зв'язку живої маси і висоту в холці свиноматок білої української степової породи за даними такої вибірки: Х – жива маса, кг; Y– висота в холці, см. Дані задачі вводяться у вигляді масиву чисел, який складається з двох стовпців попарно (таблиця 4.1). Рішення: Коефіцієнт кореляції знаходимо за допомогою майстра функцій КОРРЕЛ: r=0,582926309. Помилка коефіцієнта кореляції складе:
Розрахуємо критерій вірогідності розрахованого коефіцієнта кореляції:
Число ступенів свободи складе: За таблицею 1 (див. додаток ) стандартні значення критерію t по Стьюденту при 98 ступенях свободи знаходимо tst =2,0; 2,6; 3,4, що відповідає рівням імовірності: Р= 0,95; Р= 0,99; Р= 0,999. Таблиця 4.1
Порівнюючи розрахований tr з табличним, бачимо, що його значення більше табличної величини. Це означає, що коефіцієнт кореляції достовірний з імовірністю Р > 0,999. Тобто, якби дане дослідження повторили 1000 разів, то в 999 випадках спостерігалася б ця ж закономірність (зі збільшенням висоти збільшується жива маса) і лише в одному випадку могли одержати дані якогось іншого характеру. З урахуванням цих даних можна зробити висновок: зв'язок між живою масою свиноматок і висотою в холці позитивний, близький до тісного.
Коефіцієнт регресії розраховується за формулами:
де sх і sy - середнє квадратичне відхилення (стандартне відхилення) відповідне X чи Y.
Висновок: При зміненні висоти свиноматок на 1 см їх жива маса зміниться в середньому на 3,94 кг, а при зміни живої маси свиноматок на 1 кг їх висота зміниться в середньому на 0,09 см.
Задачі для самостійного рішення За даними таблиці 1. (див. додаток) розрахувати r, mr , tr ,значення Rx/y та Ry/x і зробити відповідні висновки про їх вірогідності.
|