4.2.1 Середня арифметична (математичне очікування) визначається
. (4.3)
4.2.2 Виправлена дисперсія (середнє значення квадрата відхилення випадкової величини Хj в інтервалі групування від її математичного очікування)
. (4.4)
4.2.3 Середнє квадратичне відхилення, що є стандартом (квадратний корінь з дисперсії)
. (4.5)
4.2.4 Коефіцієнт варіації (відносне розсіювання)
. (4.6)
4.2.5 Асиметрія (асиметричність розподілу щодо моди)
. (4.7)
, якщо розподіл витягнуто вправо від моди, якщо вліво.
4.2.6 Ексцес (гостровершинність розподілу)
; (4.8)
де , якщо вершина розподілу вища і "гостра";
, якщо вершина нижча і "плоска".
4.2.7 Мода (значення в розподілі, відповідне максимальній частоті)
; (4.9)
де – частоти, що передують, відповідно, подальшому модальному інтервалу;
– початкова межа модального інтервалу.
; (4.10)
де – початкова межа, частота і номер медіанного інтервалу.
Гістограма і полігон частот
Нехай – вибірка обсягу , що містить різних варіантів, з генеральної сукупності випадкової величини з невідомою щільністю ймовірностей . Наближенням (оцінкою) невідомої щільності ймовірностей можуть служити гістограма або полігон відносних частот. Гістограма і полігон відносних частот призначені для геометричного зображення групованого варіаційного ряду.
Гістограма відносних частот представляється у вигляді прямокутників які примикають один до одного з основою
, (4.11)
рівними ширині інтервалів угруповань, і висотами
. (4.12)
Для гістограми відносних частот площа ступінчастої фігури відповідає сумі ймовірностей і дорівнює 1. Площа будь-якого прямокутника гістограми дорівнює ймовірності попадання значень аналізованої випадкової величини в інтервал, відповідний основі прямокутника.
Рисунок 4.1 – Гістограма і полігон відносних частот
Полігоном відносних частот називається ламана, що з'єднує точки (рис. 4.1), де – середини інтервалів і-х угруповань; – висоти прямокутників гістограми.
При збільшенні обсягу вибірки та зменшенні довжин інтервалів гістограма і полігон відносних частот наближаються до графіка невідомої функції f(x) – щільності ймовірності генеральної сукупності. По виду гістограми або полігону частот можна висунути гіпотезу про вид розподілу генеральної сукупності (рисунок 4.2).
Рисунок 4.2 – Види гістограм
Наприклад, якщо гістограма має вид, представлений на рис. 4.2а, то можна припустити, що генеральна сукупність має нормальний закон розподілу з щільністю ймовірностей
. (4.13)
Якщо гістограма має вид рис. 4.2,б, що характеризує рівномірний розподіл з щільністю ймовірностей
. (4.14)
Якщо гістограма має вид рис. 4.2,в, що характеризує показовий розподіл з щільністю ймовірностей;
. (4.15)
Порядок виконання роботи
Налаштувати табличний процесор Excel для роботи з даними. Для цього переконатися в наявності вкладки Аналіз даних у списку падаючого меню кнопки рядка меню Сервіс. В іншому випадку зробити підключення Пакета аналізу. Для цього встановити відповідний прапорець у вікні Надбудови, що відкривається після вибору вкладки Надбудови кнопки рядка меню Сервіс. (Excel 2003).
При використанні Excel 2007 на панелі швидкого доступу необхідно вибрати закладку Дані, за допомогою правої кнопки маніпулятора «миша» вибрати в контекстному меню пункт Настройка панелі швидкого доступу. У даному пункті вибираємо пункт Надбудови в якому вибираємо Пакет аналізу і натискаємо Перейти. В меню Настройки встановлюємо галочку навпроти Пакета аналізу і натискаємо ОК. Після цього в Панелі швидкого доступу з'являється кнопка Аналіз даних.
Вибрати з файлу завдання (видається викладачем) числові дані свого варіанту. З метою отримання варіаційного ряду провести сортування введених випадкових величин за зростанням. Для цього необхідно виділити лівою кнопкою маніпулятора «миша» область сортованих даних. Далі скористатися кнопкою рядка меню Дані, вкладка Сортування (можливий швидкий доступ до даного інструменту при натисканні на кнопку панелі інструментів Стандартна).
Для визначення основних статистичних характеристик необхідно:
1) Вибрати пункт в списку вікна Інструменти аналізу (кнопка Описова статистика рядка меню Сервіс, вкладка Аналіз даних).
2) У вікні Описова статистика в поле з назвою Вхідний інтервал ввести ВХІДНІ ДАНІ. Далі, встановити перемикач Групування в положення – по стовпцях.
3) Вказати ПАРАМЕТРИ ВИВЕДЕННЯ, для чого встановити відповідний пункт Вихідний інтервал. Заповнити поле вихідного інтервалу – область, в якій буде розташовуватися підсумкова таблиця. Для цього вказується номер комірки, в якій буде розташовуватися лівий верхній кут таблиці (поза зоною розрахункової таблиці 4.1).
Далі, встановити прапорець у вікні Підсумкова статистика.
4) Натисненням кнопки ОК вивести таблицю основних статистичних характеристик.
Для заповнення таблиці 4.1 необхідно:
1) Визначити кількість інтервалів групування r і обчислити ширину інтервалів групування X.
2) Використовуючи наявні дані визначити інтервал групування , початок ( ) і кінець ( ) інтервалу групування, середину інтервалу групування ( ), зустрічальність частот і частість в інтервалі і накопичену частість. Заповнити відповідні стовпчики таблиці 4.1.
3) Провести перевірку правильності обчислень, підсумувавши вміст стовпця 5 (Зустрічальність частот). Для цього скористаєтеся кнопкою підсумовування, попередньо виділивши область даних, що підлягає підсумовування. Результат, який виведено в нижній комірці, повинен бути дорівнювати обсягу введеної вибірки.
Аналогічним чином виконується підсумовування вмісту стовпця 6 (частота в інтервалі) результат повинен дорівнювати одиниці. В іншому випадку необхідно визначити і усунути причину невідповідності.
Вибрати пункт Гістограма в списку вікна Інструменти аналізу (кнопка рядка меню Сервіс, вкладка Аналіз даних):
1) У вікні Гістограма в поле з назвою Вхідний інтервал ввести ВХІДНІ ДАНІ.
2) У вікні Гістограма в поле з назвою Інтервал карманів ввести дані стовпця 6 таблиці 1.1.
3) Вказати ПАРАМЕТРИ ВИВЕДЕННЯ, для чого встановити відповідний пункт Вихідний інтервал. Заповнити поле вихідного інтервалу (поза зоною розрахункової таблиці 4.1). Далі, встановити прапорець у вікні Парето, Інтегральний відсоток і Вивід графіка. Натисканням кнопки ОК вивести таблицю частот, частостей емпіричного розподілу, гістограму.
Порівняти отримані дані з даними розрахункової таблиці 4.1.
Для побудови гістограм Густині розподілу ймовірності, Емпіричною функції, Діаграми Парето використовуйте вкладку Діаграма кнопка рядка меню Вставка або кнопку Майстер діаграм панелі інструментів Стандартна.
За зовнішнім виглядом гістограми емпіричної ймовірності, використовуючи графіки теоретичних густин розподілу ймовірностей, що наведені в методичних вказівках, визначити, якому теоретичному закону відповідає зазначена гістограма.
Роздрукувати отримані результати і представити їх в складі звіту про виконання лабораторної роботи. У звіті привести висновки про виконану роботу.
Приклад виконання лабораторної роботи в Excel наведено в додатках.
Зміст звіту
4.5.1 Короткі теоретичні відомості по темі лабораторної роботи.
4.5.2 Розрахунок параметрів в Excel за формулами наведеними в теоретичному матеріалі.
4.5.3 Роздруківку електронної таблиці Excel виконану для свого варіанту (приклад наведено у Додатку В).
4.5.4 Графіки залежності відповідно до завдання.
4. 6 Контрольні питання
4.6.1 Наведіть порядок обробки одновимірних випадкових величин.
4.6.2 Яке призначення мають гістограма і полігон відносних частот?
4.6.3 Які основні статистичні характеристики вибірки Ви знаєте, приведіть визначення і формули.
Література
4.7.1 Вентцель Е.С. Теория вероятностей [Текст]. Е.С. Вентцель М: Наука., 1969.- 576 с.
4.7.2 Шторм Р. Теория вероятностей. Математическая статистика [Текст]. Статистический контроль качества. Р.Шторм − М.: Изд-во «Мир», 1970.- 368 с.
4.7.3 Гмурман В.Е. Теория вероятностей и математическая статистика [Текст]: Учебное пособие для вузов. В.Е. Гмурман– 8-е издание, М.: Высшая школа, 2003. – 479 с.
4.7.4 Гмурман В.Е. Руководство к решению задач по теории вероятностей и статистике [Текст]: Учебное пособие для вузов. В.Е. Гмурман – М.: Высшая школа, 2002. – 405 с.
ЛАБОРАТОРНА РОБОТА № 5
Тема: Параметричне оцінювання та критерії згоди
Мета: оцінка параметрів і перевірка гіпотези про відповідність емпіричних даних передбачуваному теоретичному розподілу.
Теоретичні відомості.
5.1.1 Загальна постановка задачі.
У математичній статистиці часто виділяють особливий розділ, в якому розглядається перевірка гіпотез. Статистична перевірка гіпотез застосовується для того, щоб використовувати отриману за вибіркою інформацію для судження про закон розподілу генеральної сукупності. Зазвичай статистична гіпотеза перевіряється за допомогою критеріїв згоди, які дозволяють оцінити відповідність того чи іншого теоретичного закону розподілу деякого емпіричного ряду розподілу.
Критерії згоди повинні дати відповідь на питання, чи можна прийняти для даного емпіричного розподілу модель, відображену деяким теоретичним законам розподілу. У математичній статистиці близькість емпіричних і теоретичних розподілів оцінюють за допомогою критеріїв згоди, які розроблені багатьма вченими. Одні з них оцінюють вірогідність розбіжності між емпіричними і теоретичними даними (критерії згоди Пірсона та Колмогорова), інші конкретно відповідають на питання про можливість збігу даного емпіричного розподілу і вибраного теоретичного закону (критерії згоди Романовського і Ястремського).
5.1.2. Методи параметричної оцінки законів розподілу.
Для визначення чисельних значень параметрів передбачуваних розподілів застосовуються методи: лінійного оцінювання, імовірнісних сіток, квантилів, максимального правдоподібності і моментів.
Найбільш простим і поширеним є метод моментів, який полягає в тому, що початкові і центральні моменти теоретичного розподілу, що залежать від невідомих параметрів цього розподілу, прирівнюються до статистичних моментів. При цьому статистичні початкові і центральні моменти відповідно 1-го і 2-го порядків визначаються за формулами
; . (5.1)
Формули взаємозв'язку аналітичних моментів з невідомими параметрами теоретичних розподілів наведені в таблиці Б1. Додатку Б. У результаті вирішується система рівнянь, що зв'язує параметри з моментами, звідки визначаються оцінки відповідних параметрів.
5.1.3. Критерій хі-квадрат Пірсона.
Відомий англійський статистик К. Пірсон в 1900 році запропонував для оцінки розбіжності між емпіричними і теоретичними частотами критерій, який заснований на визначенні величини хі-квадрат (χ2).
Критерій – Пірсона є найбільш простим і поширеним і заснований на виразах
(5.2)
де – теоретичні значення ймовірності розподілу в інтервалі групування r;
– число ступенів свободи при кількості обчислених параметрів розподілу – .
По заданому значенню рівня значимості (0,2 ... 0,005) і підрахованому з таблиць критерію Пірсона (файл лаб_5.xls) визначається значення .
Для прийняття гіпотези про згоду емпіричних даних з теоретичним необхідно, щоб
(5.3)
1.4. Критерій Романовського.
Романовський В.І. запропонував використовувати критерій хі-квадрат в іншому вигляді. Значення критерію обчислюється за формулою:
, (5.4)
де - число ступенів свободи.
У тому випадку, якщо за абсолютним значенням менше 3, то розбіжність між емпіричним і теоретичним розподілами вважається несуттєвою і прийнятий закон розподілу можна прийняти в якості моделі емпіричного розподілу. Якщо ж вираз більше 3, то розбіжність між розподілами істотна.
Ставлення Романовського ґрунтується на тому, що математичне сподівання χ дорівнює числу, а дисперсія – подвоєному числу ступенів свободи (2 ). В цьому випадку імовірність відхилення величини хі-квадрат на близька до одиниці.
Дата: 2019-03-05, просмотров: 999.