Пусть и — две генеральные совокупности, распределенные по нормальному закону с неизвестными дисперсиями и . Из генеральных совокупностей взяты две независимые выборки и и вычислены исправленные выборочные дисперсии и .
Требуется проверить нулевую гипотезу . В данном случае используется статистика
, (9.5.1)
которая имеет F‑распределение (распределение Фишера) с и степенями свободы, если , и
, (9.5.2)
с числом степеней свободы и , если .
Если задаться уровнем значимости , то можно построить критические области для проверки нулевой гипотезы при двух альтернативных гипотезах:
a) , если , или , если . В этом случае критическая область правостороння . Граница критической области определяется из условия ;
b) . В этом случае критическая область двусторонняя. Однако можно использовать только правостороннюю область , где граница определяется из условия , если , и из условия , если .
Пример 4. При измерении производительности двух агрегатов получены следующие результаты в кг вещества за час работы:
№ замера | 1 | 2 | 3 | 4 | 5 |
Агрегат A | 14,1 | 10,1 | 14,7 | 13,7 | 14,0 |
Агрегат B | 14 | 14,5 | 13,7 | 12,7 | 14,1 |
При уровне значимости проверить гипотезу о равенстве дисперсий.
m Решение. Проверим нулевую гипотезу при альтернативной гипотезе . Вычислим «исправленные» выборочные дисперсии и . Для этого сначала найдем выборочные средние и :
; .
Тогда
;
.
Учитывая, что , определяет :
.
Критическое значение находим из условия
По таблице F‑распределения (распределения Фишера) с и степенями свободы определяем .
Так как число попадает в критическую область , то гипотезу о равенстве дисперсий отвергаем. l
Замечание. Границу критической области было можно определить и не используя таблицы, например:
§ используя функцию FРАСПОБР(вероятность; степени_свободы1; степени_свободы2) из EXCEL. При этом задаваемый уровень значимости используется как аргумент «вероятность». В рассматриваемом примере получаем ;
§ используя функцию qF( P, d1, d2) из MATHCAD, где P — доверительная вероятность , d1 и d2 степени свободы. В рассматриваемом примере получаем .
§6. Проверка гипотезы о распределении.
Критерий Пирсона
Пусть — выборка, произведенная из генеральной совокупности , с неизвестной функцией распределения . Проверяется нулевая гипотеза , утверждающая, что генеральная совокупность распределена по закону, имеющему функцию распределения , равную функции , т.е. проверяется нулевая гипотеза . При этом альтернативной гипотезой является .
Наибольшее применение при проверке согласования закона распределения, т.е. проверке нулевой гипотезы , является критерий Пирсона или критерий (хи-квадрат).
Наблюдаемое значение критерия (статистика) вычисляется по следующей формуле:
. (9.6.1)
Согласно теореме К. Пирсона, при статистика (9.6.1) имеет ‑распределение с степенями свободы, где — число групп (интервалов) выборки, — число параметров предполагаемого распределения.
Схема проверки нулевой гипотезы .
1. По выборке строят статистический ряд; он может быть как дискретным, так и интервальным. Рассмотрим для определенности интервальный ряд:
… | |||||
… |
2. По данным предыдущих исследований или по предварительным данным делают предположение (выдвигают гипотезу) о модели закона распределения генеральной совокупности .
Для предположения модели закона распределения генеральной совокупности можно использовать графическое представление выборки.
3. Используя выборочные данные, строят оценки параметров выбранной модели закона распределения.
4. Определяют теоретические вероятности попадания случайной величины в интервалы по формуле
, (9.6.1)
где — предполагаемая функция распределения генеральной совокупности .
4. Определяют расчетное значение критерия К. Пирсона по формуле
или
.
5. Выбрав уровень значимости , находят критическую область (она всегда правосторонняя) . Границу критической области можно найти одним из следующих:
§ используя таблицы –распределения с степенями свободы;
§ используя функцию ХИ2ОБР (вероятность;степени_свободы) из EXCEL, при этом аргумент «вероятность» данной функции должен быть равен уровню значимости, а аргумент «степени_свободы» должен быть равен ;
§ используя функцию qchisq( p, d) из MATHCAD, при этом переменные данной функции должны быть равны: .
6. Если расчетное значение попадает в критическую область , то нулевая гипотеза отвергается и принимается альтернативная гипотеза.
Замечание. При применении критерия К. Пирсона в каждом интервале должно быть не менее 5 элементов выборки (т.е. ). Если это условие не выполняется, то число интервалов надо уменьшить путем объединения соседних интервалов.
Пример 5. Получены значения случайной величины .
0,54 | 0,7 | 0,66 | 0,55 | 0,57 | 0,56 | 0,62 | 0,65 | 0,5 | 0,67 |
0,66 | 0,58 | 0,57 | 0,53 | 0,53 | 0,53 | 0,46 | 0,72 | 0,41 | 0,55 |
0,6 | 0,61 | 0,45 | 0,55 | 0,63 | 0,6 | 0,53 | 0,51 | 0,59 | 0,57 |
0,59 | 0,64 | 0,66 | 0,56 | 0,59 | 0,58 | 0,55 | 0,55 | 0,53 | 0,53 |
0,41 | 0,54 | 0,45 | 0,61 | 0,46 | 0,52 | 0,59 | 0,63 | 0,4 | 0,69 |
0,53 | 0,48 | 0,41 | 0,57 | 0,6 | 0,57 | 0,56 | 0,56 | 0,42 | 0,6 |
0,54 | 0,59 | 0,56 | 0,5 | 0,46 | 0,62 | 0,57 | 0,42 | 0,72 | 0,47 |
0,47 | 0,44 | 0,52 | 0,62 | 0,64 | 0,41 | 0,51 | 0,4 | 0,49 | 0,67 |
0,52 | 0,58 | 0,65 | 0,42 | 0,68 | 0,53 | 0,65 | 0,59 | 0,43 | 0,61 |
0,56 | 0,62 | 0,7 | 0,49 | 0,7 | 0,55 | 0,5 | 0,52 | 0,71 | 0,48 |
Необходимо:
1. Найти выборочные характеристики: выборочное среднее и исправленную выборочную дисперсию.
2. Построить доверительной вероятностью 0,95 доверительные интервалы для математического ожидания и дисперсии.
3. Построить гистограмму.
4. Проверить гипотезу о нормальном распределении случайной величины при уровне значимости .
m Решение. Учитывая, что количество значений равно 100, определяем выборочное среднее и исправленную выборочную дисперсию:
.
.
Замечание. Выборочное среднее можно определить используя функцию СРЗНАЧ(число1; число2; ...) из EXCEL, а исправленную выборочную дисперсию можно определить используя функцию ДИСП(число1;число2; ...) из EXCEL.
Перейдем к построению доверительных интервалов. При построении доверительного интервала для математического ожидания считаем, что при этом дисперсия не известна. Как известно из предыдущей главы, необходимо использовать формулу
,
в которой неизвестна только величина , являющаяся квантилем –распределения с числом степеней свободы. Для доверительной вероятност и найдем квантиль ‑распределения с числом степеней свободы. Для этого используем, например, функцию qt( p, d) из MATHCAD: или функцию СТЬЮДРАСПОБ(вероятность; степени_свободы) из EXCEL: или Приложение 5.
Определяем точность оценки
.
Таким образом, получаем доверительный интервал
.
Построим доверительный интервал для дисперсии при неизвестном математическом ожидании. В этом случае необходимо использовать формулу
,
где — квантиль уровня –распределения с степенью свободы.
Для данной формулы необходимо вычислить квантили и . Используя функцию qchisq( p, d) из MATHCAD, получим: и . Аналогичный результат можно получить используя функцию ХИ2ОБР (вероятность;степени_свободы) из EXCEL: , .
Таким образом, получаем доверительный интервал
.
Перейдем к построению гистограммы. Построим интервальный ряд. Найдем сначала минимальное и максимальное значения случайной величины (т.е. крайние члены вариационного ряда): и . Для нахождения минимального и максимального значений случайной величины можно использовать функции МИН(число1;число2; ...) и МАКС(число1;число2; ...) из EXCEL. Размах варьирования будет равен .
Возьмем число частичных интервалов . В этом случае длина частичного интервала равна
.
Соответствующий интервальный ряд приведен в таблице 9.2.
Таблица 9.2
Номер интервала | Средний пробег автомобилей (интервалы) | Частота | Относительная частота |
1 | 0,4 — 0,44 | 10 | 2,5 |
2 | 0,44 — 0,48 | 8 | 2 |
3 | 0,48 — 0,52 | 9 | 2,25 |
4 | 0,52 — 0,56 | 21 | 5,25 |
5 | 0,56 — 0,6 | 21 | 5,25 |
6 | 0,6 — 0,64 | 13 | 3,25 |
7 | 0,64 — 0,68 | 10 | 2,5 |
8 | 0,68 — 0,72 | 8 | 2 |
Гистограмма приведена на рис 9.4.
Проверим гипотезу о распределении случайной величины . Найдем теоретические вероятности попадания случайной величины в интервалы по формуле , где — функция распределения нормального закона. Так как случайная величина , подчиненная нормальному закону распределения, определена на , то крайние интервалы в ряде распределения следует заменить на и . Тогда
Дальнейшие вычисления удобно оформить в виде таблицы (табл. 9.3).
Таблица 9.3
Номер интервала i | средний пробег автомобилей (интервалы) | Частота | Теоретические частоты | |||
1 | 0,4 — 0,44 | 10 | 0,0749 | 7,49 | 13,3511 | |
2 | 0,44 — 0,48 | 8 | 0,0962 | 9,62 | 6,6528 | |
3 | 0,48 — 0,52 | 9 | 0,1517 | 15,17 | 5,3395 | |
4 | 0,52 — 0,56 | 21 | 0,1932 | 19,32 | 22,8261 | |
5 | 0,56 — 0,6 | 21 | 0,1859 | 18,59 | 23,7224 | |
6 | 0,6 — 0,64 | 13 | 0,1466 | 14,66 | 11,5280 | |
7 | 0,64 — 0,68 | 10 | 0,0872 | 8,72 | 11,4679 | |
8 | 0,68 — 0,72 | 8 | 0,0643 | 6,43 | 9,9533 | |
Итого |
| 100 | 1 | 100 | 104,8411 |
Определяем расчетное значение критерия К. Пирсона:
Находим число степеней свободы. По выборке были рассчитаны два параметра, значит, . Количество интервалов 8,т.е. . Следовательно, . Зная, что и , находим границу правосторонней критической области (см. Приложение 4). Таким образом, критической областью является интервал .
Так как расчетное значение критерия К. Пирсона не попадает в критическую область, то нет оснований отвергнуть проверяемую гипотезу о нормальном законе распределения. l
Приложения
Приложение 1
Таблица значений функции
m | Значения | ||||||
0,1 | 0,2 | 0,3 | 0,4 | 0,5 | 0,6 | 0,7 | |
0 | 0,904837 | 0,818731 | 0,740818 | 0,670320 | 0,606531 | 0,548812 | 0,496585 |
1 | 0,090484 | 0,163746 | 0,222245 | 0,268128 | 0,303265 | 0,329287 | 0,347610 |
2 | 0,004524 | 0,016375 | 0,033337 | 0,053626 | 0,075816 | 0,098786 | 0,121663 |
3 | 0,000151 | 0,001092 | 0,003334 | 0,007150 | 0,012636 | 0,019757 | 0,028388 |
4 | 0,000004 | 0,000055 | 0,000250 | 0,000715 | 0,001580 | 0,002964 | 0,004968 |
5 |
| 0,000002 | 0,000015 | 0,000057 | 0,000158 | 0,000356 | 0,000696 |
6 |
|
| 0,000001 | 0,000004 | 0,000013 | 0,000036 | 0,000081 |
7 |
|
|
|
| 0,000001 | 0,000003 | 0,000008 |
8 |
|
|
|
|
|
| 0,000001 |
m | Значения | ||||||
0,8 | 0,9 | 1 | 2 | 3 | 4 | 5 | |
0 | 0,449329 | 0,406570 | 0,367879 | 0,135335 | 0,049787 | 0,018316 | 0,006738 |
1 | 0,359463 | 0,365913 | 0,367879 | 0,270671 | 0,149361 | 0,073263 | 0,033690 |
2 | 0,143785 | 0,164661 | 0,183940 | 0,270671 | 0,224042 | 0,146525 | 0,084224 |
3 | 0,038343 | 0,049398 | 0,061313 | 0,180447 | 0,224042 | 0,195367 | 0,140374 |
4 | 0,007669 | 0,011115 | 0,015328 | 0,090224 | 0,168031 | 0,195367 | 0,175467 |
5 | 0,001227 | 0,002001 | 0,003066 | 0,036089 | 0,100819 | 0,156293 | 0,175467 |
6 | 0,000164 | 0,000300 | 0,000511 | 0,012030 | 0,050409 | 0,104196 | 0,146223 |
7 | 0,000019 | 0,000039 | 0,000073 | 0,003437 | 0,021604 | 0,059540 | 0,104445 |
8 | 0,000002 | 0,000004 | 0,000009 | 0,000859 | 0,008102 | 0,029770 | 0,065278 |
9 |
|
| 0,000001 | 0,000191 | 0,002701 | 0,013231 | 0,036266 |
10 |
|
|
| 0,000038 | 0,000810 | 0,005292 | 0,018133 |
11 |
|
|
| 0,000007 | 0,000221 | 0,001925 | 0,008242 |
12 |
|
|
| 0,000001 | 0,000055 | 0,000642 | 0,003434 |
13 |
|
|
|
| 0,000013 | 0,000197 | 0,001321 |
14 |
|
|
|
| 0,000003 | 0,000056 | 0,000472 |
15 |
|
|
|
| 0,000001 | 0,000015 | 0,000157 |
16 |
|
|
|
|
| 0,000004 | 0,000049 |
17 |
|
|
|
|
| 0,000001 | 0,000014 |
18 |
|
|
|
|
|
| 0,000004 |
19 |
|
|
|
|
|
| 0,000001 |
Приложение 2
Дата: 2019-02-25, просмотров: 278.