Проверка гипотезы о равенстве дисперсий двух генеральных совокупностей
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Пусть  и  — две генеральные совокупности, распределенные по нормальному закону с неизвестными дисперсиями  и . Из генеральных совокупностей взяты две независимые выборки  и  и вычислены исправленные выборочные дисперсии  и .

Требуется проверить нулевую гипотезу . В данном случае используется статистика

, (9.5.1)

которая имеет F‑распределение (распределение Фишера) с  и  степенями свободы, если , и

, (9.5.2)

с числом степеней свободы  и , если .

Если задаться уровнем значимости , то можно построить критические области для проверки нулевой гипотезы при двух альтернативных гипотезах:

a) , если , или , если . В этом случае критическая область правостороння . Граница  критической области определяется из условия ;

b) . В этом случае критическая область двусторонняя. Однако можно использовать только правостороннюю область , где граница  определяется из условия , если , и из условия , если .

 

Пример 4. При измерении производительности двух агрегатов получены следующие результаты в кг вещества за час работы:

 

№ замера 1 2 3 4 5
Агрегат A 14,1 10,1 14,7 13,7 14,0
Агрегат B 14 14,5 13,7 12,7 14,1

 

При уровне значимости  проверить гипотезу о равенстве дисперсий.

m Решение. Проверим нулевую гипотезу  при альтернативной гипотезе . Вычислим «исправленные» выборочные дисперсии  и . Для этого сначала найдем выборочные средние  и :

; .

Тогда

;

.

Учитывая, что , определяет :

.

Критическое значение  находим из условия

По таблице F‑распределения (распределения Фишера) с  и  степенями свободы определяем .

Так как число  попадает в критическую область , то гипотезу о равенстве дисперсий отвергаем. l

 

Замечание. Границу критической области было можно определить и не используя таблицы, например:

§ используя функцию FРАСПОБР(вероятность; степени_свободы1; степени_свободы2) из EXCEL. При этом задаваемый уровень значимости используется как аргумент «вероятность». В рассматриваемом примере получаем ;

§ используя функцию qF( P, d1, d2) из MATHCAD, где P — доверительная вероятность , d1 и d2 степени свободы. В рассматриваемом примере получаем .

 

§6. Проверка гипотезы о распределении.
Критерий Пирсона

 

Пусть  — выборка, произведенная из генеральной совокупности , с неизвестной функцией распределения . Проверяется нулевая гипотеза , утверждающая, что генеральная совокупность распределена по закону, имеющему функцию распределения , равную функции , т.е. проверяется нулевая гипотеза . При этом альтернативной гипотезой является .

Наибольшее применение при проверке согласования закона распределения, т.е. проверке нулевой гипотезы , является критерий Пирсона или критерий  (хи-квадрат).

Наблюдаемое значение критерия (статистика) вычисляется по следующей формуле:

. (9.6.1)

Согласно теореме К. Пирсона, при  статистика (9.6.1) имеет ‑распределение с  степенями свободы, где  — число групп (интервалов) выборки,  — число параметров предполагаемого распределения.

 

Схема проверки нулевой гипотезы .

1. По выборке  строят статистический ряд; он может быть как дискретным, так и интервальным. Рассмотрим для определенности интервальный ряд:

2. По данным предыдущих исследований или по предварительным данным делают предположение (выдвигают гипотезу) о модели закона распределения генеральной совокупности .

Для предположения модели закона распределения генеральной совокупности  можно использовать графическое представление выборки.

3. Используя выборочные данные, строят оценки параметров выбранной модели закона распределения.

4. Определяют теоретические вероятности попадания случайной величины в интервалы  по формуле

, (9.6.1)

где  — предполагаемая функция распределения генеральной совокупности .

4. Определяют расчетное значение критерия К. Пирсона по формуле

или

.

5. Выбрав уровень значимости , находят критическую область (она всегда правосторонняя) . Границу критической области можно найти одним из следующих:

§ используя таблицы –распределения с  степенями свободы;

§ используя функцию ХИ2ОБР (вероятность;степени_свободы) из EXCEL, при этом аргумент «вероятность» данной функции должен быть равен уровню значимости, а аргумент «степени_свободы» должен быть равен ;

§ используя функцию qchisq( p, d) из MATHCAD, при этом переменные данной функции должны быть равны: .

6. Если расчетное значение  попадает в критическую область , то нулевая гипотеза  отвергается и принимается альтернативная гипотеза.

 

Замечание. При применении критерия К. Пирсона в каждом интервале должно быть не менее 5 элементов выборки (т.е. ). Если это условие не выполняется, то число интервалов надо уменьшить путем объединения соседних интервалов.

 

Пример 5. Получены значения случайной величины .

 

0,54

0,7

0,66

0,55

0,57

0,56

0,62

0,65

0,5

0,67

0,66

0,58

0,57

0,53

0,53

0,53

0,46

0,72

0,41

0,55

0,6

0,61

0,45

0,55

0,63

0,6

0,53

0,51

0,59

0,57

0,59

0,64

0,66

0,56

0,59

0,58

0,55

0,55

0,53

0,53

0,41

0,54

0,45

0,61

0,46

0,52

0,59

0,63

0,4

0,69

0,53

0,48

0,41

0,57

0,6

0,57

0,56

0,56

0,42

0,6

0,54

0,59

0,56

0,5

0,46

0,62

0,57

0,42

0,72

0,47

0,47

0,44

0,52

0,62

0,64

0,41

0,51

0,4

0,49

0,67

0,52

0,58

0,65

0,42

0,68

0,53

0,65

0,59

0,43

0,61

0,56

0,62

0,7

0,49

0,7

0,55

0,5

0,52

0,71

0,48

 

Необходимо:

1. Найти выборочные характеристики: выборочное среднее и исправленную выборочную дисперсию.

2. Построить доверительной вероятностью 0,95 доверительные интервалы для математического ожидания и дисперсии.

3. Построить гистограмму.

4. Проверить гипотезу о нормальном распределении случайной величины  при уровне значимости .

m Решение. Учитывая, что количество значений равно 100, определяем выборочное среднее и исправленную выборочную дисперсию:

.

.

Замечание. Выборочное среднее можно определить используя функцию СРЗНАЧ(число1; число2; ...) из EXCEL, а исправленную выборочную дисперсию можно определить используя функцию ДИСП(число1;число2; ...) из EXCEL.

Перейдем к построению доверительных интервалов. При построении доверительного интервала для математического ожидания считаем, что при этом дисперсия не известна. Как известно из предыдущей главы, необходимо использовать формулу

,

в которой  неизвестна только  величина , являющаяся  квантилем –распределения с  числом  степеней свободы.  Для доверительной вероятност и  найдем  квантиль ‑распределения с   числом степеней свободы.  Для этого используем,  например, функцию  qt( p, d) из MATHCAD:  или функцию СТЬЮДРАСПОБ(вероятность; степени_свободы) из EXCEL:  или Приложение 5.

Определяем точность оценки

.

Таким образом, получаем доверительный интервал

.

Построим доверительный интервал для дисперсии при неизвестном математическом ожидании. В этом случае необходимо использовать формулу

,

где  — квантиль уровня –распределения с  степенью свободы.

 

Для данной формулы необходимо вычислить квантили  и . Используя функцию qchisq( p, d) из MATHCAD, получим:  и . Аналогичный результат можно получить используя функцию ХИ2ОБР (вероятность;степени_свободы) из EXCEL: , .

Таким образом, получаем доверительный интервал

.

 

Перейдем к построению гистограммы. Построим интервальный ряд. Найдем сначала минимальное и максимальное значения случайной величины (т.е. крайние члены вариационного ряда):  и . Для нахождения минимального и максимального значений случайной величины можно использовать функции МИН(число1;число2; ...) и МАКС(число1;число2; ...) из EXCEL. Размах варьирования будет равен .

Возьмем число частичных интервалов . В этом случае длина частичного интервала равна

.

 

Соответствующий интервальный ряд приведен в таблице 9.2.

Таблица 9.2

Номер интервала Средний пробег автомобилей (интервалы) Частота   Относительная частота
1 0,4 — 0,44 10 2,5
2 0,44 — 0,48 8 2
3 0,48 — 0,52 9 2,25
4 0,52 — 0,56 21 5,25
5 0,56 — 0,6 21 5,25
6 0,6 — 0,64 13 3,25
7 0,64 — 0,68 10 2,5
8 0,68 — 0,72 8 2

 

Гистограмма приведена на рис 9.4.

 

 

Проверим гипотезу о распределении случайной величины . Найдем теоретические вероятности попадания случайной величины в интервалы  по формуле , где  — функция распределения нормального закона. Так как случайная величина , подчиненная нормальному закону распределения, определена на , то крайние интервалы в ряде распределения следует заменить на  и . Тогда


 

Дальнейшие вычисления удобно оформить в виде таблицы (табл. 9.3).

Таблица 9.3

Номер интервала i

средний пробег автомобилей

(интервалы)

Частота

Теоретические частоты

1 0,4 — 0,44 10 0,0749

7,49

13,3511

2 0,44 — 0,48 8 0,0962

9,62

6,6528

3 0,48 — 0,52 9 0,1517

15,17

5,3395

4 0,52 — 0,56 21 0,1932

19,32

22,8261

5 0,56 — 0,6 21 0,1859

18,59

23,7224

6 0,6 — 0,64 13 0,1466

14,66

11,5280

7 0,64 — 0,68 10 0,0872

8,72

11,4679

8 0,68 — 0,72 8 0,0643

6,43

9,9533

Итого

 

100

1

100

104,8411

 

Определяем расчетное значение критерия К. Пирсона:

Находим число степеней свободы. По выборке были рассчитаны два параметра, значит, . Количество интервалов 8,т.е. . Следовательно, . Зная, что  и , находим границу правосторонней критической области  (см. Приложение 4). Таким образом, критической областью является интервал .

Так как расчетное значение критерия К. Пирсона  не попадает в критическую область, то нет оснований отвергнуть проверяемую гипотезу о нормальном законе распределения. l

 





Приложения

 

Приложение 1

Таблица значений функции

 

m

Значения

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0

0,904837

0,818731

0,740818

0,670320

0,606531

0,548812

0,496585

1

0,090484

0,163746

0,222245

0,268128

0,303265

0,329287

0,347610

2

0,004524

0,016375

0,033337

0,053626

0,075816

0,098786

0,121663

3

0,000151

0,001092

0,003334

0,007150

0,012636

0,019757

0,028388

4

0,000004

0,000055

0,000250

0,000715

0,001580

0,002964

0,004968

5

 

0,000002

0,000015

0,000057

0,000158

0,000356

0,000696

6

 

 

0,000001

0,000004

0,000013

0,000036

0,000081

7

 

 

 

 

0,000001

0,000003

0,000008

8

 

 

 

 

 

 

0,000001

m

Значения

0,8

0,9

1

2

3

4

5

0

0,449329

0,406570

0,367879

0,135335

0,049787

0,018316

0,006738

1

0,359463

0,365913

0,367879

0,270671

0,149361

0,073263

0,033690

2

0,143785

0,164661

0,183940

0,270671

0,224042

0,146525

0,084224

3

0,038343

0,049398

0,061313

0,180447

0,224042

0,195367

0,140374

4

0,007669

0,011115

0,015328

0,090224

0,168031

0,195367

0,175467

5

0,001227

0,002001

0,003066

0,036089

0,100819

0,156293

0,175467

6

0,000164

0,000300

0,000511

0,012030

0,050409

0,104196

0,146223

7

0,000019

0,000039

0,000073

0,003437

0,021604

0,059540

0,104445

8

0,000002

0,000004

0,000009

0,000859

0,008102

0,029770

0,065278

9

 

 

0,000001

0,000191

0,002701

0,013231

0,036266

10

 

 

 

0,000038

0,000810

0,005292

0,018133

11

 

 

 

0,000007

0,000221

0,001925

0,008242

12

 

 

 

0,000001

0,000055

0,000642

0,003434

13

 

 

 

 

0,000013

0,000197

0,001321

14

 

 

 

 

0,000003

0,000056

0,000472

15

 

 

 

 

0,000001

0,000015

0,000157

16

 

 

 

 

 

0,000004

0,000049

17

 

 

 

 

 

0,000001

0,000014

18

 

 

 

 

 

 

0,000004

19

 

 

 

 

 

 

0,000001



Приложение 2

Дата: 2019-02-25, просмотров: 269.