Пусть эмпирическое распределение задано в виде последовательности интервалов одинаковой длины и соответствующих им частот.
1. Находим выборочную среднюю, дисперсию, среднеквадратическое отклонение. В качестве вариант принимают среднее арифметическое концов интервала.
2. Нормируют случайную величину
, то есть переходят к величине
и находят значения
.
3. Находят значение функции Лапласа
.
4.Вычисляют значение
и умножают на
.
5. Получаем теоретические частоты
.
6. Сравниваем эмпирические и теоретические частоты. Для этого:
а) находим наблюдаемое значение критерия Пирсона:
.
Эта величина случайная, так как в различных опытах она принимает различные заранее не известные значения. Чем меньше различаются эмпирические и теоретические частоты, тем меньше величина
, то есть он характеризует близость эмпирического и теоретического распределения.
б) по таблице критических точек распределения
, по заданному уровню значимости
и числу степеней свободы
, где
- число групп выборки;
- это число параметров предполагаемого распределения, которые оценены по данным выборки. найдем критическую точку
.
Если
- нет оснований отвергать нулевую гипотезу.
Если
- нулевую гипотезу отвергают.
Замечание. В частности, если предполагаемое распределение – нормальное
, то оценивают два параметра, математическое ожидание и среднее квадратическое отклонение, поэтому
и число степеней свободы
.
Пример: Дано следующее статистическое распределение выборки
| 156 | 160 | 164 | 168 | 172 | 176 | 180 |
| 10 | 14 | 26 | 28 | 12 | 8 | 2 |
Найти теоретические частоты данного распределения и проверить гипотезу о нормальном законе этого распределения при уровне значимости
с помощью критерия согласия
Пирсона.
Решение:
Подсчитаем выборочную среднюю и среднеквадратическое отклонение.

и
.
Составим расчетную таблицу для вычисления теоретических частот пользуюсь указанной схемой. Для этого найдем величину
.(h-длина интервала или шаг).
|
|
|
|
|
|
|
| 156 | 10 | -10 | -1,73 | 0,0893 | 6,18 | 6 |
| 160 | 14 | -6 | -1,04 | 0,2323 | 16,08 | 16 |
| 164 | 26 | -2 | -0,35 | 0,3752 | 25,96 | 26 |
| 168 | 28 | 2 | 0,35 | 0,3752 | 25,96 | 26 |
| 172 | 12 | 6 | 1,04 | 0,2323 | 16,08 | 16,1 |
| 176 | 8 | 10 | 1,73 | 0,0893 | 6,18 | 6,2 |
| 180 | 2 | 14 | 2 | 0,054 | 3,73 | 3,7 |
| 100 | 100 |
Посчитаем величину
.
Воспользуемся расчетной таблицей
|
|
|
|
|
| 10 | 6 | 4 | 16 | 2,67 |
| 14 | 16 | -2 | 4 | 0,25 |
| 26 | 26 | 0 | 0 | 0 |
| 28 | 26 | 2 | 4 | 0,15 |
| 12 | 16,1 | -4,1 | 16,81 | 1,04 |
| 8 | 6,2 | 1,8 | 3,24 | 0,52 |
| 2 | 3,7 | 1,7 | 2,89 | 0,78 |
| 5,41 |
Таким образом,
.
Найдем
. Так как
и
, то
.
Так как
, то нет оснований отвергать гипотезу о нормальном законе распределения данной величины, то есть она принимается при уровне значимости
и есть основания считать, что эмпирические и теоретические частоты различаются не значимо, различия случайны.
Пример решения типовой задачи
Комитетом по физической культуре и спорту были проведены исследования спортсменов, занимающихся стрельбой. Было отобрано 200 стрелков из 4000 для определения среднего количества патронов, необходимых одному спортсмену для одной тренировки. Результаты обследования приведены в таблице
| Число патронов (шт.) | Менее 200 | 200-300 | 300-400 | 400-500 | 500-600 | 600-700 | Более 700 |
| Число спортсменов (чел.) | 4 | 20 | 57 | 65 | 31 | 15 | 8 |
1. Перейти к вариационному ряду, и построить полигон частот.
2. Найти выборочную среднюю, выборочную дисперсию, исправленную выборочную дисперсию, исправленное выборочное среднеквадратическое отклонение случайной величины Х.
3. Построить доверительный интервал для генеральной средней и генерального среднеквадратического отклонения с заданным уровнем доверительной вероятности γ=0,95.
4. Используя критерий
Пирсона при уровне значимости a=0,05 проверить гипотезу о том, что случайная величина X– распределена по нормальному закону. Построить на одном графике гистограмму эмпирического распределения и соответствующую нормальную кривую.
Решение.
1. Перейдем от данного интервального ряда к вариационному. Для этого найдем середину каждого интервала (сложим концы каждого интервала и поделим пополам):
| Число патронов (шт.), х i | 150 | 250 | 350 | 450 | 550 | 650 | 750 |
| Число спортсменов (чел.), ni | 4 | 20 | 57 | 65 | 31 | 15 | 8 |
Построим полигон частот для полученного вариационного ряда.

2. Находим выборочную среднюю по формуле:
.
Объем выборки n=200.

Таким образом, среднее число патронов необходимых одному спортсмену для одной тренировки равно 438 шт.
Находим выборочную дисперсию:
= 16656

Посчитаем выборочную дисперсию вторым способом:
, где
и
.



Среднеквадратическое отклонение:
Исправленную выборочную дисперсию посчитаем по формуле:

Исправленное выборочное среднеквадратическое отклонение случайной величины Х :


3. Построить доверительный интервал для генеральной средней и генерального среднеквадратического отклонения с заданным уровнем доверительной вероятности γ=0,95. Тем самым, найдем границы, в которых с вероятностью 0,95 заключено среднее число патронов, необходимых для тренировки одного спортсмена.
Доверительный интервал для генеральной средней находим по формуле:
, где
- математическое ожидание;
- выборочная средняя;
- объем выборки;
- при большом объеме выборки;
t- значение аргумента функции Лапласа, при котором она равна
, то есть
, где
- заданная надежность. Аргумент t находится по таблицам значений функции Лапласа (приложение 2). По таблицам значений функции Лапласа находим: Ф(t)=0,95
.

; 
Доверительный интервал для оценки среднеквадратического отклонения
вычисляется по формуле
,
где
- это исправленное среднеквадратическое отклонение;
- это табличное значение, которое зависит от объема выборки
и заданной надежности
, то есть
(приложение 4).
Найдем значение q: 
Тогда доверительный интервал для оценки среднеквадратического отклонения
будет равен:


4. Используя критерий
Пирсона при уровне значимости a=0,05 проверим гипотезу о том, что случайная величина X– распределена по нормальному закону.
Примечание: В качестве дисперсии нормального закона распределения следует взять исправленную выборочную дисперсию. Но т.к. количество наблюдений – 200 достаточно велико, то подойдет и “обычная”
.
| xi | ni |
|
|
|
|
|
| 150 | 4 | -288 | -2,23 | 0,0332 | 5,144974 | 5,1 |
| 250 | 20 | -188 | -1,46 | 0,1374 | 21,29275 | 21,3 |
| 350 | 57 | -88 | -0,68 | 0,3166 | 49,06321 | 49,1 |
| 450 | 65 | 12 | 0,09 | 0,3973 | 61,56922 | 61,6 |
| 550 | 31 | 112 | 0,87 | 0,2732 | 42,33755 | 42,3 |
| 650 | 15 | 212 | 1,64 | 0,1040 | 16,11678 | 16,1 |
| 750 | 8 | 312 | 2,42 | 0,0213 | 3,300841 | 3,3 |
| 200 | 198,8 |
Составим расчетную таблицу для вычисления теоретических частот пользуюсь указанной схемой.
Для этого найдем величину
.(h-длина интервала или шаг).
Из первого пункта данной задачи известно, что
.
Составим таблицу для подсчета 
|
|
|
|
| 4 | 5,1 | 1,21 | 0,237255 |
| 20 | 21,3 | 1,69 | 0,079343 |
| 57 | 49,1 | 62,41 | 1,271079 |
| 65 | 61,6 | 11,56 | 0,187662 |
| 31 | 42,3 | 127,69 | 3,018676 |
| 15 | 16,1 | 1,21 | 0,075155 |
| 8 | 3,3 | 22,09 | 6,693939 |
| 200 | 198,8 | 11,56311 |
Итого, значение статистики
.
Определим количество степеней свободы по формуле:
.
m–число интервалов (m=7), r – число параметров закона распределения (в нормальном распределении r = 2)
Т.е. k = 7-2-1=4.
Соответствующее критическое значение статистики 
Поскольку
, гипотеза о нормальном распределении с параметрами N(438; 129,058) не согласуется с опытными данными.
Ниже показана кривая эмпирического (сплошная линия) и теоретического (пунктирная линия) распределений

Вывод. Сопоставив обе кривых видим, что наилучшее соответствие эмпирических данных нормальному распределению наблюдается на первом, втором, и шестом интервалах, что подтверждается таблицей. А вот на участке от 500 до 600 патронов отклонение очень большое – это видно из графика. Оно и оказало “фатальное” влияние на критерий согласия – это видно из таблицы.
Дата: 2019-05-28, просмотров: 434.