Методика вычисления теоретических частот нормального распределения
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Пусть эмпирическое распределение задано в виде последовательности интервалов одинаковой длины и соответствующих им частот.

1. Находим выборочную среднюю, дисперсию, среднеквадратическое отклонение. В качестве вариант принимают среднее арифметическое концов интервала.

2. Нормируют случайную величину , то есть переходят к величине  и находят значения .

3. Находят значение функции Лапласа .

4.Вычисляют значение  и умножают на .

5. Получаем теоретические частоты .

6. Сравниваем эмпирические и теоретические частоты. Для этого:

а) находим наблюдаемое значение критерия Пирсона:

.

Эта величина случайная, так как в различных опытах она принимает различные заранее не известные значения. Чем меньше различаются эмпирические и теоретические частоты, тем меньше величина , то есть он характеризует близость эмпирического и теоретического распределения.

б) по таблице критических точек распределения , по заданному уровню значимости  и числу степеней свободы , где - число групп выборки; - это число параметров предполагаемого распределения, которые оценены по данным выборки. найдем критическую точку .

Если  - нет оснований отвергать нулевую гипотезу.

Если  - нулевую гипотезу отвергают.

Замечание. В частности, если предполагаемое распределение – нормальное , то оценивают два параметра, математическое ожидание и среднее квадратическое отклонение, поэтому  и число степеней свободы .

Пример: Дано следующее статистическое распределение выборки

156 160 164 168 172 176 180
10 14 26 28 12 8 2

Найти теоретические частоты данного распределения и проверить гипотезу о нормальном законе этого распределения при уровне значимости  с помощью критерия согласия  Пирсона.

Решение:

Подсчитаем выборочную среднюю и среднеквадратическое отклонение.

и .

Составим расчетную таблицу для вычисления теоретических частот пользуюсь указанной схемой. Для этого найдем величину .(h-длина интервала или шаг).

156 10 -10 -1,73 0,0893 6,18 6
160 14 -6 -1,04 0,2323 16,08 16
164 26 -2 -0,35 0,3752 25,96 26
168 28 2 0,35 0,3752 25,96 26
172 12 6 1,04 0,2323 16,08 16,1
176 8 10 1,73 0,0893 6,18 6,2
180 2 14 2 0,054 3,73 3,7
100         100

Посчитаем величину

.

Воспользуемся расчетной таблицей

 

10 6 4 16 2,67
14 16 -2 4 0,25
26 26 0 0 0
28 26 2 4 0,15
12 16,1 -4,1 16,81 1,04
8 6,2 1,8 3,24 0,52
2 3,7 1,7 2,89 0,78
      5,41

Таким образом, .

Найдем . Так как  и , то .

Так как , то нет оснований отвергать гипотезу о нормальном законе распределения данной величины, то есть она принимается при уровне значимости  и есть основания считать, что эмпирические и теоретические частоты различаются не значимо, различия случайны.

 

Пример решения типовой задачи

Комитетом по физической культуре и спорту были проведены исследования спортсменов, занимающихся стрельбой. Было отобрано 200 стрелков из 4000 для определения среднего количества патронов, необходимых одному спортсмену для одной тренировки. Результаты обследования приведены в таблице

Число патронов (шт.) Менее 200 200-300 300-400 400-500 500-600 600-700 Более 700
Число спортсменов (чел.) 4 20 57 65 31 15 8

1. Перейти к вариационному ряду, и построить полигон частот.

2. Найти выборочную среднюю, выборочную дисперсию, исправленную выборочную дисперсию, исправленное выборочное среднеквадратическое отклонение случайной величины Х.

3. Построить доверительный интервал для генеральной средней и генерального среднеквадратического отклонения с заданным уровнем доверительной вероятности γ=0,95.

4. Используя критерий  Пирсона при уровне значимости a=0,05 проверить гипотезу о том, что случайная величина X– распределена по нормальному закону. Построить на одном графике гистограмму эмпирического распределения и соответствующую нормальную кривую.

Решение.

1. Перейдем от данного интервального ряда к вариационному. Для этого найдем середину каждого интервала (сложим концы каждого интервала и поделим пополам):

Число патронов (шт.), х i 150 250 350 450 550 650 750
Число спортсменов (чел.), ni 4 20 57 65 31 15 8

 

Построим полигон частот для полученного вариационного ряда.

2. Находим выборочную среднюю по формуле:

.

Объем выборки n=200.

Таким образом, среднее число патронов необходимых одному спортсмену для одной тренировки равно 438 шт.

Находим выборочную дисперсию:

= 16656

Посчитаем выборочную дисперсию вторым способом:

, где  и .

Среднеквадратическое отклонение:

Исправленную выборочную дисперсию посчитаем по формуле:

Исправленное выборочное среднеквадратическое отклонение случайной величины Х :

3. Построить доверительный интервал для генеральной средней и генерального среднеквадратического отклонения с заданным уровнем доверительной вероятности γ=0,95. Тем самым, найдем границы, в которых с вероятностью 0,95 заключено среднее число патронов, необходимых для тренировки одного спортсмена.

Доверительный интервал для генеральной средней находим по формуле:

, где - математическое ожидание;

- выборочная средняя;

- объем выборки;

 - при большом объеме выборки;

t- значение аргумента функции Лапласа, при котором она равна , то есть , где - заданная надежность. Аргумент t находится по таблицам значений функции Лапласа (приложение 2).  По таблицам значений функции Лапласа находим: Ф(t)=0,95 .

;

Доверительный интервал для оценки среднеквадратического отклонения  вычисляется по формуле

,

где  - это исправленное среднеквадратическое отклонение;

 - это табличное значение, которое зависит от объема выборки  и заданной надежности , то есть  (приложение 4).

Найдем значение q:

Тогда доверительный интервал для оценки среднеквадратического отклонения  будет равен:

4. Используя критерий  Пирсона при уровне значимости a=0,05 проверим гипотезу о том, что случайная величина X– распределена по нормальному закону.

Примечание: В качестве дисперсии нормального закона распределения следует взять исправленную выборочную дисперсию. Но т.к. количество наблюдений – 200 достаточно велико, то подойдет и “обычная” .

xi ni
150 4 -288 -2,23 0,0332 5,144974 5,1
250 20 -188 -1,46 0,1374 21,29275 21,3
350 57 -88 -0,68 0,3166 49,06321 49,1
450 65 12 0,09 0,3973 61,56922 61,6
550 31 112 0,87 0,2732 42,33755 42,3
650 15 212 1,64 0,1040 16,11678 16,1
750 8 312 2,42 0,0213 3,300841 3,3
  200         198,8

Составим расчетную таблицу для вычисления теоретических частот пользуюсь указанной схемой.

Для этого найдем величину

.(h-длина интервала или шаг).

Из первого пункта данной задачи известно, что .

Составим таблицу для подсчета

 

4 5,1 1,21 0,237255
20 21,3 1,69 0,079343
57 49,1 62,41 1,271079
65 61,6 11,56 0,187662
31 42,3 127,69 3,018676
15 16,1 1,21 0,075155
8 3,3 22,09 6,693939
200 198,8   11,56311

 

Итого, значение статистики .

Определим количество степеней свободы по формуле: .

m–число интервалов (m=7), r – число параметров закона распределения (в нормальном распределении r = 2)

Т.е. k = 7-2-1=4.

Соответствующее критическое значение статистики

Поскольку , гипотеза о нормальном распределении с параметрами N(438; 129,058) не согласуется с опытными данными.

Ниже показана кривая эмпирического (сплошная линия) и теоретического (пунктирная линия) распределений

Вывод. Сопоставив обе кривых видим, что наилучшее соответствие эмпирических данных нормальному распределению наблюдается на первом, втором, и шестом интервалах, что подтверждается таблицей. А вот на участке от 500 до 600 патронов отклонение очень большое – это видно из графика. Оно и оказало “фатальное” влияние на критерий согласия – это видно из таблицы.

Дата: 2019-05-28, просмотров: 349.