Выборочное среднее
– среднее арифметическое всех значений выборки, находится по формуле
.
Выборочная дисперсия
вычисляется по формуле
.
Выборочное СКО вычисляется по формуле
.
Исправленная выборочная дисперсия вычисляется по формуле
.
Исправленное выборочное СКО вычисляется по формуле
.
Для группированной выборки формулы примут вид:
,
,
,
где
– средняя точка интервала группированного ряда.
Доверительным интервалом называют интервал
, который покрывает неизвестный параметр а с заданной вероятностью g; здесь
– оценка параметра а, концы
и
– доверительные границы (они оценивают возможную погрешность), число g – доверительная вероятность или надежность. Число
характеризует точность оценки.
Доверительный интервал для математического ожидания при большом объеме выборки и неизвестном среднем квадратическом отклонении выражается формулой
,
где
– функция, обратная функции Лапласа
(приложение 1), т.е. такое значение аргумента в таблице функции Лапласа, для которого функция Лапласа равна g.
Замечание. Если использовать таблицу значений функции Лапласа
, то точность оценки находится по формуле
.
Проверка статистической гипотезы о нормальном законе распределения генеральной совокупности с помощью критерия Пирсона
Постановка задачи. Относительно некоторой генеральной совокупности Х высказывается гипотеза Н (о возможных значениях числовых характеристик, о виде закона распределения…) которую называют статистической гипотезой. Из этой генеральной совокупности извлекается выборка
. Требуется указать правило, при помощи которого можно было бы по каждой данной выборке решить вопрос о том, следует ли отклонить гипотезу Н или принять ее.
Нулевой гипотезой (основной) называют основную выдвигаемую гипотезу
.
Конкурирующей (альтернативной) называют гипотезу
, которая противоречит нулевой гипотезе
.
Для проверки нулевой гипотезы
используют специально подобранную случайную величину, которая рассчитывается по экспериментальной выборке, точное или приближенное распределение которой известно. Эту случайную величину К называют статистическим критерием.
Зная закон распределения К можно определить вероятность попадания К в любой интервал, т.е.
для любых значений а и b.
Обозначим:
.
Уровнем значимости a называют условное достаточно малое значение вероятности
, соответствующее практически невозможному событию
. При этом область
называют критической областью.
Областью допустимых значений считают область
, так как
достаточно велика при малых a.
Итак: при выбранном значении a для данной гипотезы
известна критическая область
, в которую с вероятностью
критерий К попасть не должен.
Если вычисленный по выборке критерий К оказался в критической области
, говорят о несоответствии гипотезы
фактическим данным, т.е. об отсутствии оснований принять гипотезу
. Если критерий К оказался вне критической области
, говорят о соответствии гипотезы фактическим данным, т.е об отсутствии оснований отвергать гипотезу
.
При статистической проверке правильности выдвигаемой гипотезы могут быть допущены ошибки двух родов: ошибка первого рода состоит в том, что гипотеза
отвергнута, а она верна; ошибка второго рода состоит в том, что гипотеза
принята, а она не верна.
Критерием согласия называют критерий проверки статистической гипотезы о предполагаемом законе неизвестного распределения СВ.
Критерий согласия Пирсона (критерий
).
Пусть выдвигается простая гипотеза
, полностью определяющая вид функции распределения
исследуемой СВ Х. При этом имеется выборка достаточно большого объема, которой соответствует определенный статистический ряд.
В качестве критерия проверки справедливости гипотезы
выбирается СВ:
,
где
– теоретические относительные частоты появления величины
, вычисленные в предположении гипотезы
по известной плотности распределения вероятностей
;
– теоретические абсолютные частоты появления
.
Эта величина при
распределена по закону
с r степенями свободы
,
где s – число различных значений СВ Х (количество интервалов группированной выборки), l – число параметров предполагаемого закона распределения.
Распределение
не обладает симметрией, поэтому критическая область выбирается односторонней
, значение
полностью определяются по уровню значимости a и данному значению
по таблице распределения
(приложение 2).
Критерий
использует тот факт, что случайная величина
имеет распределение, близкое к нормальному
. Чтобы это утверждение было достаточно точным, необходимо, чтобы для всех интервалов группированного статистического ряда выполнялось условие
. Если в некоторых интервалах это условие не выполняется, то их следует объединять с соседними. Так как после объединения остается меньше интервалов, то число степеней свободы следует вычислять, используя число вновь полученных интервалов.
Пример
Результаты измерений некоторой физической величины представлены в таблице:
| i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
|
| 1;3,5 | 3,5;6 | 6;8,5 | 8,5;11 | 11;13,5 | 13,5;16 | 16;18,5 |
| 3 | 8 | 14 | 27 | 20 | 16 | 7 | 5 |
1. Найти функцию распределения выборки
и построить ее график.
2. Построить гистограмму относительных частот.
3. Найти числовые характеристики выборки: выборочное среднее
и исправленную выборочную дисперсию
.
4. Используя функцию Лапласа, построить доверительный интервал для математического ожидания, соответствующий доверительной вероятности
.
5. С помощью критерия
(Пирсона) проверить гипотезу о нормальном распределении генеральной совокупности при уровне значимости
.
Решение
Объем выборки
, длина интервала
. Для нахождения эмпирической функции распределения
, построения гистограммы относительных частот и вычисления числовых характеристик выборки дополним заданную таблицу следующими строками: строкой, в которой расположим средние точки
каждого интервала, строкой относительных частот
, строкой накопленных относительных частот
и строкой, в которой вычислим высоты столбиков гистограммы относительных частот
.
Таблица 1
| i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
|
| 1;3,5 | 3,5;6 | 6;8,5 | 8,5;11 | 11;13,5 | 13,5;16 | 16;18,5 |
| 3 | 8 | 14 | 27 | 20 | 16 | 7 | 5 |
|
| 2,25 | 4,75 | 7,25 | 9,75 | 12,25 | 14,75 | 17,25 |
| 0,03 | 0,08 | 0,14 | 0,27 | 0,2 | 0,16 | 0,07 | 0,05 |
| 0,03 | 0,11 | 0,25 | 0,52 | 0,72 | 0,88 | 0,95 | 1 |
| 0,012 | 0,032 | 0,056 | 0,108 | 0,08 | 0,064 | 0,028 | 0,02 |
1. Эмпирическая функция распределения
определяется по значениям накопленных относительных частот, которые расположены в шестой строке таблицы 1. Эта функция имеет скачки в точках
– серединах интервалов группированного статистического ряда.
Аналитическое выражение эмпирической функции распределения имеет вид:
.
График эмпирической функции распределения
изображен на рис. 1.

|
1 0,95 0,88
0,72
0,52
0,25
0,11 0,03 |
-0,25 2,25 4,75 7,25 9,75 12,25 14,75 17,25 х
Рис. 1
2. Построим гистограмму относительных частот, для этого на каждом интервале группированной выборки строим столбики, высоты которых вычислены в седьмой строке таблицы 1. График гистограммы изображен на рис. 2.
| 0 |
0,108
0,08
0,064
0,032 0,028
0,02
0,012
Рис. 2
3. Найдем числовые характеристики выборки. Выборочное среднее находим по формуле
, в нашем случае

Исправленную выборочную дисперсию находим по формуле
, в нашем случае


.
4. При большом объеме выборки доверительный интервал для математического ожидания имеет вид
.
Используя таблицу значений функции Лапласа (приложение 1) находим
.
Вычислим
, тогда доверительный интервал для математического ожидания имеет вид

или
.
5. Выдвигаем простую гипотезу
о нормальном распределении генеральной совокупности. В качестве критерия проверки справедливости гипотезы выбирается случайная величина
,
где
находятся по формуле вероятности попадания случайной величины в интервал в предположении гипотезы о нормальном законе
,
где
– функция Лапласа.
Замечание. Если использовать таблицу значений функции Лапласа
, то вероятности попадания случайной величины в интервал в предположении гипотезы о нормальном законе распределения находится по формуле
.
Для соблюдения условия
полагают
,
.
Для вычисления критерия
составим расчетную таблицу:
Таблица 2
| I | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
|
| 1;3,5 | 3,5;6 | 6;8,5 | 8,5;11 | 11;13,5 | 13,5;16 | 16;18,5 |
| 3 | 8 | 14 | 27 | 20 | 16 | 7 | 5 |
|
| 2,25 | 4,75 | 7,25 | 9,75 | 12,25 | 14,75 | 17,25 |
| 1 | 3,5 | 6 | 8,5 | 11 | 13,5 | 16 |
|
|
| 1 | 3,5 | 6 | 8,5 | 11 | 13,5 | 16 |
|
|
|
|
| 0,5803 | 1,1849 | 1,7895 |
|
|
|
|
|
|
| 0,5803 | 1,1849 | 1,7895 |
|
|
|
|
| 0,438 | 0,764 | 0,926 | 1 |
|
|
|
|
|
| 0,438 | 0,764 | 0,926 |
| 0,033 | 0,0755 | 0,1565 | 0,2255 | 0,2285 | 0,163 | 0,081 | 0,037 |
| 3,3 | 7,55 | 15,65 | 22,55 | 22,85 | 16,3 | 8,1 | 3,7 |
| 10,85 | 15,65 | 22,55 | 22,85 | 16,3 | 11,8 | |||
| 0,15 |
| 4,45 |
|
| 0,2 | ||
| 0,0225 | 2,7225 | 19,8025 | 8,1225 | 0,09 | 0,04 | ||
| 0,0020 | 0,1739 | 0,8781 | 0,3554 | 0,0055 | 0,0033 |
Находим сумму элементов 11-ой и 12-ой строк таблицы 2, получаем
.
Критерий
равен сумме элементов последней строки таблицы 12:

.
Находим критическую область
. Так как уровень значимости
по условию, число степеней свободы
, то согласно таблице распределения
-
, критическая область имеет вид
.
Так как критерий
не попал в критическую область
, то нет оснований отвергать гипотезу о нормальном законе распределения генеральной совокупности.
Дата: 2019-02-19, просмотров: 293.