Для установления закона распределения генеральной совокупности по большой выборке из нее пользуются рядом критериев, из которых наибольшее практическое применение имеют критерий λ А. Н. Колмогорова и критерий Пирсона.
Критерий λ. Этот критерий дает достаточно точные результаты даже при объеме выборок, состоящих из нескольких десятков членов и прост для вычислений.
Для вычисления величины λ необходимо предварительно определить значения эмпирической Fэ(х) и теоретической F(х) интегральной функции предполагаемого закона распределения для каждого наблюденного значения случайной величины х. Затем по максимальной разности значений этих функций определяется λ при помощи следующей формулы:
.
Так как и , где и - накопленные теоретические и эмпирические частоты, а n — объем выборки, то вместо вышеприведенной формулы можно пользоваться следующей формулой:
. (5)
Накопленной частотой любого m-го значения xi называется сумма частот всех предшествующих значений xi, включая и частоту самого xi, т. е.
(6)
где m — число значений х i; fi - частота i-го значения х.
Академик А. Н. Колмогоров доказал, что для непрерывных случайных величин
,
где . Для больших n и любом l > 0 .
Функция K(λ) табулирована Н. В. Смирновым и при помощи таблицы значений K(λ) составлена таблица значений P(λ), которая приведена в приложении (таблица П6).
По вычисленному по формуле (4) или (5) значению λ по таблице П5 приложения определяют P(λ). Если вероятность P(λ) окажется очень малой, практически, когда P(λ) ≤ 0,05, то расхождение между F(x) и Fэ(х) считается существенным, а не случайным и гипотеза о предполагаемом законе распределения величины x бракуется. Если же вероятность P(λ) будет достаточно большой (практически, когда P(λ) > 0,05), то гипотеза принимается.
Использование критерия λ предполагает непрерывность и, кроме того, предполагается, что эмпирическая функция построена по не сгруппированным в интервалы значениям случайной величины х. Однако в случае, когда интервалы группировки достаточно малы, критерий λ дает, хотя и приближенную, но вполне приемлемую для практических целей оценку близости эмпирического распределения к теоретическому.
Для удобства вычисления критерия λ составляют вспомогательную таблицу, в которой накопленные частоты функции и вычисляются в зависимости от закона распределения х (таблица 6).
Таблица 6. Данные для вычисления критерия l
xi | fi | |||||
от | до | |||||
Критерий . Применим для любых сгруппированных совокупностей, но при достаточно большом их объеме. Для вычисления необходимо предварительно вычислить теоретические частоты для наблюденных значений эмпирического распределения, т. е. произвести сопоставление этого распределения с предполагаемым теоретическим. При этом необходимо, чтобы величина частоты в каждом интервале значений х была бы не менее пяти. Если в каком-либо интервале значений х частота будет менее пяти, то такой интервал следует объединить с соседним.
Критерий вычисляется по следующей формуле:
, (7)
где m– число интервалов сравниваемых частот; – эмпирическая частота i-го интервала значений x; – теоретическая частота i-го интервала значений х.
Для удобства вычисления рекомендуется составить таблицу 7.
Таблица 7. Вспомогательная таблица для вычисления критерия
Интервалы x (от – до) | |||||
|
|
|
| ||
Далее вычисляют число степеней свободы k по формуле
k = m - p - 1,
где m — число сравниваемых частот (разрядов); p — число параметров теоретического распределения.
Для величины k найден закон распределения, по которому вычислены вероятности для различных значений и k. Значения приведены в таблице П7 приложения.
Если , гипотеза о законе распределения должна быть забракована. Если , то гипотеза принимается.
Дата: 2019-02-25, просмотров: 234.