Генеральная и выборочная совокупность
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Всю совокупность единиц, которые подлежат обследованию называют генеральной совокупностью. Ее численность обозначается N.

Часть совокупности, которая подлежит выборочному обследованию, называют выборочной, ее численность обозначается n.

Задание выборочного наблюдения – получить правильное представление о показателях генеральной совокупности на основе изучения выборочной совокупности.

При выборочном наблюдении имеют дело с двумя категориями обобщающих показателей:

- доля (удельный вес) (в генеральной совокупности обозначается P, в выборочной – w);

- средняя величина.

Удельный вес дает характеристику совокупности по вариационному признаку и рассчитывается как отношение числа единиц совокупности, которые имеют интересующий нас признак к общему числу единиц совокупности.

Среднее значение вариационного признака во всей генеральной совокупности называется генеральной средней , а среднее значение признака, который подлежит выборочному наблюдению называется выборочной средней .

В процессе статистических исследований нередко приходится ограничивать объем выборки. В статистике доказано, что даже выборки весьма малого объема (до 30 единиц), которые называют малыми выборками, позволяют получить приемлемые для анализа результаты.

Проблема малых выборок была решена в 1908г. английским статистиком У.Гассетом (псевдоним Стьюдент (студент)). Он сумел определить зависимость между величиной доверительного коэффициента t, а так же численностью малой выборки n с одной стороны, и вероятностью нахождения ошибки выборки в заданных пределах с другой стороны. Эта зависимость получила название – распределение Стьюдента.

Для определения возможных границ ошибки пользуются так называемым критерием Стьюдента, который определяется по формуле:

 ,

где   мера случайных колебаний выборочной средней в малой выборке.

Размер рассчитывается на основе данных выборочного наблюдения по формуле:

.

Для упрощения расчетов имеются специальные таблицы значений критериев Стьюдента.

 

Понятие об ошибках выборки.

Ошибка выборки возникает из-за различий в вариации значений изучаемого признака у единиц выборочной и генеральной совокупности. Поскольку при соблюдении требований случайного отбора все единицы генеральной совокупности имеют равные шансы попасть в выборку, состав выборки может значительно изменяться при повторении испытаний. Соответственно будут меняться параметры выборки, и возникать ошибки выборки. Ошибки выборки неизбежны, они вытекают из сути метода. Ошибки выборки не могут быть постоянными при повторении отбора.

Вероятность появления определенной ошибки выборки находят с помощью теорем теории вероятностей. Согласно теореме Чебышева, при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности вероятность того, что разность между выборочной средней и генеральной средней будет сколь угодно мала, близка к единице:

 при .

А. М. Ляпунов доказал, что независимо от характера распределения генеральной совокупности при увеличении объема выборки распределение вероятностей появления того или иного значения выборочной средней приближается к нормальному распределению (центральная предельная теорема). Следовательно, вероятность отклонения выборочной средней от генеральной средней, т.е. вероятность появления заданной предельной ошибки, также подчиняется указанному закону и может быть найдена как функция от t с помощью интеграла вероятностей Лапласа:

,

где – нормированное отклонение выборочной средней от генеральной средней.

При определении ошибки выборки речь идет о том, чтобы максимально приблизить показатели выборочной совокупности к показателям генеральной совокупности и выявить допустимые граничные отклонения этих показателей.

В процессе выборочного наблюдения возможно решить 2 задачи:

- установить пределы (границы) среднего значения признака в генеральной совокупности: ;

- найти пределы (границы) доли альтернативного признака в генеральной совокупности: .

Ошибка репрезентативности, или разница между выборочной и генеральной характеристикой (долей или средней), которая возникает вследствие несплошного наблюдения, в основе которого лежит случайный отбор, рассчитывается как граница вероятной ошибки (предельная ошибка выборки).

В общем виде предельная ошибка выборки определяется (на основе теоремы Ляпунова) как:

 = t ,

где tкоэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки (значения t при заданной вероятности P определяются по таблице значений, которая рассчитывается по формуле Лапласа).

Например, при P=0,683          t =1,

при P=0,954           t =2,

при P=0,997           t =3.

Вероятность, которая принимается при расчете выборочной характеристики, называется доверительной. В качестве уровня доверительной (гарантированной) вероятности принимается, обычно, 0,954 или 0,997. Тогда граница ошибки определяется величиной, удвоенной или утроенной по отношению к средней ошибке выборки .

Средняя ошибка выборки определяется по формулам:

- для повторного случайного отбора

= ;       

для бесповторного случайного и механического отборов

 

= ;

где - дисперсия (для типовой выборки - средняя из внутригрупповых дисперсий; для простой случайной и механической выборок – дисперсия выборочной совокупности).

Таким образом, предельная ошибка выборки для средней рассчитывается по формулам:

- для повторного случайного отбора

;      

для бесповторного случайного и механического отборов

 

.

Предельная ошибка выборки для доли альтернативного признака:

- при повторном отборе

,

- при бесповторном

,

где - доля альтернативного признака;

m -численность совокупности по альтернативному признаку;

 - численность выборочной совокупности.

Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики генеральной совокупности, а лишь ее доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики.

Вероятности конкретного размера ошибок подсчитать невозможно (нецелесообразно), гораздо важнее знать, что ошибка наблюдений не выйдет за определенные пределы.

Рассмотрим пример. Допустим, в результате выборочного исследования жилищных условий жителей города, осуществленного на основе случайной повторной выборки, получен такой ряд распределения.

Таблиця 9.1

Дата: 2018-12-28, просмотров: 361.