Подходы к оценке закона распределения

Поможем в ✍️ написании учебной работы

Имя

Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Нажимая кнопку "Продолжить", я принимаю политику конфиденциальности

До этого момента рассматривались различные алгоритмы и критерии качества оценивания отдельных параметров распределения. Однако на практике часто возникает задача оценивания самого закона распределения.

Т.к. распределение случайной величины в равной степени характеризуется функцией плотности вероятности и интегральной функцией распределения, можно выделить два классических подхода к оцениванию:

1. оценка плотности вероятности методом гистограмм;

2. оценка через эмпирическую интегральную функцию распределения.

Также в последнее время широкое распространение получили методы экспресс-оценки закона распределения через оценку отдельных моментов случайной величины. В данном разделе будет дана базовая информация по всем трем подходам.

Метод гистограмм

В основе метода гистограмм лежит идея об аппроксимации плотности вероятности при помощи ступенчатой функции по следующему принципу.

Известно, что вероятность попадания случайной величины в заданный интервал [a, b] находится из следующего выражения:

При малой длине (a, b] функцию можно считать на этом интервале почти постоянной и можно воспользоваться следующим приближением:

Тогда:

Соответственно можно разбить область определения случайной величины на M непересекающихся интервалов и на каждом интервале аппроксимировать плотность вероятности при помощи выражения (4.1). Очевидно, что чем больше M и меньше длительности интервалов , тем более точной будет аппроксимация (см., например, рис. 4.1, на котором приведены аппроксимации плотности распределения закона Симпсона при M = 11 и M = 31).

а)

б)

Рис. 4.1. Графики аппроксимации ПВ закона Симпсона при М=11 и M =31

По выборке можно осуществить оценку следующим образом:

где N – объем выборки, - k-й элемент выборки, - индикатор события t. Тогда оценка плотности вероятности будет иметь следующий вид:

Графическое изображение функции (4.3) называется гистограммой и имеет характерный ступенчатый вид (см., например, рис. 4.2). Очевидно, что гистограмма будет задана на интервале [a₁, b_M].

Рис. 4.2. График плотности распределения хи-квадрат и построенной гистограммы

Для применения выражения (4.3) приходится решать ряд практических вопросов, таких, например, как оценка области определения случайной величины, выбор числа интервалов M, границы интервалов (a_i, b_i] и т. д. Ниже приведем некоторые стандартные рекомендации.

1. Число интервалов разбиения выбирать исходя из правила Стерджеса: , где N – объем выборки, – знак округления.

2. В некоторых источниках можно встретить следующую рекомендацию к выбору границ области построения гистограммы: , . Стоит, однако, иметь в виду, что такой подход может привести к низкой точности оценки плотности вероятности для "тяжелохвостых" распределений. Поэтому, если существует подозрение о тяжелохвостости распределения, можно провести предварительное усечение выборки (см. раздел 3).

3. Для выбора интервалов (a_i, b_i], как правило, достаточно использовать разбиение интервала на M равных частей длиной . Тогда: , .

Ошибку в оценке плотности вероятности можно количественно охарактеризовать, посчитав средний квадрат относительного отклонения оценки от истинного значения :

Можно показать, что математическое ожидание величины e_h убывает обратно пропорционально объему выборки N: .

Дата: 2019-07-24, просмотров: 337.

⇐ Предыдущая 1 2 3 4 5 678 9 10 Следующая ⇒