Оценки для математического ожидания и дисперсии
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Пусть имеется случайная величина с математическим ожиданием и дисперсией ; оба параметра неизвестны. Над величиной произведено независимых опытов, давших результаты . Требуется найти состоятельные и несмещенные оценки для параметров и .

В качестве оценки для математического ожидания естественно предложить среднее арифметическое наблюденных значений (ранее мы его обозначали ):

. (14.2.1)

Нетрудно убедиться, что эта оценка является состоятельной: согласно закону больших чисел, при увеличении величина сходится по вероятности к . Оценка является также и несмещенной, так как

. (14.2.2)

Дисперсия этой оценки равна:

. (14.2.3)

Эффективность или неэффективность оценки зависит от вида закона распределения величины . Можно доказать, что если величина распределена по нормальному закону, дисперсия (14.2.3) будет минимально возможной, т. е. оценка является эффективной. Для других законов распределения это может быть и не так.

Перейдем к оценке для дисперсии . На первый взгляд наиболее естественной оценкой представляется статистическая дисперсия:

, (14.2.4)

где

. (14.2.5)

Проверим, является ли эта оценка состоятельной. Выразим ее через второй начальный момент (по формуле (7.4.6) гл. 7):

. (14.2.6)

Первый член в правой части есть среднее арифметическое наблюденных значений случайной величины ; он сходится по вероятности к . Второй член сходится по вероятности к ; вся величина (14.2.6) сходится по вероятности к величине

.

Это означает, что оценка (14.2.4) состоятельна.

Проверим, является ли оценка также и несмещенной. Подставим в формулу (14.2.6) вместо его выражение (14.2.5) и произведем указанные действия:

. (14.2.7)

Найдем математическое ожидание величины (14.2.7):

. (14.2.8)

Так как дисперсия не зависит от того, в какой точке выбрать начало координат, выберем его в точке . Тогда

; , (14.2.9)

. (14.2.10)

Последнее равенство следует из того, что опыты независимы.

Подставляя (14.2.9) и (14.2.10) в (14.2.8), получим:

. (14.2.11)

Отсюда видно, что величина не является несмещенной оценкой для : ее математическое ожидание не равно , а несколько меньше. Пользуясь оценкой вместо дисперсии , мы будем совершать некоторую систематическую ошибку в меньшую сторону. Чтобы ликвидировать это смещение, достаточно ввести поправку, умножив величину на . Получим:

.

Такую «исправленную» статистическую дисперсию мы и выберем в качестве оценки для :

. (14.2.12)

Так как множитель стремится к единице при , а оценка состоятельна, то оценка также будет состоятельной.

На практике часто вместо формулы (14.2.12) бывает удобнее применять другую, равносильную ей, в которой статистическая дисперсия выражена через второй начальный момент:

. (14.2.13)

При больших значениях , естественно, обе оценки - смещенная и несмещенная - будут различаться очень мало и введение поправочного множителя теряет смысл.

Таким образом, мы пришли к следующим правилам обработки ограниченного по объему статистического материала.

Если даны значения , принятые в независимых опытах случайной величиной с неизвестными математическим ожиданием и дисперсией , то для определения этих параметров следует пользоваться приближенными значениями (оценками):

(14.2.14)

24. Доверительный интервал. Доверительная вероятность

В предыдущих мы рассмотрели вопрос об оценке неизвестного параметра одним числом. Такая оценка называется «точечной». В ряде задач требуется не только найти для параметра подходящее численное значение, но и оценить его точность и надежность. Требуется знать - к каким ошибкам может привести замена параметра его точечной оценкой и с какой степенью уверенности можно ожидать, что эти ошибки не выйдут за известные пределы?

Такого рода задачи особенно актуальны при малом числе наблюдений, когда точечная оценка в значительной мере случайна и приближенная замена на может привести к серьезным ошибкам.

Чтобы дать представление о точности и надежности оценки , в математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями.

Пусть для параметра получена из опыта несмещенная оценка . Мы хотим оценить возможную при этом ошибку. Назначим некоторую достаточно большую вероятность (например, или ) такую, что событие с вероятностью можно считать практически достоверным, и найдем такое значение , для которого

. (14.3.1)

Тогда диапазон практически возможных значений ошибки, возникающей при замене на , будет ; большие по абсолютной величине ошибки будут появляться только с малой вероятностью .

Перепишем (14.3.1) в виде:

. (14.3.2)

Равенство (14.3.2) означает, что с вероятностью неизвестное значение параметра попадает в интервал

. (14.3.3)

При этом необходимо отметить одно обстоятельство. Ранее мы неоднократно рассматривали вероятность попаданияслучайной величины в заданный неслучайный интервал. Здесь дело обстоит иначе: величина не случайна, зато случаен интервал . Случайно его положение на оси абсцисс, определяемое его центром ; случайна вообще и длина интервала , так как величина вычисляется, как правило, по опытным данным. Поэтому в данном случае лучше будет толковать величину не как вероятность «попадания» точки в интервал , а как вероятность того, что случайный интервал накроет точку (рис. 14.3.1).

Рис. 14.3.1.

Вероятность принято называть доверительной вероятностью, а интервал - доверительным интервалом. Границы интервала : и называются доверительными границами.

Дадим еще одно истолкование понятию доверительного интервала: его можно рассматривать как интервал значений параметра , совместимых с опытными данными и не противоречащих им. Действительно, если условиться считать событие с вероятностью практически невозможным, то те значения параметра , для которых , нужно признать противоречащими опытным данным, а те, для которых , - совместимыми с ними.

Перейдем к вопросу о нахождении доверительных границ и .

Пусть для параметра имеется несмещенная оценка . Если бы нам был известен закон распределения величины , задача нахождения доверительного интервала была бы весьма проста: достаточно было бы найти такое значение , для которого

.

Затруднение состоит в том, что закон распределения оценки зависит от закона распределения величины и, следовательно, от его неизвестных параметров (в частности, и от самого параметра ).

Чтобы обойти это затруднение, можно применить следующий грубо приближенный прием: заменить в выражении для неизвестные параметры их точечными оценками. При сравнительно большом числе опытов (порядка ) этот прием обычно дает удовлетворительные по точности результаты.

В качестве примера рассмотрим задачу о доверительном интервале для математического ожидания.

Пусть произведено независимых опытов над случайной величиной , характеристики которой - математическое ожидание и дисперсия - неизвестны. Для этих параметров получены оценки:

; . (14.3.4)

Требуется построить доверительный интервал , соответствующий доверительной вероятности , для математического ожидания величины .

При решении этой задачи воспользуемся тем, что величина представляет собой сумму независимых одинаково распределенных случайных величин , и, согласно центральной предельной теореме, при достаточно большом ее закон распределения близок к нормальному. На практике даже при относительно небольшом числе слагаемых (порядка ) закон распределения суммы можно приближенно считать нормальным. Будем исходить из того, что величина распределена по нормальному закону. Характеристики этого закона - математическое ожидание и дисперсия - равны соответственно и (см. гл. 13 13.3). Предположим, что величина нам известна, и найдём такую величину для которой

. (14.3.5)

Применяя формулу (6.3.5) главы 6, выразим вероятность в левой части (14.3.5) через нормальную функцию распределения

. (14.3.6)

где - среднее квадратическое отклонение оценки .

Из уравнения

находим значение :

, (14.3.7)

где - функция, обратная , т. е. такое значение аргумента, при котором нормальная функция распределения равна .

Дисперсия , через которую выражена величина , нам в точности не известна; в качестве ее ориентировочного значения можно воспользоваться оценкой (14.3.4) и положить приближенно:

. (14.3.8)

Таким образом, приближенно решена задача построения доверительного интервала, который равен:

, (14.3.9)

где определяется формулой (14.3.7).

Чтобы избежать при вычислении обратного интерполирования в таблицах функции , удобно составить специальную таблицу (см. табл. 14.3.1), где приводятся значения величины

в зависимости от . Величина определяет для нормального закона число средних квадратических отклонений, которое нужно отложить вправо и влево от центра рассеивания для того, чтобы вероятность попадания в полученный участок была равна .

Через величину доверительный интервал выражается в виде:

.

Таблица 14.3.1

0,80 1,282 0,86 1,475 0,91 1,694 0,97 2,169
0,81 1,310 0,87 1,513 0,92 1,750 0,98 2,325
0,82 1,340 0,88 1,554 0,93 1,810 0,99 2,576
0,83 1,371 0,89 1,597 0,94 1,880 0,9973 3,000
0,84 1,404 0,90 1,643 0,95 1,960 0,999 3,290
0,85 1,439     0,96 2,053    

Пример 1. Произведено 20 опытов над величиной ; результаты приведены в таблице 14.3.2.

Таблица 14.3.2

1 10,5 6 10,6 11 10,6 16 10,9
2 10,8 7 10,9 12 11,3 17 10,8
3 11,2 8 11,0 13 10,5 18 10,7
4 10,9 9 10,3 14 10,7 19 10,9
5 10,4 10 10,8 15 10,8 20 11,0

Требуется найти оценку для математического ожидания величины и построить доверительный интервал, соответствующий доверительной вероятности .

Решение. Имеем:

.

Выбрав за начало отсчета , по третьей формуле (14.2.14) находим несмещенную оценку :

;

.

По таблице 14.3.1 находим ;

.

Доверительные границы:

;

.

Доверительный интервал:

.

Значения параметра , лежащие в этом интервале, являются совместными с опытными данными, приведенными в таблице 14.3.2.

Аналогичным способом может быть построен доверительный интервал и для дисперсии.

Пусть произведено независимых опытов над случайной величиной с неизвестными параметрами и , и для дисперсии получена несмещенная оценка:

, (14.3.11)

где

.

Требуется приближенно построить доверительней интервал для дисперсии.

Из формулы (14.3.11) видно, что величина представляет собой сумму случайных величин вида . Эти величины не являются независимыми, так как в любую из них входит величина , зависящая от всех остальных. Однако можно показать, что при увеличении закон распределения их суммы тоже приближается к нормальному. Практически при он уже может считаться нормальным.

Предположим, что это так, и найдем характеристики этого закона: математическое ожидание и дисперсию. Так как оценка - несмещенная, то

.

Вычисление дисперсии связано со сравнительно сложными выкладками, поэтому приведем ее выражение без вывода:

, (14.3.12)

где - четвертый центральный момент величины .

Чтобы воспользоваться этим выражением, нужно подставить в него значения и (хотя бы приближенные). Вместо можно воспользоваться его оценкой . В принципе четвертый центральный момент тоже можно заменить его оценкой, например величиной вида:

, (14.3.13)

но такая замена даст крайне невысокую точность, так как вообще при ограниченном числе опытов моменты высокого порядка определятся с большими ошибками. Однако на практике часто бывает, что вид закона распределения величины известен заранее: неизвестны лишь его параметры. Тогда можно попытаться выразить через .

Возьмем наиболее часто встречающийся случай, когда величина распределена по нормальному закону. Тогда ее четвертый центральный момент выражается через дисперсию (см. гл. 6 6.2):

,

и формула (14.3.12) дает

или

. (14.3.14)

Заменяя в (14.3.14) неизвестное его оценкой , получим:

, (14.3.15)

откуда

. (14.3.16)

Момент можно выразить через также и в некоторых других случаях, когда распределение величины не является нормальным, но вид его известен. Например, для закона равномерной плотности (см. главу 5) имеем:

; ,

где - интервал, на котором задан закон. Следовательно,

.

По формуле (14.3.12) получим:

,

откуда находим приближенно

. (14.3.17)

В случаях, когда вид закона распределения величины неизвестен, при ориентировочной оценке величины рекомендуется все же пользоваться формулой (14.3.16), если нет специальных оснований считать, что этот закон сильно отличается от нормального (обладает заметным положительным или отрицательным эксцессом).

Если ориентировочное значение тем или иным способом получено, то можно построить доверительный интервал для дисперсии, аналогично тому, как мы строили его для математического ожидания:

, (14.3.18)

где величина в зависимости от заданной вероятности находится по таблице 14.3.1.

Пример 2. Найти приближенно 80%-й доверительный интервал для дисперсии случайной величины в условиях примера 1, если известно, что величина распределена по закону, близкому к нормальному.

Решение. Величина остается той же, что в примере 1:

.

По формуле (14.3.16)

.

По формуле (14.3.18) находим доверительный интервал:

.

Соответствующий интервал значений среднего квадратического отклонения: .

Дата: 2019-02-19, просмотров: 190.