Ошибки первого и второго рода. Доверительная вероятность.
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

(см. частично вопрос №22, вторую половину отрывкаtitkova-matmetody.pdf с. 15)

с. 7 (103), 101.JPG

До сих пор под проверкой статистической гипотезы мы подразумевали про­цедуру определения надежности связи (р-уровня, как показателя статистичес­кой значимости). Однако в конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же ги­потеза верна: нулевая — об отсутствии связи или альтернативная — о ее нали­чии. Соответственно, от этого зависит и окончательный, содержательный вы­вод исследования: подтверждена или нет исходная научная гипотеза.

Вполне очевидно, что основанием для принятия исследователем решения о том, какая гипотеза верна, является /^-уровень — вероятность того, что вер­на все-таки нулевая гипотеза. Чем меньше р-уровень, тем с большей уверен­ностью можно отклонить Но в пользу Н], тем самым подтвердив исходную содержательную гипотезу. Не менее очевидно и то, что, принимая решение, исследователь всегда допускает вероятность его ошибочности: ведь исследо­вание проведено на выборке, а вывод делается в отношении генеральной со­вокупности. При отклонении Но в пользу Н, исследователь рискует, что связи на самом деле в генеральной совокупности нет. И наоборот, решение в пользу Но вовсе не исключает наличие связи. Рассмотрим возможные исходе! приня­тия решения в зависимости от действительного положения дел:

В действительности:

Решение н а н истинна

Неправильное решение, Правильное решение,
ошибка I рода, вероятность = 1 — р
вероятность = а (мощность или
  чувствительность критерия)
Правильное решение, Неправильное решение,
вероятность — 1 — а ошибка 11 рода,
(доверительная вероятность) вероятность = р

исследователя: ° '

Отклонить Н(1 (принять Н)

Принять Н

Как следует из таблицы, решение исследователя зависит от того, какую ве­роятность ошибки I рода а,он считает допустимой: если ^-уровень, получен­ный в процессе проверки гипотезы, меньше или равен а, исследователь отклоняет Но, и это, как правило, желательный для него результат (содержа­тельная гипотеза подтверждается!). Отметим, что в этом случае вероятность ошибки известна, она меньше или равна а, точнее, равна /ьуровню. Если же /^-уровень превышает а, то принимается Но и содержательная гипотеза не под­тверждается1. Но при этом вероятность ошибки II рода f$— того, что верна все же Н] обычно остается неизвестной.

Рассмотрим соотношение ошибок I и II рода. Предположим, как и в прошлых примерах, проверяется гипотеза об отличии среднего значения от некоторой величины А. Нулевой гипотезе Но: М = А соответствует известное теоретическое распределение со средним А. Предположим также, что в гене­ральной совокупности на самом деле среднее значение больше А и равно В, а исследователь, как обычно, об этом даже и не догадывается. Этому положе­нию дел будет соответствовать свое, «альтернативное» теоретическое распре­деление, сходное с распределением для Но, но со средним В (рис. 7.3). На рис. 7.3 видно, что с уменьшением а растет «доверительная вероятность» 1 — а, которая определяет величину отклонения выборочного среднего от А для принятия Н(); уменьшая а, исследователь увеличивает возможное отклоне­ние выборочного среднего от Л, при котором принимается Но. Принятие Но при больших отклонениях выборочного среднего от А увеличивает вероятность ошибки II рода, р\ вероятность того, что на самом деле верна альтернативная гипотеза. Таким образом, снижение величины а увеличивает риск допустить ошибку IIрода — не обнаружить различия или связи, которые на самом деле существуют.

Вероятность (1 —13) называется мощностью (чувствительностью) критерия. Эта величина характеризует статистический критерий с точки зрения его способности отклонять Но, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестным. Величина(1 —а) характеризует степень доверия к результатам статистической провер­ки и называется доверительной вероятностью.

Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины а, удов­летворяющее двум противоречивым требованиям. Величина а должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Но. Величина а должна быть достаточно велика, чтобы откло­нить Но при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина а является приемлемой, не имеет однозначного отве­та. Есть лишь общие соображения, которыми можно руководствоваться при назначении а для статистического вывода:

□ Для установленного значения а вероятность ошибки (3 уменьшается с
ростом объема выборки.

□ Вероятность ошибки (3 уменьшается при увеличении значения а (на­
пример, с 0,01 до 0,05).

Вопрос о величине а — вопрос о том, при каком же /7-уровне исследова­тель может отклонить Но, решается преимущественно исходя из неформаль­ных соглашений, принятых на основе практического опыта в различных областях исследования. Традиционная интерпретация различных уровней значимости исходит из а = 0,05 и приведена в табл. 7.1. В соответствии с ней приемлемым для отклонения Но признается уровень р < 0,05. Такая от­носительно высокая вероятность ошибки I рода может быть рекомендована для небольших выборок (когда высока вероятность ошибки II рода). Если объемы выборок около 100 и более объектов, то порог отклонения Но целе­сообразно снизить до а = 0,01 и принимать решение о наличии связи (раз­личий) при р < 0,01.

Таблица 7.1 Традиционная интерпретация уровней значимости при а = 0,05

 

Уровень значимости Решение Возможный статистический вывод
р > 0,1 Принимается Но «Статистически достоверные разли­чия не обнаружены»
р<0,1 сомнения в истинности Н(), неопределенность «Различия обнаружены на уровне ста­тистической тенденции»
/?< 0,05 значимость, отклонение Н() «Обнаружены статистически досто­верные (значимые) различия»
р < 0,01 высокая значимость, откло­нение Но «Различия обнаружены на высоком уровне статистической значимости»

Мощность критерия.

Мощность критерия. Важнейшей характеристикой любого статистического критерия

является его мощность.

Мощность критерия – это его способность выявлять различия, если они есть. Иначе, это

его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

(отсюда и до конца см. вопрос №22, отрывок titkova-matmetody.pdf с. 15 от этого фрагмента и до конца отрывка)

25. t-критерий Стьюдента. Применение критерия для установления различия (сходства) средних арифметических значений в 2-х выборках.

(ответ, может быть, у Наследова на страницах 164-169)

 

с. 73 (165)

КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ НЕЗАВИСИМЫХ ВЫБОРОК

Метод позволяет проверить гипотезу о том, что средние значения двух ге­неральных совокупностей, из которых извлечены сравниваемые независимые выборки, отличаются друг от друга. Допущение независимости предполагает, что представители двух выборок не составляют пары коррелирующих значений признака. Это предположение нарушилось бы, если, например, 1-я выборка состояла из мужей, а 2-я — из их жен, и два ряда значений измеренного при­знака могли бы коррелировать.

Проверяемая статистическая гипотеза Но: Мх = М2. При ее отклонении при­нимается альтернативная гипотеза о том, что Мх больше (меньше) Мг.

Исходные предположения для статистической проверки:

П одна выборка извлекается из одной генеральной совокупности, а другая выборка, независимая от первой, извлекается из другой генеральной со­вокупности;

□ распределение изучаемого признака и в той, и в другой выборке при­
близительно соответствует нормальному;

□ дисперсии признака в двух выборках примерно одинаковы (гомогенны).

Структура исходных данных: изучаемый признак измерен у объектов (ис­пытуемых), каждый из которых принадлежит к одной из двух сравниваемых независимых выборок.

Ограничения: распределения признака и в той, и в другой выборке суще­ственно не отличаются от нормального; в случае разной численности сравнива­емых выборок их дисперсии статистически достоверно не различаются (про­веряется по критерию F-Фишера — при вычислениях «вручную», по критерию Ливена — при вычислениях на компьютере).

Альтернатива методу: непараметрический критерий £/-Манна-Уитни — если распределение признака хотя бы в одной выборке существенно отлича­ется от нормального и (или) дисперсии различаются статистически достоверно.

Формулы для эмпирического значения критерия ^-Стьюдента:

df = Nl+N2-2.

Формула (11.3) применяется для приближенных расчетов, для близких по численности выборок, а формула (11.4) — для точных расчетов, когда выбор­ки заметно различаются по численности.




Дата: 2016-10-02, просмотров: 239.