Ошибки первого и второго рода. Доверительная вероятность.

Поможем в ✍️ написании учебной работы

Имя

Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Нажимая кнопку "Продолжить", я принимаю политику конфиденциальности

(см. частично вопрос №22, вторую половину отрывкаtitkova-matmetody.pdf с. 15)

с. 7 (103), 101.JPG

До сих пор под проверкой статистической гипотезы мы подразумевали процедуру определения надежности связи (р-уровня, как показателя статистической значимости). Однако в конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же гипотеза верна: нулевая — об отсутствии связи или альтернативная — о ее наличии. Соответственно, от этого зависит и окончательный, содержательный вывод исследования: подтверждена или нет исходная научная гипотеза.

Вполне очевидно, что основанием для принятия исследователем решения о том, какая гипотеза верна, является /^-уровень — вероятность того, что верна все-таки нулевая гипотеза. Чем меньше р-уровень, тем с большей уверенностью можно отклонить Н_о в пользу Н], тем самым подтвердив исходную содержательную гипотезу. Не менее очевидно и то, что, принимая решение, исследователь всегда допускает вероятность его ошибочности: ведь исследование проведено на выборке, а вывод делается в отношении генеральной совокупности. При отклонении Н_о в пользу Н, исследователь рискует, что связи на самом деле в генеральной совокупности нет. И наоборот, решение в пользу Н_о вовсе не исключает наличие связи. Рассмотрим возможные исходе! принятия решения в зависимости от действительного положения дел:

В действительности:

Решение _{н а н} _{истинна}

Неправильное решение,	Правильное решение,
ошибка I рода,	вероятность = 1 — р
вероятность = а	(мощность или
	чувствительность критерия)
Правильное решение,	Неправильное решение,
вероятность — 1 — а	ошибка 11 рода,
(доверительная вероятность)	вероятность = р

исследователя: ° '

Отклонить Н₍₁(принять Н)

Принять Н

Как следует из таблицы, решение исследователя зависит от того, какую вероятность ошибки I рода а,он считает допустимой: если ^-уровень, полученный в процессе проверки гипотезы, меньше или равен а, исследователь отклоняет Н_о, и это, как правило, желательный для него результат (содержательная гипотеза подтверждается!). Отметим, что в этом случае вероятность ошибки известна, она меньше или равна а, точнее, равна /ьуровню. Если же /^-уровень превышает а, то принимается Н_о и содержательная гипотеза не подтверждается¹. Но при этом вероятность ошибки II рода f$— того, что верна все же Н] обычно остается неизвестной.

Рассмотрим соотношение ошибок I и II рода. Предположим, как и в прошлых примерах, проверяется гипотеза об отличии среднего значения от некоторой величины А. Нулевой гипотезе Н_о: М = А соответствует известное теоретическое распределение со средним А. Предположим также, что в генеральной совокупности на самом деле среднее значение больше А и равно В, а исследователь, как обычно, об этом даже и не догадывается. Этому положению дел будет соответствовать свое, «альтернативное» теоретическое распределение, сходное с распределением для Н_о, но со средним В (рис. 7.3). На рис. 7.3 видно, что с уменьшением а растет «доверительная вероятность» 1 — а, которая определяет величину отклонения выборочного среднего от А для принятия Н₍₎; уменьшая а, исследователь увеличивает возможное отклонение выборочного среднего от Л, при котором принимается Н_о. Принятие Н_опри больших отклонениях выборочного среднего от А увеличивает вероятность ошибки II рода, р\ вероятность того, что на самом деле верна альтернативная гипотеза. Таким образом, снижение величины а увеличивает риск допустить ошибку IIрода — не обнаружить различия или связи, которые на самом деле существуют.

Вероятность (1 —13) называется мощностью (чувствительностью) критерия. Эта величина характеризует статистический критерий с точки зрения его способности отклонять Н_о, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестным. Величина(1 —а) характеризует степень доверия к результатам статистической проверки и называется доверительной вероятностью.

Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины а, удовлетворяющее двум противоречивым требованиям. Величина а должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Н_о. Величина а должна быть достаточно велика, чтобы отклонить Н_о при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина а является приемлемой, не имеет однозначного ответа. Есть лишь общие соображения, которыми можно руководствоваться при назначении а для статистического вывода:

□ Для установленного значения а вероятность ошибки (3 уменьшается с
ростом объема выборки.

□ Вероятность ошибки (3 уменьшается при увеличении значения а (на
пример, с 0,01 до 0,05).

Вопрос о величине а — вопрос о том, при каком же /7-уровне исследователь может отклонить Н_о, решается преимущественно исходя из неформальных соглашений, принятых на основе практического опыта в различных областях исследования. Традиционная интерпретация различных уровней значимости исходит из а = 0,05 и приведена в табл. 7.1. В соответствии с ней приемлемым для отклонения Н_о признается уровень р < 0,05. Такая относительно высокая вероятность ошибки I рода может быть рекомендована для небольших выборок (когда высока вероятность ошибки II рода). Если объемы выборок около 100 и более объектов, то порог отклонения Н_о целесообразно снизить до а = 0,01 и принимать решение о наличии связи (различий) при р < 0,01.

Таблица 7.1 Традиционная интерпретация уровней значимости при а = 0,05

Уровень значимости	Решение	Возможный статистический вывод
р > 0,1	Принимается Н_о	«Статистически достоверные различия не обнаружены»
р<0,1	сомнения в истинности Н₍₎, неопределенность	«Различия обнаружены на уровне статистической тенденции»
/?< 0,05	значимость, отклонение Н₍₎	«Обнаружены статистически достоверные (значимые) различия»
р < 0,01	высокая значимость, отклонение Н_о	«Различия обнаружены на высоком уровне статистической значимости»

Мощность критерия.

Мощность критерия. Важнейшей характеристикой любого статистического критерия

является его мощность.

Мощность критерия – это его способность выявлять различия, если они есть. Иначе, это

его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

(отсюда и до конца см. вопрос №22, отрывок titkova-matmetody.pdf с. 15 от этого фрагмента и до конца отрывка)

25. t-критерий Стьюдента. Применение критерия для установления различия (сходства) средних арифметических значений в 2-х выборках.

(ответ, может быть, у Наследова на страницах 164-169)

с. 73 (165)

КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ НЕЗАВИСИМЫХ ВЫБОРОК

Метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые независимые выборки, отличаются друг от друга. Допущение независимости предполагает, что представители двух выборок не составляют пары коррелирующих значений признака. Это предположение нарушилось бы, если, например, 1-я выборка состояла из мужей, а 2-я — из их жен, и два ряда значений измеренного признака могли бы коррелировать.

Проверяемая статистическая гипотеза Н_о: М_х = М₂. При ее отклонении принимается альтернативная гипотеза о том, что М_х больше (меньше) М_г.

Исходные предположения для статистической проверки:

П одна выборка извлекается из одной генеральной совокупности, а другая выборка, независимая от первой, извлекается из другой генеральной совокупности;

□ распределение изучаемого признака и в той, и в другой выборке при
близительно соответствует нормальному;

□ дисперсии признака в двух выборках примерно одинаковы (гомогенны).

Структура исходных данных: изучаемый признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух сравниваемых независимых выборок.

Ограничения: распределения признака и в той, и в другой выборке существенно не отличаются от нормального; в случае разной численности сравниваемых выборок их дисперсии статистически достоверно не различаются (проверяется по критерию F-Фишера — при вычислениях «вручную», по критерию Ливена — при вычислениях на компьютере).

Альтернатива методу: непараметрический критерий £/-Манна-Уитни — если распределение признака хотя бы в одной выборке существенно отличается от нормального и (или) дисперсии различаются статистически достоверно.

Формулы для эмпирического значения критерия ^-Стьюдента:

df = N_l+N₂-2.

Формула (11.3) применяется для приближенных расчетов, для близких по численности выборок, а формула (11.4) — для точных расчетов, когда выборки заметно различаются по численности.

Дата: 2016-10-02, просмотров: 381.

⇐ Предыдущая 1 234 5 6 7 8 9 10 Следующая ⇒