(см. частично вопрос №22, вторую половину отрывкаtitkova-matmetody.pdf с. 15)
с. 7 (103), 101.JPG
До сих пор под проверкой статистической гипотезы мы подразумевали процедуру определения надежности связи (р-уровня, как показателя статистической значимости). Однако в конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же гипотеза верна: нулевая — об отсутствии связи или альтернативная — о ее наличии. Соответственно, от этого зависит и окончательный, содержательный вывод исследования: подтверждена или нет исходная научная гипотеза.
Вполне очевидно, что основанием для принятия исследователем решения о том, какая гипотеза верна, является /^-уровень — вероятность того, что верна все-таки нулевая гипотеза. Чем меньше р-уровень, тем с большей уверенностью можно отклонить Но в пользу Н], тем самым подтвердив исходную содержательную гипотезу. Не менее очевидно и то, что, принимая решение, исследователь всегда допускает вероятность его ошибочности: ведь исследование проведено на выборке, а вывод делается в отношении генеральной совокупности. При отклонении Но в пользу Н, исследователь рискует, что связи на самом деле в генеральной совокупности нет. И наоборот, решение в пользу Но вовсе не исключает наличие связи. Рассмотрим возможные исходе! принятия решения в зависимости от действительного положения дел:
В действительности:
Решение н а н истинна
Неправильное решение, | Правильное решение, |
ошибка I рода, | вероятность = 1 — р |
вероятность = а | (мощность или |
чувствительность критерия) | |
Правильное решение, | Неправильное решение, |
вероятность — 1 — а | ошибка 11 рода, |
(доверительная вероятность) | вероятность = р |
исследователя: ° '
Отклонить Н(1 (принять Н)
Принять Н
Как следует из таблицы, решение исследователя зависит от того, какую вероятность ошибки I рода а,он считает допустимой: если ^-уровень, полученный в процессе проверки гипотезы, меньше или равен а, исследователь отклоняет Но, и это, как правило, желательный для него результат (содержательная гипотеза подтверждается!). Отметим, что в этом случае вероятность ошибки известна, она меньше или равна а, точнее, равна /ьуровню. Если же /^-уровень превышает а, то принимается Но и содержательная гипотеза не подтверждается1. Но при этом вероятность ошибки II рода f$— того, что верна все же Н] обычно остается неизвестной.
Рассмотрим соотношение ошибок I и II рода. Предположим, как и в прошлых примерах, проверяется гипотеза об отличии среднего значения от некоторой величины А. Нулевой гипотезе Но: М = А соответствует известное теоретическое распределение со средним А. Предположим также, что в генеральной совокупности на самом деле среднее значение больше А и равно В, а исследователь, как обычно, об этом даже и не догадывается. Этому положению дел будет соответствовать свое, «альтернативное» теоретическое распределение, сходное с распределением для Но, но со средним В (рис. 7.3). На рис. 7.3 видно, что с уменьшением а растет «доверительная вероятность» 1 — а, которая определяет величину отклонения выборочного среднего от А для принятия Н(); уменьшая а, исследователь увеличивает возможное отклонение выборочного среднего от Л, при котором принимается Но. Принятие Но при больших отклонениях выборочного среднего от А увеличивает вероятность ошибки II рода, р\ вероятность того, что на самом деле верна альтернативная гипотеза. Таким образом, снижение величины а увеличивает риск допустить ошибку IIрода — не обнаружить различия или связи, которые на самом деле существуют.
Вероятность (1 —13) называется мощностью (чувствительностью) критерия. Эта величина характеризует статистический критерий с точки зрения его способности отклонять Но, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестным. Величина(1 —а) характеризует степень доверия к результатам статистической проверки и называется доверительной вероятностью.
Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины а, удовлетворяющее двум противоречивым требованиям. Величина а должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Но. Величина а должна быть достаточно велика, чтобы отклонить Но при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина а является приемлемой, не имеет однозначного ответа. Есть лишь общие соображения, которыми можно руководствоваться при назначении а для статистического вывода:
□ Для установленного значения а вероятность ошибки (3 уменьшается с
ростом объема выборки.
□ Вероятность ошибки (3 уменьшается при увеличении значения а (на
пример, с 0,01 до 0,05).
Вопрос о величине а — вопрос о том, при каком же /7-уровне исследователь может отклонить Но, решается преимущественно исходя из неформальных соглашений, принятых на основе практического опыта в различных областях исследования. Традиционная интерпретация различных уровней значимости исходит из а = 0,05 и приведена в табл. 7.1. В соответствии с ней приемлемым для отклонения Но признается уровень р < 0,05. Такая относительно высокая вероятность ошибки I рода может быть рекомендована для небольших выборок (когда высока вероятность ошибки II рода). Если объемы выборок около 100 и более объектов, то порог отклонения Но целесообразно снизить до а = 0,01 и принимать решение о наличии связи (различий) при р < 0,01.
Таблица 7.1 Традиционная интерпретация уровней значимости при а = 0,05
Уровень значимости | Решение | Возможный статистический вывод |
р > 0,1 | Принимается Но | «Статистически достоверные различия не обнаружены» |
р<0,1 | сомнения в истинности Н(), неопределенность | «Различия обнаружены на уровне статистической тенденции» |
/?< 0,05 | значимость, отклонение Н() | «Обнаружены статистически достоверные (значимые) различия» |
р < 0,01 | высокая значимость, отклонение Но | «Различия обнаружены на высоком уровне статистической значимости» |
Мощность критерия.
Мощность критерия. Важнейшей характеристикой любого статистического критерия
является его мощность.
Мощность критерия – это его способность выявлять различия, если они есть. Иначе, это
его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.
(отсюда и до конца см. вопрос №22, отрывок titkova-matmetody.pdf с. 15 от этого фрагмента и до конца отрывка)
25. t-критерий Стьюдента. Применение критерия для установления различия (сходства) средних арифметических значений в 2-х выборках.
(ответ, может быть, у Наследова на страницах 164-169)
с. 73 (165)
КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ НЕЗАВИСИМЫХ ВЫБОРОК
Метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые независимые выборки, отличаются друг от друга. Допущение независимости предполагает, что представители двух выборок не составляют пары коррелирующих значений признака. Это предположение нарушилось бы, если, например, 1-я выборка состояла из мужей, а 2-я — из их жен, и два ряда значений измеренного признака могли бы коррелировать.
Проверяемая статистическая гипотеза Но: Мх = М2. При ее отклонении принимается альтернативная гипотеза о том, что Мх больше (меньше) Мг.
Исходные предположения для статистической проверки:
П одна выборка извлекается из одной генеральной совокупности, а другая выборка, независимая от первой, извлекается из другой генеральной совокупности;
□ распределение изучаемого признака и в той, и в другой выборке при
близительно соответствует нормальному;
□ дисперсии признака в двух выборках примерно одинаковы (гомогенны).
Структура исходных данных: изучаемый признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух сравниваемых независимых выборок.
Ограничения: распределения признака и в той, и в другой выборке существенно не отличаются от нормального; в случае разной численности сравниваемых выборок их дисперсии статистически достоверно не различаются (проверяется по критерию F-Фишера — при вычислениях «вручную», по критерию Ливена — при вычислениях на компьютере).
Альтернатива методу: непараметрический критерий £/-Манна-Уитни — если распределение признака хотя бы в одной выборке существенно отличается от нормального и (или) дисперсии различаются статистически достоверно.
Формулы для эмпирического значения критерия ^-Стьюдента:
df = Nl+N2-2.
Формула (11.3) применяется для приближенных расчетов, для близких по численности выборок, а формула (11.4) — для точных расчетов, когда выборки заметно различаются по численности.
Дата: 2016-10-02, просмотров: 283.