Вернемся к нулевой и альтернативной гипотезам. Поскольку они не могут существовать одновременно (одно и то же событие не может быть одновременно случайным и неслучайным), то после их выдвижения начинается увлекательный и не лишенный риска процесс их проверки. Цель проверки — найти аргументы в пользу только одной из них, что автоматически определит судьбу другой.
Творчество начинается уже на этапе формулирования гипотез. Их неудачная формулировка в состоянии либо свести на нет усилия по их проверке, либо привести к неверным выводам по итогам этой проверки.
Вообще в статистике принято проверять только нулевую гипотезу. По результатам проверки она либо принимается, либо отвергается. В том случае, если нулевая гипотеза отвергается, на ее место приходит альтернативная гипотеза. Но при ближайшем рассмотрении все оказывается не так просто.
Допустим, два сторонника здорового образа жизни, увлекающиеся статистикой, затеяли спор по поводу того, эффективны ли диеты. Один из них утверждает, что диеты неэффективны и не влияют на вес (нулевая гипотеза), другой — что диеты в состоянии эффективно влиять на вес (альтернативная гипотеза).
После статистической проверки оказалось, что нет оснований принять нулевую гипотезу. Она отвергается и принимается альтернативная: диеты в состоянии эффективно влиять на вес. Казалось бы, сторонники диет могут торжествовать. Но на самом деле полученный результат всего лишь означает влияние диет на вес, которое может быть двояким. С одинаковой вероятностью диета может привести как к снижению, так и к увеличению веса. Вряд ли сторонники диет хотели получить такой результат.
Как видно, альтернативная гипотеза, не соответствующая характеру решаемой задачи, может привести к ошибочным выводам (диеты снижают вес) из статистически корректных результатов.
Если еще раз вернуться к злополучному покупателю обуви, то нулевую гипотезу можно сформулировать следующим образом:
Н0: Х= Y (обувь на правую ногу X равна обуви на левую ногу Y).
По отношению к данной нулевой гипотезе можно сформулировать три альтернативные гипотезы:
Н1а: Х> Y (обувь на правую ногу больше обуви на левую ногу).
Н1 b:Х< Y (обувь на правую ногу меньше обуви на левую ногу).
Н1с: Х≠ Y (обувь на правую ногу не равна обуви на левую ногу).
В результате мы получим три отличающиеся друг от друга пары гипотез, результаты проверки которых могут не совпасть друг с другом. Например, по результатам проверки для Н0 и Н1а мы можем получить основания для отказа от нулевой гипотезы, но по результатам проверки Н0 и Н1с этих оснований может не быть.
Что касается риска при проверке гипотез, то он присутствует всегда и связан с тем, что принимать решения приходится в условиях неопределенности. У нас нет возможности примерить всю обувь из вызывающей подозрение партии или опросить всех подростков по поводу возраста начала курения. Мы уже говорили о том, что решение относительно популяции приходится принимать на основе изучения ее незначительной части (выборка). Здесь неизбежны риски и ошибки, а сам процесс проверки статистических гипотез становится процессом вероятностным, поскольку все решения приходится принимать с определенной долей вероятности.
В статистике решение о том, отвергнуть нулевую гипотезу или нет, всегда сопровождается указанием меры риска, роль которой играет значение вероятности возможной ошибки.
Таблица 1.9 поможет понять, какие ошибки возможны при проверке гипотез.
Таблица 1.9
Возможные ошибки при проверке статистических гипотез
| На самом деле
| ||
| Н0 верна | Н1 верна | |
Принятое решение
| Н0 неверна (принимается Н1) | Отклоняется верная нулевая гипотеза, и принимается неверная альтернативная гипотеза (ошибка первого рода) | Принимается верная альтернативная гипотеза |
Н1 неверна (принимается Н0) | Принимается верная нулевая гипотеза | Отклоняется верная альтернативная гипотеза, и принимается неверная нулевая гипотеза (ошибка второго рода) |
Мы вновь вернулись к тому, о чем говорили раньше. Поскольку нулевая гипотеза говорит о случайном характере проверяемых результатов, то отвергнуть верную нулевую гипотезу и принять неверную альтернативную гипотезу означает ошибочно объявить случайное событие неслучайным. Такую ошибку мы выше называли ошибкой первого рода.
Отклонение верной альтернативной гипотезы (она говорит о неслучайном характере наших результатов) и принятие неверной нулевой гипотезы означает ошибочно объявить неслучайное событие случайным. Такая ошибка была выше названа ошибкой второго рода.
Вероятность ошибки первого рода (вероятность отклонить верную нулевую гипотезу) была названа уровнем значимости (α). Именно значение уровня значимости определяет меру риска при проверке гипотез. Поскольку цена ошибки первого рода, как правило, значительно выше цены ошибки второго рода (принятие неверной нулевой гипотезы), то значение уровня значимости стремятся выбирать как можно меньшим (обычно от α = 0,001 до α = 0,05).
Вероятность ошибки второго рода обычно обозначается как β. Между α (вероятность ошибки первого рода, или уровень значимости) и β (вероятность ошибки второго рода) существуют сложные взаимоотношения. К сожалению, стремление уменьшить значение α приводит к росту значения β. Это еще раз подтверждает мысль о том, что при проверке статистических гипотез всегда есть риск принятия неверного решения. Если исследователь бросает все силы на устранение ошибок первого рода, возрастает риск ошибок второго рода (неслучайные события будут объявляться случайными). Например, стремление уменьшить число ошибочных направлений нормальных детей в школу для умственно отсталых может обернуться возрастанием числа случаев, когда дети, нуждающиеся в такой школе, будут продолжать обучение в школе для нормальных детей.
МОЛОДЕЖЬ И НАРКОТИКИ,
Дата: 2018-12-21, просмотров: 524.