Виды статистических критериев. Порядок проверки статистических гипотез с помощью статистических критериев.
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

titkova-matmetody.pdf с. 64

t – критерий Стьюдента, используется для установления сходства-различия средних

арифметических значений в двух выборках или в более общем виде, для установления сходства-

различия двух эмпирических распределений;

F – критерий Фишера, используется для установления сходства-различия дисперсий в

двух независимых выборках;

Q – критерий Розенбаума, используется для оценки различий между двумя выборками по

уровню какого-либо признака, количественно измеренного.

T – критерий Вилкоксона, применяется для сопоставления показателей, измеренных в

двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить

направленность изменений, и их выраженность.

χ2-критерий Пирсона, используется:

1) для сопоставления эмпирического распределения признака с теоретическим –

равномерным, нормальным или каким-то иным;

2) для сопоставления двух, трех или более эмпирических распределений одного и того же

признака.

titkova-matmetody.pdf с. 15

Статистический критерий – это решающее правило, обеспечивающее надежное

поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью″

(Суходольский Г.В.). Статистические критерии обозначают также метод расчета определенного

числа и само это число.

В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо,

чтобы эмпирическое значение критерия превышало критическое, в некоторых критериях

придерживаются противоположного правила. Эти правила оговариваются в описании каждого

критерия.

В некоторых случаях расчетная формула критерия включает в себя количество

наблюдений в исследуемой выборке, обозначаемое как n. В этом случае эмпирическое значение

критерия одновременно является тестом для проверки статистических гипотез. По специальной

таблице определяется, какому уровню статистической значимости различий соответствует данная

эмпирическая величина.

В большинстве случаев, одно и то же эмпирическое значение критерия может оказаться

значимым или незначимым в зависимости от количества наблюдений в выборке (n) или от так

называемого количества степеней свободы, которое обозначается как ν.

Число степеней свободы. Число степеней свободы равно числу классов вариационного

ряда минус число условий, при которых он был сформирован. К числу таких условий относятся:

объем выборки, средние и дисперсии.

Если мы расклассифицировали наблюдения по классам какой-либо номинативной шкалы и

подсчитали количество наблюдений в каждой ячейке классификации, то мы получаем так

называемый частотный вариационный ряд. Единственное условие, которое соблюдается при его

формировании – объем выборки n.

Допустим у нас три класса: ″Умеет работать на ПК – умеет выполнять лишь определенные

операции – не умеет работать″.

Выборка состоит из 50 человек. Если в первом классе – 20 человек, во втором классе – 20

человек, то в третьем должны оказаться 10 человек. Мы ограничены только одним условием –

объемом выборки. Мы не свободны в определении количества испытуемых в третьем классе,

″свобода″ простирается только на первые два класса

ν=с-1=3-1=2

Аналогичным образом, если бы у нас была классификация из 10 разрядов или классов, то

мы были бы свободны только в 9 и т.д.

Зная n и/или число степеней свободы, по специальным таблицам можно определить

критические значения критерия и сопоставить с ними полученное эмпирическое значение.

Среди возможных статистических критериев выделяют: односторонние и двусторонние,

параметрические и непараметрические, более и менее мощные.

Односторонние и двусторонние. Понятие одностороннего либо двустороннего критерия

связано с формулировкой гипотез. Если ″нулевая″ гипотеза формулируется о равенстве (Х1 = Х2),

то для проверки используется двусторонний критерий. Если же ″нулевая″ гипотеза формулируется

о неравенстве, то возможны три варианта:

1) если Х1≠Х2, то используется двусторонний критерий;

2) если Х1>Х2 или Х1<Х2, то односторонний критерий.

Параметрические критерии – это некоторые функции от параметров совокупности, они

служат для проверки гипотез об этих параметрах или для их оценивания. Параметрические

критерии включают в формулу расчета параметры распределения, т.е. средние и дисперсии.

Непараметрические критерии – это некоторые функции от функций распределения или

непосредственно от вариационного ряда наблюдавшихся значений изучаемого случайного

явления. Они служат только для проверки гипотез о функциях распределения или рядах

наблюдавшихся значений.

Непараметрические критерии не включают в формулу расчета параметров распределения

и основанные на оперировании частотами или рангами.

И те, и другие критерии имеют свои преимущества и недостатки.

Параметрические критерии могут оказаться несколько более мощными, чем

непараметрические, но только в том случае, если признак измерен по интервальной шкале и

нормально распределен. Лишь с некоторой натяжкой мы можем считать данные, представленные в

стандартизованных оценках, как интервальные. Кроме того, проверка распределения «на

нормальность» требует достаточно сложных расчетов, результат которых заранее не известен.

Может оказаться, что распределение признака отличается от нормального, и нам так или

иначе все равно придется обратиться к непараметрическим критериям.

Непараметрические критерии лишены всех этих ограничений и не требуют таких

длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены

лишь в одном – с их помощью невозможно оценить взаимодействие двух или более условий или

факторов, влияющих на изменение признака.

Уровни статистической значимости.Уровень значимости – это вероятность того, что мы

сочли различия существенными, а они на самом деле случайны.

Когда мы указываем, что различия достоверны на 5% уровне значимости, или при р≤0,05,

то мы имеем ввиду, что вероятность того, что они недостоверны, составляет 0,05.

Если же мы указываем, что различия достоверны на 1% уровне значимости, или при

р≤0,01, то имеем ввиду, что вероятность того, что они все-таки недостоверны равна 0,01.

Иначе, уровень значимости – это вероятность отклонения нулевой гипотезы, в то время

как она верна.

Вероятность такой ошибки обычно обозначается как α. Поэтому правильнее указывать

уровень значимости: α≤0,05 или α≤0,01.

Если вероятность ошибки – это α, то вероятность правильного решения равна: 1–α. Чем

меньше α, тем больше вероятность правильного решения.

В психологии принять считать низшим уровнем статистической значимости 5%-ный

уровень, а достаточным 1%-ный. В таблицах критических значений обычно приводятся значения

критериев, соответствующих уровням значимости р≤0,05 и р≤0,01 иногда для р≤0,001. Для

некоторых критериев в таблицах указан точный уровень значимости их разных эмпирических

значений. Например, для значения критерия Фишера ϕ=1,56 р=0,06.

До тех пор пока уровень значимости не достигнет р=0.05, мы еще не имеем право

отклонить нулевую гипотезу. Будем придерживаться следующего правила отклонения гипотезы

об отсутствии различий (Н0) и принятии гипотезы о статистической достоверности различий (Н1).

Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для

них устанавливаются обратные соотношения.

Для облегчения принятия решения можно вычерчивать ″ось значимости″.

Критические значения критерия обозначены как Q0,05 и Q0,01, эмпирическое значение

критерия как Qэмп. Оно заключено в эллипс.

Вправо от критического значения Q0,01 простирается ″зона значимости″ – сюда попадают

эмпирические значения Q, которые ниже Q0.01 и, следовательно, значимые.

Влево от критического значения Q0.05

простирается ″зона незначимости″, – сюда попадают

эмпирические значения Q, которые ниже Q0,05 и, следовательно, незначимы.

В нашем примере, Q0,05 =6; Q0,01=9; Qэмп=8.

Эмпирическое значение критерия попадает в область между Q0,05 и Q0,01. Это ″зона

неопределенности″: мы уже можем отклонить гипотезу о недостоверности различий (Н0), но еще

не можем приять гипотезы об их достоверности (Н1).

Практически, можно считать достоверными уже те различия, которые не попадают в зону

незначимости, сказав, что они достоверны при р≤0,05.

Мощность критерия. Важнейшей характеристикой любого статистического критерия

является его мощность.

Мощность критерия – это его способность выявлять различия, если они есть. Иначе, это

его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

Вероятность ошибки второго рода статистического критерия обозначим как β, тогда

величина 1–β будет мощностью критерия. Ясно, что мощность может принимать любые значения

от 0 до 1. Чем ближе мощность к единице, тем эффективнее критерий.

Мощность определяется эмпирическим путем. Одни и те же задачи могут быть решены с

помощью разных критериев, при этом обнаруживается, что некоторые критерии позволяют

выявить различия там, где другие оказываются неспособными это сделать.

Основанием для выбора критерия может быть не только его мощность, но и другие его

характеристики, а именно:

а) простота;

б) более широкий диапазон исследования (по отношению к данным, определенным по

номинативной шкале, или по отношению к большим n);

в) применимость по отношению к неравным по объему выборкам;

г) большая информативность результатов.

с. 7 (99)

Статистический критерий (Statistical Test) — это инструмент определения уровня статистической значимости. (z-критерий, критерий t-Стьюдента). Как следует из логики проверки статистических гипотез, в качестве основы для применения статистических критериев используют теоретические распределения, для условия, когда верна нулевая гипотеза.

Число степеней свободы (degrees of free­dom — обозначается как df)— это количество возможных направлений измен­чивости признака. Как правило, число степеней свободы линейно зависит от объема выборки, от числа признаков или их градаций — чем больше эти пока­затели, тем больше число степеней свободы.

Назначение критерия — проверка статистической гипотезы путем опреде­ления/ьуровня значимости (вероятности того, что Но верна).

Выбор критерия определяется проверяемой статистической гипотезой.

Критерий включает в себя:

П формулу расчета эмпирического значения критерия по выборочным ста­тистикам; D правило (формулу) определения числа степеней свободы;

теоретическое распределение для данного числа степеней свободы;

правило соотнесения эмпирического значения критерия с теоретичес­
ким распределением для определения вероятности того, что Но верна.

Для проверки статистических гипотез применяются различные критерии. При этом одному теоретическому распределению могут соответствовать раз­ные формулы критериев — в зависимости от проверяемой статистической гипотезы. Но принцип проверки является общим для всего этого многообра­зия: вычисленное по формуле эмпирическое значение критерия сопоставля­ется с теоретическим распределением для заданного числа степеней свобо­ды, что позволяет определить вероятность того, что Но верна.

ПРОВЕРКА ГИПОТЕЗ С ПОМОЩЬЮ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ

Множество разработанных статистических критериев (или статистических тестов) соответствует множеству возможных формулировок статистических гипотез. Выбор критерия представляет собой отдельную проблему. При обработке данных на компьютере при помощи статистической про­граммы (например, SPSS) исследователю достаточно указать программе, ка­кой критерий (метод, тест) необходимо применить к заданной выборке ис­ходных данных. Далее программа сама вычисляет эмпирическое значение критерия и сопоставляет его с теоретическим распределением. В качестве ре­зультата исследователь получает значение p-уровня значимости, наряду с эм­пирическим значением критерия и числом степеней свободы.

Когда расчеты производятся «вручную», исследователь совершает более сложную последовательность действий для проверки гипотезы, включающую применение специальных таблиц критических значений критерия:

Выбор критерия в зависимости от вида исходных данных и статистичес­
кой гипотезы: теоретического распределения, формул расчета эмпири­
ческого значения критерия и числа степеней свободы.

Расчет по исходным данным (или по имеющимся статистикам) эмпи­
рического значения критерия и числа степеней свободы.

Применение «Таблицы критических значений критерия» позволяет оп­
ределить значение p-уровня для данного числа степеней свободы.

Таблица критических значений содержит значения (квантили) теоретичес­кого распределения, соответствующие наиболее важным — критическим зна­чениям /ьуровня (0,1; 0,05; 0,01 и т. д.) для различных чисел степеней свободы. p-уровепь значимости по вычисленному эмпирическому значению критерия при помощи таких таблиц определяется следующим образом. Для данного числа степеней свободы по таблице определяются ближайшие критические значения и p-уровни, им соответствующие. Далее значение р-уровня опреде­ляется в виде неравенства по правилу, которое демонстрируется на рис. 7.2 (значимость возрастает слева направо, в соответствии с убыванием p-уровня):

П если эмпирическое значение критерия (Кэ) находится между двумя кри­тическими значениями, то p-уровень меньше того критического р, ко­торое находится левее;

П если К^ находится левее крайнего левого критического значения (обычно это соответствует критическому^ = 0,1, реже — р = 0,05), то ^-уровень больше, чем крайнее правое критическое значение р;

О если Кэ находится правее крайнего правого критического значения, то /ьуровень меньше крайнего правого критического р.

Для разных критериев возможны разные соотношения между р-уровнем и величиной критических его значений. Для большинства критериев (t, F, χ2} и др.) — чем больше значение критерия, тем выше статистическая значимость (меньше p-уровень). Но для некоторых критериев зависимость обратная. Например, U-Манна-Уитни или Т-Вилкоксона убывают по мере увеличения уровня значимости (уменьшения p-уровня). Тем не менее, правило остается общим, в соответствии со схемой на рис. 7.2. Например, если tэ находится между t0,1 и г005 (т. е. /0,i < t3< tQ$5), тор < 0,1. И если 1/э находится между UQl и £/о,о5 (т.е- ^о,о5 < &>< £/o,i)>to/K 0,1. Если же эмпирическое значение попадает левее критического для р = 0,1 (/э < tQ>ь но С/э > Uo^), то уровень значимости определяется как/j > 0,1.






Дата: 2016-10-02, просмотров: 231.