Пример, файл ch7data2.sav: 10991 студент из 169 учебных заведений (2 и 4-х летнее обучение). Для случаев с непостоянным интервалом наблюдения должна быть уравновешивающая переменная, представляющая собой величину интервала наблюдения (или общее число возможных проб). Таким образом, этот случай описывается так:
E(Y/t) = 1/t E(Y) = λ/t
Одноуровневая модель с одним предиктором выглядит так:
η ij = log ( ) = β0 j + β1 X iy + log ( ty )
т.е. в модель добавляется эффект этого уравновешивающего параметра.
Переменная смещения задается во вкладке Предикторы. Хокс (2010) отмечает, что ее нужно логарифмировать, чтобы она была в модели в той же метрике, что и ЗП (которая присутствует в модели в виде логарифма). Это всегда количественная переменная.
Оценим параметры такой модели:
η ij = β0 j + β1 ses + β2 gmmath + β3 male +β4 gmgpa + β5 twoyaer
Результат:
Параметр | B | Стд. Ошибка | Проверка гипотезы | Exp(B) | ||
Хи-квадрат Вальда | ст.св. | Знч. | ||||
(Константа) | -,263 | ,0263 | 100,287 | 1 | ,000 | ,769 |
ses | ,004 | ,0181 | ,043 | 1 | ,837 | 1,004 |
male | ,168 | ,0284 | 34,728 | 1 | ,000 | 1,182 |
gmmath | -,006 | ,0002 | 819,927 | 1 | ,000 | ,994 |
gmgpa | -,327 | ,0176 | 344,916 | 1 | ,000 | ,721 |
twoyear | ,195 | ,0290 | 44,961 | 1 | ,000 | 1,215 |
(Масштаб) | 1a |
Включая в уравнение разные члены, можно оценивать вероятность провала по курсу, например, для числа лет обучения:
ηij = -0,263+0,195= -0,068, возводим е в эту степень и получаем, что для девушек, учащихся по программе 2-х лет это будет 0,934. По сравнению с 4-х летним обучением это в 1,215 раз больше.
Используем в модели дополнительно переменную смещения – это логарифм числа лет обучения:
Параметр | B | Стд. Ошибка | Проверка гипотезы | Exp(B) | ||
Хи-квадрат Вальда | ст.св. | Знч. | ||||
(Константа) | -1,972 | ,0261 | 5726,878 | 1 | ,000 | ,139 |
ses | ,027 | ,0183 | 2,203 | 1 | ,138 | 1,028 |
male | ,158 | ,0286 | 30,460 | 1 | ,000 | 1,171 |
gmmath | -,007 | ,0002 | 893,082 | 1 | ,000 | ,993 |
gmgpa | -,264 | ,0162 | 265,136 | 1 | ,000 | ,768 |
twoyear | ,220 | ,0292 | 56,614 | 1 | ,000 | 1,245 |
(Масштаб) | 1a |
Получили достаточно большие различия, особенно в величине интерсепта (-0,263 против -1,972)с – поскольку оценку соответствующей частоты поделили на величину переменной смещения. Большинство других коэффициентов остались приблизительно такими же.
В одноуровневых моделях можно изменять метод оценки параметра масштаба (вкладка Оценивание), для это можно изменить метод оценки этого параметра, изменив его на хи-квадрат Пирсона, в этом случае программа сама вычислит этот параметр. Это может привести к более консервативным оценкам дисперсий и уровней значимости:
Параметр | B | Стд. Ошибка | 95% доверительный интервал Вальда | Exp(B) | |
Нижняя | Верхняя | ||||
(Константа) | -1,972 | ,0279 | -2,027 | -1,918 | ,139 |
ses | ,027 | ,0196 | -,011 | ,066 | 1,028 |
male | ,158 | ,0302 | ,099 | ,217 | 1,171 |
gmmath | -,007 | ,0003 | -,007 | -,006 | ,993 |
gmgpa | -,264 | ,0167 | -,296 | -,231 | ,768 |
twoyear | ,220 | ,0307 | ,159 | ,280 | 1,245 |
(Масштаб) | 2,558a |
При этом значения полученных коэффициентов не изменяется.
Этот параметр – 2,558, есть отношение оценки дисперсии (по Пирсону) к числу степеней свободы:
Статистики согласияa | |||
Значение | ст.св. | Значение/ст.св. | |
Уклонение | 22726,791 | 10985 | 2,069 |
Масштабированное уклонение | 8884,876 | 10985 | |
Хи-квадрат Пирсона | 28098,737 | 10985 | 2,558 |
Масштабированное значение хи-квадрат Пирсона | 10985,000 | 10985 | |
Log-правдоподобиеb,c | -17201,622 | ||
Скорректированный логарифм правдоподобияd | -6724,851 | ||
Информационный критерий Акаике (AIC) | 34415,243 | ||
Скорректированный информационный критерий Акаике (AICC) для выборки конечного объема | 34415,251 | ||
Информационный критерий Байеса (BIC) | 34459,072 | ||
Состоятельный информационный критерий Акаике (CAIC) | 34465,072 |
В процедуру GENLIN MIXED это тоже возможно для негативного биноминального распределения, где этот параметр может оцениваться.
Используем процедуру GENLIN MIXED:
- добавим в модель две переменные второго уровня – вузовские, воспринимаемое качество академизма в процессе обучения и качество объяснения материала на аудиторных занятиях;
- используем Пусссоновское распределение и лог-функцию связи.
- модель будет состоять из интерсепта + 5 внутришкольных предикторов + 2 междушкольных предиктора + 1 случайный эффект (случайная вариация интерсепта);
- во вкладке Вес и смещение укажем как переменную смещения число семестров;
- во вкладке Параметры конструкции укажем Использовать робастное оценива
Вариант модели с использованием отрицательного биноминального распределения дает очень похожие результаты и такие же значения информационных критериев.
Подчеркивается, что строгое использование информационных критериев достаточно условно, поскольку оценки модели основываются на оценке квази-отношения правдоподобия.
Дата: 2019-02-19, просмотров: 236.