Глава 3. Обработка одноуровневых моделей

Поможем в ✍️ написании учебной работы

Имя

Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Нажимая кнопку "Продолжить", я принимаю политику конфиденциальности

Проверка эффектов модели

Иcточник

Тип III

Хи-квадрат Вальда ст.св. Знч. (Константа) 306,910 1 ,000 time 11,021 1 ,001

Зависимая переменная: readprof

Модель: (Константа), time

Оценки параметров
Параметр	B	Стд. Ошибка	95% доверительный интервал Вальда		Проверка гипотезы			Exp(B)	95% доверительный интервал Вальда для Exp(B)
Параметр	B	Стд. Ошибка	Нижняя	Верхняя	Хи-квадрат Вальда	ст.св.	Знч.	Exp(B)	Нижняя	Верхняя
(Константа)	,838	,0478	,744	,931	306,910	1	,000	2,311	2,104	2,538
time	-,055	,0165	-,087	-,022	11,021	1	,001	,947	,916	,978
(Масштаб)	1
Зависимая переменная: readprof Модель: (Константа), time

В=0,838 – логарифм odds интерсепта (т.е. опорной категории - 0) – это процент испытуемых в первом (опорном!) измерении, имеющих оценки, отличные от 0. Экспонента в этой степени=2,311 – это означает, что в начале исследования число испытуемых, показавших категорию 1, в 2,311 раза больше, чем категорию 0.

Величина В для ковариаты= -0,055, показывает, что зависимая переменная убывает во времени (0, 1, 2 и 3 – повторные измеренеия) на 5,5% каждый раз.

Можно в модель включать и фиксированные факторы, а также эффекты межфакторных взаимодействий.

Те же модели с повторными измерениями можно строить и используя процедуру GENLIN MIXED. Она дает дополнительную возможность кроме эффектов, рассматриваемых на всей популяции интереса, оценивать многоуровневые модели и влияние вложенных факторов.

Полезно заказать распечатку компонентов дисперсии – для того, чтобы оценить вклад фактора индивидуальных различий. Для этого оценку случайного параметра – интерсепта, делят на его сумму со случайной дисперсии логистического распределения:

В/(В+3,29).

В случае построения 3-х уровневых моделей с повторными измерениями в качестве фактора третьего уровня задаются повторные измерения.

При описании структуры данных в Дополнительно появляются и другие варианты структуры корр. матриц: например, Масштабированная – это означает постоянство дисперсий, но отсутствие корреляций между ее элементами.

Если в моделе всего один й фактор – интерсепт, то при выборе типа ковариации случайных эффектов нужно задать Компоненты дисперсии, что соответствует идентичной ковариационной матрицы для случайного интерсепта.

Изучение медиаторных эффектов в одноуровневых моделях.

Для этого строят две модели: 1) с медиатором и базовым предиктором, а затем – 2) модель, оценивающую зависимость самого предиктора от медиатора; полученные коэффициенты перемножают – это и есть оценка медиаторного эффекта, его значимость оценивают по формуле.

Двухуровневые модели

Используем процедуру GENLIN MIXED, 4 фиксированными факторами и робастным оцениванием коэффициентов – это одноуровневая модель. Объект в данной модели – это школы.

Далее оценим 2-х уровневую необусловленную модель:

η _ij = log ( ) = β₀ _j

(т.е. с одним интерсептом, варьирующим на уровне школ - 2 –ом уровне):

Это означает, что по всем школам вероятность провала курса для учеников – 0,496.

Кроме того, установлена достоверная вероятность вариации (0,220) такой вероятности между школами (изменчивость на втором уровне):

Из этого можно оценить вероятность провала по 1 курсу:

P(Y=1) = (e^-0,496)(0,496)/1! = 0,302

Включим в модель фиксированные факторы и рассмотрим их влияние на 2-ом уровне – с учетом вариации по школам:

η _ij = log ( ) = β _0j + b1SES +b2male + b3gmmath + b4gmage

Интерпретация:

1. Интерсепт показывает, что средняя девочка со средним или высоким семейным доходом и со средним возрастом и средним рейтингом по математике имеет вероятность завалить курс 0,346.

2. Все предикторы оказывают значимое влияние на ЗП.

3. Дисперсия между школами также значима.

Обработка с помощью отрицательного биноминального распределения дает немного лучшую подгонку.

Включим в модель еще один случайный фактор – SES, и рассмотри его возможную вариацию по школам. Оказалось, что эта вариация не значима:

Добавление в модель межуровневые взаимодействия – т.е. одни факторы связаны с уровнем индивидуальности испытуемого, другие – с контекстом самой школы

В модель добавляются два школьных фактора (стаж и наличие лицензии у учителя) и их взаимодействие с SES. Эти факторы обеспечивают новый источник вариации – факторов перового уровня (наклон регрессионной прямой) на втором уровне (разные интерсепты).

Для оценки связи между интерсептом и наклоном, как третьего компонента ковариационной матрицы, выберем тип неструктурированной ковариационной матрицы.

UN (1,1) – вариация интерсептов на втором уровне,

UN (2,1) – вариация факторов 1 и 2 уровней, т.е. наклона и интерсепта,

UN (2,2) – вариация SES на втором уровне.

Глава 3. Обработка одноуровневых моделей.

Используется процедура GENLIN – Обобщенные линейные модели. Предполагается, что испытуемые случайно выбраны из одной совокупности и нет их какой-либо группировки более высокого уровня.

Здесь в соответствии с типом данных нужно выбрать тип модели или самостоятельно указать тип распределение зависимой переменной (ЗП) и вид функции связи (эта функция делает распределение эмпирических оценок линейным).

Для номинальных переменных нужно указать опорную категорию – ту категорию, относительно которой в рамках модели оценивается отношение правдоподобия – вероятность появления данной категории относительно опорной категории.

Если ЗП представляет собой частоту появления некоторого события, то нужно либо указать дополнительную переменную, в которой дано число наблюдений (например, проб в серии) или указать число этих проб.

При определении предикторов можно задать Смещение ( Offset ) – это член регрессионной модели (он не оценивается, по умолчанию = 1, его величина добавляется к линейному предиктору ЗП; полезен в распределении Пуассона), который отражает вес или значимость зависимой переменной (например, два неуда за семестр или за весь курс обучения). В распределении Пуассона эта переменная, в которой задано общее число наблюдений, на котором эмпирически регистрируются частоты интересующих исследователя событий, например, число неудов по курсу в период обучения; в этом случае переменная смещения – это число курсов или число семестров.

В модель можно включать как факторные эффекты, так и межфакторные

Задавая взаимодействия, можно строить нестинг-модели, т.е. когда мы не допускаем взаимодействия одного фактора с другим, и он рассматривается как вложенный.

Во вкладке «Оценивание» можно выбрать метод оценки параметров модели и исходные значения для оценки параметров модели. Выбор Метода включает 3 варианта: расчет по Фишеру, метод Ньютона-Рафсона или гибридный метод (в нем сначала реализуется метод Фишера, а затем другой – в зависимости от сходимости и достижения максимума итераций).

Метод оценки параметра масштаба позволяет сделать выбор из 3-х вариантов: максимальное правдоподобие, фиксированное значение, отклонение, хи-квадрат Пирсона. В зависимости от модели возможны разные методы. Максимальное правдоподобие модели достигается соответствием параметра масштаба и эффектов модели. Важно: эта опция не работает, если имеет место биноминальное, негативно-биноминальное, мультиноминальное или Пуасоновское распределения. При выборе отклонения и хи-квадрата Пирсона параметр масштаба оценивается в соответствии со значениями этих статистик. Можно задать и фиксированное значение этого параметра.

Исходные значения – процедура сама автоматически вычисляет начальные значения параметров модели или они могут быть заданы из файла.

Ковариационная матрица – два варианта оценки параметров вариативности: на основе модели или робастная оценка. В моделях логистической регрессии оценка происходит на основе принципа независимости наблюдений. В случае повторных измерений или кластерной структуры данных при расчете стандартных ошибок робастный метод учитывает зависимость данных. Выбор оценивания на основе модели подходит к данным, предполагающим нормальное распределение и отсутствие кластеризации, когда и среднее, и ковариации определяются точно. При нарушении этих допущений стандатная ошибка переоценивается, поэтому более подходит робастный метод (он же – Хьюбера/Белый/Сандвич), позволяющий скорректировать оценку ковариации даже при несоответствии дисперсии и функции связи. Робастная оценка – не панацея от всех нарушений модели, например, при небольших выбоках может наблюдаться смещение оценок. Поэтому, лучше использовать расчет на основе модели или делать оба варианта.

Статистики – это установки различных эффектов модели и вывода результатов. Эффекты модели включают выбор:

· Типа анализа (или расчет суммы квадратов): 3 типа – 1 (в модели предполагается некоторая упорядоченность предикторов), 3 (применяется чаще всего ) и комбинация 1 и 3.

· Статистики хи-квадрат для проверки модели: два варианта – по Вальду или отношение правдоподобия. Статистики на основе хи-квадрат заменяют обычное оценивание нулевой гипотезы на основе нормального распределения. Тест Вальда сходен с t-тестом, это квадрат z-статистики, и подчиняется распределению хи-квадрат с одной степенью свободы для больших выборок. На малых выборках он не хорош, для них более подходит оценка отношения правдоподобия.

· Функция логорифма отношения правдоподобия – можно менять отображение формата этой функции.

Вкладка «Оценки маргинальных средних» – распечатка групповых и межгрупповых средних (только для количественных данных).

Дата: 2019-02-19, просмотров: 358.

12 3 4 5 6 7 8 Следующая ⇒