Мультиноминальные данные - это три и более неупорядоченных категории.
Основа метода – мультиноминальная логистическая регрессия. Можно обрабатывать как номинальные, так и порядковые данные, а спомощью порядковой логистической регрессии можно обрабатывать только порядковые данные.
Выбираем мультиноминальное распределение и обязательно указываем опорную категорию для ЗП. При оценке интерсепта ЗП будет оцениваться правдоподобие остальных исходов относительно этого - референтного.
При оперделении фиксированных факторов (в отличии от процедуры «Обобщеннные уравнения оценки») их можно задавать как метрические переменные(!), а не номинальные - группирующие.
Во всех примерах при оценке одноуровневых моделей с мультиноминальными данными (без случайного фактора – только интерсепт, или включая его) в качестве «Типа ковариации случайных эффектов» было установлено - «Компонет дисперсии».
Фактически, включение случайного фактора в модель означает проверку гипотезы о том, что наклон регрессионных прямых по уровням данного фактора случайно варьирует.
Модель с порядковыми данными предсказывает вероятность определенного исхода (и большего чем он по рангу) быть равным или меньшим значения i-ого ранга. Из этого следует, что позитивный наклон регрессионной прямой показывает тенденцию Y уменьшаться с уменьшением X. А негативный – увеличиваться. Это может вызвать смущение при интерспретации результатов.
В СПСС предполагается, что значения ЗП упорядочены по возрастанию (assenging). Нужно четко понимать, относительного какого ранга как референтного оценивается вероятность функции иметь значение быть равным или меньше этого референтного значения. Отрицательный к-т предполагает, что при уменьшении величины предиктора возрастает вероятность ЗП быть выше значения нижележащего ранга возрастает, т.е. для нее увеличивается коммулятивная вероятность быть рангом ниже. Опция desenging позволяет реверсивовать оценки при обратном упорядочении рангов. Важна также и кодировка факторной пременнной: референтным значением факторной номинальной переменной (0 или 1, 1 или 2, соответственно) будет в СПСС будет последнее значение – т.е. оцениваться вероятность исхода для случаев 0 или 1, соответственно. Например: 0 – женщины, а 1 – мужчины; положительный к-т будет означать, что большие значения ЗП вероятны для женщин по сравнению с мужчинами.
Чтобы избежать недоразумения во многих программах (СПСС, Мплюс, а в HLM этого не делается) значение функции (линейный предиктор) просто умножается на -1, чтобы восстановить направление регрессионной зависимости так, чтобы положительный к-та соответствовал увеличению вероятности для наивысшего ранга (категории), а отрицательный - уменьшению.
При обработке смешанных моделей с порядковыми данными при определении ЗП нужно выбрать мультиноминальное распределение и логистическую функцию.
В таблице результатов «Параметры ковариации» можно посмотреть значимость каждого компонента общей дисперсии. Например, значимость изменения интерсепта по той переменной, которая задает основную группировку испытуемых, в приводимом примере – это школы.
При включении в модель фиксированных факторов соответствующие переменные могут быть как номинальными (категориальными), так и количественными (т.е. как ковариаты).
Если используем в качестве предиктора (или фиксированного фактора) категориальную порядковую переменную, то оценки будут делаться для КАЖДОГО ранга (нулевой ранг будет использоваться как референтный).
Для обработки порядковых моделей может также использоваться функция связи «Дополняющая log-log». Это полезно в том случае, когда вероятность оцениваемого ЗП события мала или велика – т.е. когда ранги распределены неравномерно.
Дата: 2019-02-19, просмотров: 225.