Корреляционный и регрессионный анализ.
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методом корреляционного и регрессионного анализа.

Термин «корреляция» произошел от латинского «correlation» - соотношение. Термин «регрессия» также латинского происхождения и означает обратное движение. В настоящее время в этот термин вкладывается совершенно другой смысл.

Две случайные величины имеют корреляционную связь, если математическое ожидание одной из них изменяется в зависимости от изменения другой. Метод математической статистики, изучающий связи между явлениями, называется корреляционным анализом. Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи.

Существуют следующие виды корреляционной связи.

1) Относительно числа переменных, включенных в корреляционную модель, различают:

Ø парную корреляционную связь двух величин;

Ø множественную корреляцию.

2) Относительно характера корреляционной связи различают:

Ø положительную корреляцию;

Ø отрицательную корреляцию.

3) Относительно формы связи различают:

Ø линейную корреляцию;

Ø нелинейную корреляцию.

Не все факторы, влияющие на экономические процессы, являются случайными величинами. Поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.

Задачами регрессионного анализа являются

а) установление формы зависимости;

б) определение функции регрессии и на этой основе установление характера и степени влияния аргументов на функцию.

Существуют следующие виды регрессии.

1) Относительно числа переменных, включенных в регрессионную модель различают:

Ø парную регрессию;

Ø множественную регрессию.

2) Относительно характера регрессионной связи различают:

Ø положительную регрессию;

Ø отрицательную регрессию.

3) Относительно формы зависимости различают:

Ø линейную регрессию;

Ø нелинейную регрессию.

Сущность корреляционного и регрессионного методов анализа состоит в усреднении значений включенных в модель переменных, которые имеют количественное выражение.

Корреляционный и регрессионный анализ тесно связаны между собой. В практике современного статистического анализа они не могут существовать друг без друга. Это и понятно, поскольку оценка степени и силы связи без последующего моделирования взаимосвязи не представляет особого интереса, а само моделирование зависимости осуществляется на основе использования различных показателей корреляции как для предварительного анализа информации, так и для характеристики адекватности модели.

Рассмотрим выделенные этапы более подробно:

1. Формулировка экономической задачи. На этом этапе формируются теоретические гипотезы о зависимости экономических явлений, устанавливаются объект и период исследования. В корреляционном анализе здесь же выявляются переменные, связь между которыми подлежит оценке.

В регрессионном анализе выявляются причинно-следственные отношения между переменными на основе изложения сущности изучаемого экономического явления.

2. Сбор и анализ исходной информации. В соответствии с целью исследования устанавливают, какой вид статистического наблюдения следует использовать. Здесь важно отметить, что выводы, полученные в результате анализа выборочной совокупности, с предельной вероятностью можно распространить на всю генеральную совокупность при условии, что выборка репрезентативна (т.е. в выборочной совокупности достоверно отражены все тенденции, имеющие место в генеральной совокупности).

Анализ исходной информации осуществляется с целью определения ее качества, от которого во многом зависят результаты как корреляционного, так и регрессионного анализа. Исходная информация должна быть достоверна, иметь количественное выражение и быть достаточной по количеству.

В регрессионном анализе в соответствии с сформулированной целью исследования и после анализа исходной информации производится выбор зависимой и объясняющей переменных, которые необходимо включить в модель.

3. Проверка предпосылок корреляционного и регрессионного анализа. После того как собранные исходные данные будут очищены от аномальных наблюдений, следует провести проверку, насколько оставшаяся информация удовлетворяет предпосылкам для использования статистического аппарата при построении моделей, так как даже незначительные отступления от этих предпосылок часто сводят к нулю получаемый эффект. В связи с этим вероятностно-статистическое решение любой экономической задачи должно основываться на подробном осмыслении исходных математических понятий и предпосылок, корректности и объективности сбора исходного статистического материала, постоянном сочетании и тесной связи экономического и математико-статистического анализа.

Для применения корреляционного анализа необходимо, чтобы все рассматриваемые переменные были случайными и имели нормальный закон распределения. Причем выполнение этих двух условий необходимо только при вероятностной оценке выявленной тесноты связи.

4. Экономическая интерпретация результатов осуществляется на основе содержательного истолкования полученных в ходе анализа результатов.

 

Компонентный анализ.

В зависимости от конкретных задач, решаемых в экономике, каждый из методов факторного анализа, в том числе метод главных компонент, имеют свои достоинства и недостатки. Компонентный анализ считается статистическим методом. Однако, есть другой подход, приводящий к компонентному анализу, но не являющийся статистическим. Этот подход связан с получением наилучшей проекции точек наблюдения в пространстве меньшей размерности. В статистическом подходе задача будет заключаться в выделении линейных комбинаций случайных величин, имеющих максимально возможную дисперсию. Он опирается на ковариационную и корреляционную матрицу этих величин. У этих двух разных подходов есть общий аспект: использование матрицы вторых моментов как исходной для начала анализа.

Методы факторного анализа позволяют решать следующие четыре задачи.

Первая заключается в «сжатии» информации до обозримых размеров, т.е. извлечения из исходной информации наиболее существенной части за счет перехода от системы исходных переменных к системе обобщенных факторов. При этом выявляются неявные, непосредственно не измененные, но объективно существующие закономерности, обусловленные действием как внутренних, так и внешних причин.

Вторая сводится к описанию исследуемого явления значительно меньшим числом m обобщенных факторов (главных компонент) по сравнению с числом исходных признаков. Обобщенные факторы – это новые единицы измерения свойств явления, непосредственно измеряемых признаков.

Третья – связана с выявлением взаимосвязи наблюдаемых признаков с вновь полученными обобщенными факторами.

Четвертая заключается в построении уравнения регрессии на главных компонентах с целью прогнозирования изучаемого явления.

Компонентный анализ может быть также использован при классификации наблюдений (объектов). В экономических исследованиях стремление полнее изучить исследуемое явление приводит к включению в модуль все большего числа исходных переменных, которые зачастую отражают одни и те же свойства объема наблюдения. Это приводит к высокой корреляции между переменными, т.е. к явлению мультиколлинеарности. При этом классические методы регрессионного анализа оказываются малоэффективными. Преимущество уравнения регрессии на главные компоненты в том, что последние не коррелированны между собой.

Главные компоненты являются характеристическими векторами ковариационной матрицы.

Множество главных компонент представляет собой удобную систему координат, а их вклад в общую дисперсию характеризует статистические свойства главных компонент. Из общего числа главных компонент для исследования, как правило, оставляют наиболее весомых, т.е. вносящих максимальный вклад в объясняемую часть общей дисперсии.

Таким образом, несмотря на то, что в методе главных компонент надо для точного воспроизведения корреляции и дисперсии между переменными найти все компоненты, большая доля дисперсии объясняется небольшим числом главных компонент. Кроме того, можно по признакам описать факторы, а по факторам (главным компонентам) описать признаки.



Дата: 2019-07-30, просмотров: 195.