Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. Поэтому он называется также коэффициентом линейной корреляции Пирсона. Если же связь между переменными Х и У не линейна, то Пирсон предложил для оценки тесноты этой связи так называемое корреляционное Отношение
Коэффициент корреляции рассчитаем по формуле:
(1)
или, другая форма представления:
(2)
В MS Excel коэффициент корреляции Пирсона вычисляется с помощью функции КОРРЕЛ(массив1;массив2).
Задача 1. 20 школьникам были даны тесты на наглядно-образное и вербальное мышление. Измерялось среднее время решения заданий теста в секундах. Специалиста интересует вопрос: существует ли взаимосвязь между временем решения этих задач? Переменная X – обозначает среднее время решения наглядно-образных, а переменная У – среднее время решения вербальных заданий тестов.
Решение. Представим исходные данные в виде таблицы 2, в которой введены дополнительные столбцы, необходимые для расчета по формуле (2).
№ испытуемого | Среднее время решение наглядно-образных заданий | Среднее время решение вербальных заданий | XY | X2 | Y2 |
Х | Y | ||||
1 | 19 | 10 | 190 | 361 | 100 |
2 | 32 | 20 | 640 | 1024 | 400 |
3 | 33 | 17 | 561 | 1089 | 289 |
4 | 44 | 28 | 1232 | 1936 | 784 |
5 | 28 | 27 | 756 | 784 | 729 |
6 | 35 | 31 | 1085 | 1225 | 961 |
7 | 39 | 20 | 780 | 1521 | 400 |
8 | 39 | 25 | 975 | 1521 | 625 |
9 | 44 | 35 | 1540 | 1936 | 1225 |
10 | 44 | 43 | 1892 | 1936 | 1849 |
11 | 24 | 10 | 240 | 576 | 100 |
12 | 37 | 28 | 1036 | 1369 | 784 |
13 | 29 | 13 | 377 | 841 | 169 |
14 | 40 | 31 | 1240 | 1600 | 961 |
15 | 42 | 40 | 1680 | 1764 | 1600 |
16 | 32 | 24 | 768 | 1024 | 576 |
17 | 48 | 45 | 2160 | 2304 | 2025 |
18 | 42 | 26 | 1092 | 1764 | 676 |
19 | 33 | 16 | 528 | 1089 | 256 |
20 | 47 | 36 | 1692 | 2209 | 1296 |
Сумма | 731 | 525 | 20464 | 27873 | 15805 |
Построим корреляционное поле
Можно предположить, что связь между переменными близка к линейной.
Рассчитываем эмпирическую величину коэффициента корреляции по формуле (2)
Т.о., связь между временем решения наглядно-образных и вербальных положительная, высокая. Полученная прямо пропорциональная зависимость говорит о том, что чем выше среднее время решения наглядно-образных задач, тем выше среднее время решения вербальных и наоборот.
Для применения коэффициента корреляции Пирсона, необходимо соблюдать следующие условия:
1. Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.
2. Распределения переменных Х и У должны быть близки к нормальному.
3. Число варьирующих признаков в сравниваемых переменных X и У должно быть одинаковым.
Регрессионный анализ
Эмпирические математические модели. Математико-статистические идеи метода. Классификация многомерных методов по исходным предположениям о структуре данных. Линейная регрессия. Многофакторная линейная регрессия. Оценка уровней значимости коэффициентов регрессионного уравнения. Нелинейная регрессия.
Предположим, что при анализе некоторой экономической ситуации исследователь выдвигает предположение о существовании некоторой зависимости между двумя переменными. При этом одна их этих переменных считается зависимой (y) и рассматривается как функция от другой независимой переменной (х). На практике это соотношение, как правило, не является прямым: на переменную y кроме рассматриваемой детерминированной переменной х действует еще множество мелких факторов, которые по разным причинам не могут быть учтены в модели, но оказывают свое совокупное влияние на величину y. В эконометрическом анализе этот факт неточности соотношения между объясняющими и объясняемыми переменными признается путем явного включения в него случайного фактора, описываемого случайным остаточным членом u.
В общем случае эту зависимость можно представить в виде:
(3.1)
где х – вектор наблюдений за независимой переменной (регрессор); ;
y – вектор наблюдений за зависимой переменной (регрессанд); ;
- некоторый набор параметров;
n – количество наблюдений;
u – вектор случайных величин (ошибок); .
Регрессионная зависимость между двумя переменными вида (3.1) называется простой регрессией (однофакторной регрессионной моделью).
Для точного описания регрессионного уравнения необходимо знать условный закон распределения зависимой переменной y при условии, что переменная Х примет значение х, т.е. Х=х. В статистической практике такую информацию получить, как правило, не удается, так как обычно исследователь располагает лишь выборкой пар значений ( xi, yi) ограниченного объема n. В этом случае речь может идти об оценке (приближенном выражении, аппроксимации) по выборке функции регрессии. Такой оценкой является выборочная линия регрессии:
(3.2)
При этом, величина интерпретируется как расчетное значение y, соответствующее наблюдаемой переменной х i. Тогда ошибку (погрешность)регрессии для каждого наблюдения можно представить так:
(3.3)
Существует несколько причин существования случайной стохастической:
1. Значение переменной y определяется не только введенной в рассмотрение переменной х. Существует и другой значимый фактор (один или несколько), оказывающий существенное влияние на величину регрессанта.
2. На величину влияют случайные факторы, которые невозможно учесть или значение которых не могут быть оценены количественно.
3. Допущены ошибки спецификации.
4. Возможны, также, ошибки при сборе и измерении исходной информации.
Очевидно, что чем меньше и, тем точнее выборочное уравнение регрессии (3.2) характеризует экономический процесс.
Дата: 2019-03-05, просмотров: 232.