Коэффициент корреляции Пирсона
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. Поэтому он называется также коэффициентом линейной корреляции Пирсона. Если же связь между переменными Х и У не линейна, то Пирсон предложил для оценки тесноты этой связи так называемое корреляционное Отношение

Коэффициент корреляции рассчитаем по формуле:

                                          (1)

или, другая форма представления:

                   (2)

В MS Excel коэффициент корреляции Пирсона вычисляется с помощью функции КОРРЕЛ(массив1;массив2).

Задача 1. 20 школьникам были даны тесты на наглядно-образное и вербальное мышление. Измерялось среднее время решения заданий теста в секундах. Специалиста интересует вопрос: существует ли взаимосвязь между временем решения этих задач? Переменная X – обозначает среднее время решения наглядно-образных, а переменная У – среднее время решения вербальных заданий тестов.

Решение. Представим исходные данные в виде таблицы 2, в которой введены дополнительные столбцы, необходимые для расчета по формуле (2).

№ испытуемого

Среднее время решение наглядно-образных заданий Среднее время решение вербальных заданий

XY

X2

Y2

Х

Y

1

19

10

190

361

100

2

32

20

640

1024

400

3

33

17

561

1089

289

4

44

28

1232

1936

784

5

28

27

756

784

729

6

35

31

1085

1225

961

7

39

20

780

1521

400

8

39

25

975

1521

625

9

44

35

1540

1936

1225

10

44

43

1892

1936

1849

11

24

10

240

576

100

12

37

28

1036

1369

784

13

29

13

377

841

169

14

40

31

1240

1600

961

15

42

40

1680

1764

1600

16

32

24

768

1024

576

17

48

45

2160

2304

2025

18

42

26

1092

1764

676

19

33

16

528

1089

256

20

47

36

1692

2209

1296

Сумма

731

525

20464

27873

15805

 

Построим корреляционное поле

Можно предположить, что связь между переменными близка к линейной.

Рассчитываем эмпирическую величину коэффициента корреляции по формуле (2)

 

Т.о., связь между временем решения наглядно-образных и вербальных положительная, высокая. Полученная прямо пропорциональная зависимость говорит о том, что чем выше среднее время решения наглядно-образных задач, тем выше среднее время решения вербальных и наоборот.

Для применения коэффициента корреляции Пирсона, необходимо соблюдать следующие условия:

1. Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.

2. Распределения переменных Х и У должны быть близки к нормальному.

3. Число варьирующих признаков в сравниваемых переменных X и У должно быть одинаковым.

 

Регрессионный анализ

Эмпирические математические модели. Математико-статистические идеи метода. Классификация многомерных методов по исходным предположениям о структуре данных. Линейная регрессия. Многофакторная линейная регрессия. Оценка уровней значимости коэффициентов регрессионного уравнения. Нелинейная регрессия.

Предположим, что при анализе некоторой экономической ситуации исследователь выдвигает предположение о существовании некоторой зависимости между двумя переменными. При этом одна их этих переменных считается зависимой (y) и рассматривается как функция от другой независимой переменной (х). На практике это соотношение, как правило, не является прямым: на переменную y кроме рассматриваемой детерминированной переменной х действует еще множество мелких факторов, которые по разным причинам не могут быть учтены в модели, но оказывают свое совокупное влияние на величину y. В эконометрическом анализе этот факт неточности соотношения между объясняющими и объясняемыми переменными признается путем явного включения в него случайного фактора, описываемого случайным остаточным членом u.

В общем случае эту зависимость можно представить в виде:

                                        (3.1)

где х – вектор наблюдений за независимой переменной (регрессор); ;

    y – вектор наблюдений за зависимой переменной (регрессанд); ;

 - некоторый набор параметров;

n – количество наблюдений;

u – вектор случайных величин (ошибок); .

Регрессионная зависимость между двумя переменными вида (3.1) называется простой регрессией (однофакторной регрессионной моделью).

Для точного описания регрессионного уравнения необходимо знать условный закон распределения зависимой переменной y при условии, что переменная Х примет значение х, т.е. Х=х. В статистической практике такую информацию получить, как правило, не удается, так как обычно исследователь располагает лишь выборкой пар значений ( xi, yi) ограниченного объема n. В этом случае речь может идти об оценке (приближенном выражении, аппроксимации) по выборке функции регрессии. Такой оценкой является выборочная линия регрессии:

                                        (3.2)

При этом, величина  интерпретируется как расчетное значение y, соответствующее наблюдаемой переменной х i. Тогда ошибку (погрешность)регрессии для каждого наблюдения можно представить так:

                                                        (3.3)

Существует несколько причин существования случайной стохастической:

1. Значение переменной y определяется не только введенной в рассмотрение переменной х. Существует и другой значимый фактор (один или несколько), оказывающий существенное влияние на величину регрессанта.

2. На величину влияют случайные факторы, которые невозможно учесть или значение которых не могут быть оценены количественно.

3. Допущены ошибки спецификации.

4. Возможны, также, ошибки при сборе и измерении исходной информации.

Очевидно, что чем меньше и, тем точнее выборочное уравнение регрессии (3.2) характеризует экономический процесс. 

 

Дата: 2019-03-05, просмотров: 232.