Корреляционное отношение удовлетворяет двойному неравенству
и
.
Если
и
, то признаки
и
не связаны между собой корреляционной зависимостью.
Если корреляционное отношение
, то между признаками
и
существует функциональная зависимость.
Выборочный коэффициент линейной корреляции
по абсолютной величине не больше корреляционных отношений, то есть
и
.
Если
- это условные варианты признака
, и
- это условные варианты признака
, то
и
.
Как показывает первое свойство, корреляционное отношение может принимать значения из промежутка от 0 до 1, причем, чем ближе значение корреляционного отношения к 1, тем теснее связь между рассматриваемыми признаками, и чем ближе это значение к 0, тем слабее связь между рассматриваемыми признаками.
Замечание: Как было сказано выше, корреляционное отношение служит мерой тесноты любой связи, в том числе и линейной формы. В этом состоит преимущество корреляционного отношения. Но так же оно имеет и недостатки: а) оно определяют только тесноту связи, но не указывают на направление связи, так как они вычисляются с помощью средних квадратических отклонений, которые всегда положительны; б) оно не позволяет судить на сколько близко расположены точки, найденные по данным наблюдений, к кривой определенного вида, например к параболе, гиперболе и т.д. Это объясняется тем, что при определении корреляционного отношения форма связи во внимание не принимается.
Пример. Распределение признаков
и
приведено в следующей корреляционной таблице
| X Y | 0 | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | ny |
| -2 | 1 | 2 | 1 | 4 | ||||||
| -1 | 1 | 3 | 3 | 1 | 8 | |||||
| 0 | 2 | 4 | 4 | 2 | 12 | |||||
| 1 | 1 | 5 | 5 | 1 | 12 | |||||
| 2 | 3 | 3 | 6 | |||||||
| nx | 4 | 7 | 5 | 4 | 2 | 4 | 5 | 7 | 4 | 42 |
Найти корреляционные отношения
и
, и сравнить их с соответствующим коэффициентом линейной корреляции.
Решение.
Найдем групповые средние:
;
;
;
;
;
;
;
;
;
.
;
;
;
.
Для вычисления общих средних построим расчетные таблицы.
|
|
|
|
|
|
| 0 | 4 | 0 | 0 | 1,75 | 0 |
| 10 | 7 | 70 | 700 | 0,714 | 50 |
| 20 | 5 | 100 | 2000 | -0,2 | -20 |
| 30 | 4 | 120 | 3600 | -1,25 | -150 |
| 40 | 2 | 80 | 3200 | -2 | -160 |
| 50 | 4 | 200 | 10000 | -1,25 | -250 |
| 60 | 5 | 300 | 18000 | -0,2 | -60 |
| 70 | 7 | 490 | 34300 | 0,714 | 350 |
| 80 | 4 | 320 | 25600 | 1,75 | 560 |
| ∑ | 42 | 1680 | 97400 | - | 320 |
|
|
|
|
|
|
| -2 | 4 | -8 | 16 | 40 | -320 |
| -1 | 8 | -8 | 8 | 40 | -320 |
| 0 | 12 | 0 | 0 | 40 | 0 |
| 1 | 12 | 12 | 12 | 40 | 480 |
| 2 | 6 | 12 | 24 | 40 | 480 |
| ∑ | 42 | 8 | 60 | - | 320 |
Тогда:
;
;
;
;
;
;
.
, следовательно, линейной связи между признаками
и
нет.
Для нахождения корреляционных отношений найдем средние квадратические отклонения для условных средних
и
по формулам
,
.
Получим
;
.
Тогда
;
.
Корреляционное отношение
показывает, что признак
зависит от влияния признака
, а отношение
показывает, что признак
не зависит от влияния признака
.
Пример решения типовой задачи
В таблице представлено распределение 200 драгоценных изделий по количеству примесей в них Х (%) и стоимости Y (тыс. руб):
| Х \ У | 3-9 | 9-15 | 15-21 | 21-27 | 27-33 | Более 33 | итого |
| 20-30 | 2 | 5 | 2 | 9 | |||
| 30-40 | 4 | 8 | 4 | 3 | 19 | ||
| 40-50 | 4 | 10 | 20 | 10 | 44 | ||
| 50-60 | 5 | 36 | 23 | 6 | 70 | ||
| 60-70 | 12 | 11 | 11 | 34 | |||
| 70-80 | 6 | 10 | 16 | ||||
| 80-90 | 8 | 8 | |||||
| Итого | 14 | 27 | 55 | 54 | 35 | 15 | 200 |
Необходимо:
1. Вычислить условные средние
и
и построить эмпирические линии регрессии.
2. предполагая, что между переменными Х и Y существует линейная корреляционная зависимость:
а) найти уравнения прямых регрессии и построить их графики на одном чертеже с эмпирическими линиями регрессии;
б) вычислить коэффициент корреляции на уровне значимости 0,05, оценить его значимость и сделать вывод о тесноте и направлении связи между переменными Х и Y;
Решение:
Найдем условные средние по формулам
и
.
,
- середины соответствующих интервалов.
Найдем середины интервалов и запишем в таблицу:
| Х \ У | 6 | 12 | 18 | 24 | 30 | 36 | итого |
| 25 | 2 | 5 | 2 | 9 | |||
| 35 | 4 | 8 | 4 | 3 | 19 | ||
| 45 | 4 | 10 | 20 | 10 | 44 | ||
| 55 | 5 | 36 | 23 | 6 | 70 | ||
| 65 | 12 | 11 | 11 | 34 | |||
| 75 | 6 | 10 | 16 | ||||
| 85 | 8 | 8 | |||||
| Итого | 14 | 27 | 55 | 54 | 35 | 15 | 200 |





2а). Для нахождения уравнений регрессии вычисляем необходимые суммы. Для удобства их вычислений составим расчетные таблицы.
|
|
|
|
|
|
| 6 | 14 | 84 | 504 | 80,714 | 6778,8 |
| 12 | 27 | 324 | 3888 | 66,852 | 21675,6 |
| 18 | 55 | 990 | 17820 | 54,812 | 54261,9 |
| 24 | 54 | 1296 | 31104 | 51,11 | 66238,56 |
| 30 | 35 | 1050 | 31500 | 42,714 | 44847,6 |
| 36 | 15 | 540 | 19440 | 40,33 | 21778,2 |
| ∑ | 4284 | 104256 | - | 215580 |
|
|
|
|
|
|
| 25 | 9 | 225 | 5625 | 30 | 6750 |
| 35 | 19 | 665 | 23275 | 25,895 | 17223,5 |
| 45 | 44 | 1980 | 89100 | 28,909 | 57239,82 |
| 55 | 70 | 3850 | 211750 | 20,571 | 79198,35 |
| 65 | 34 | 2210 | 143650 | 17,823 | 39388,83 |
| 75 | 16 | 1200 | 90000 | 9,75 | 11700 |
| 85 | 8 | 680 | 57800 | 6 | 4080 |
| ∑ | 10810 | 621200 | - | 215580 |






Тогда уравнение линейной регрессии у на х, будет иметь вид
,
или 
Тогда уравнение линейной регрессии х на у, будет иметь вид
,
или 
Ниже представлены графики полученных уравнений регрессии совместно с соответствующей эмпирической регрессией


2б). Находим коэффициент корреляции

Так как
, то связь между рассматриваемыми признаками высокая, и так как
, то связь обратная.
Проверим гипотезу о значимости коэффициента корреляции, то есть проверим гипотезу
и
.
Воспользуемся t - критерием Стьюдента, найдем
и
:
.
Так как
,
, то
.
Таким образом, так как
, то коэффициент корреляции значимо отличается от нуля. Связь тесная и обратная.
2в). Для нахождения корреляционных отношений найдем средние квадратические отклонения для условных средних
и
по формулам
,
.
Получим
;
.
Тогда
;
.
Корреляционное отношение
показывает, что признак
зависит от влияния признака
, а отношение
показывает, что признак
зависит от влияния признака
.
Дата: 2019-05-28, просмотров: 303.