Множественный корреляционный анализ состоит в оценке корреляционной матрицы генеральной совокупности по выборке и определении на ее основе оценок частных и множественных коэффициентов корреляции и детерминации.
Парный и частный коэффициенты корреляции характеризуют тесноту линейной зависимости между двумя переменными соответственно на фоне действия и при исключении влияния всех остальных показателей, входящих в модель. Диапазон изменения этих коэффициентов [-1;1].
Множественный коэффициент корреляции характеризует тесноту связи между одной переменной (результативной) и остальными, входящими в модель. Диапазон изменения этого коэффициента [0;1].
Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации; он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием остальных, входящих в модель.
Дополнительная задача корреляционного анализа (основная – в регрессионном) – оценка уравнения регрессии.
Исходной для анализа является матрица X размерности (n´k), которая представляет собой n наблюдений для каждого из k факторов. Оцениваются: вектор средних X ср, вектор среднеквадратических отклонений S и корреляционная матрица R:
X ср=(x1ср, x2ср,…, xjср,…, xkср);
S=(s1, s2, …, sj, …, sk);
1 | r12 | … | r1k | |
R= | r21 | 1 | … | r2k |
… | … | … | … | |
rk1 | rk2 | … | 1 |
где rjl=[S(xij-xjср)(xil-xlср)]/(nsjsl), j,l=1,2,…,k;
sj=([S(xij - xjср)2]/n)0,5, i=1…n;
xil – значение i-того наблюдения j-того фактора.
Кроме того, находятся оценки частных и множественных коэффициентов корреляции любого порядка. Например, частный коэффициент корреляции порядка k-2 между факторами X1 и X2 равен
r12/3,4,…,k=-R12/(R11R22)0,5,
где Rjl – алгебраическое дополнение элемента r12 матрицы R.
Множественный коэффициент корреляции порядка k-1 фактора X1 (результативного признака) определяется по формуле
r1/2,3,…,k= r1=(|R12|/R11)0,5,
где |R12| – определитель матрицы R.
Значимость парных и частных коэффициентов корреляции проверяется по t-критерию Стьюдента. Наблюдаемое значение критерия находится по формуле
tнабл=(n-l-2)0,5r/(1-r2)0,5,
где r – оценка коэффициента, l – порядок коэффициента корреляции (число фиксируемых факторов).
Коэффициент корреляции считается значимым (т.е. гипотеза H0: r=0 отвергается с вероятностью ошибки a), если |tнабл|>tкр, определяемого по таблицам t-распределения (Приложение 1) для заданного a и n=n-l-2.
Значимость множественного коэффициента корреляции (или его квадрата – коэффициента детерминации) определяется по F-критерию. Наблюдаемое значение, например, для r21/2,…k, находится по формуле
Fнабл= [r21/2,…k/(k-1)]/[(1-r21/2,…k)/(n-k)].
Множественный коэффициент корреляции считется значимым, если Fнабл>Fкр(a, k-1, n-k), где Fкр определяется по таблице F-распределения (Приложение 1) для заданных a, n1=k-1 и n2=n-k.
Множественный регрессионный анализ – это статистический метод исследования зависимости случайной величины y от переменных xj, рассматриваемых как неслучайные величины независимо от истинного закона распределения xj. Предполагается, что y имеет нормальный закон распределения с условным мат. ожиданием y=j(x1,x2,…,xk), являющимся функцией от аргументов xj, и с постоянной, не зависящей от аргументов дисперсией s2. Наиболее часто встречаются линейные уравнения регрессии вида y=b0+b1x1+b2x2+…+bjxj+…+bkxk, линейные относительно неизвестных параметров bj (j=0,1,…,k) и аргументов xj.
Коэффициент регрессии bj показывает, на какую величину в среднем изменится результативный признак y, если переменную xj увеличить на единицу ее измерения, т.е. является нормативным коэффициентом.
В матричной форме регрессионная модель имеет вид
Y=X b+e,
где Y – случайный вектор-столбец размерности [n´1] наблюдаемых значений результативного признака (y1,y2,…,yn); X – матрица размерности [n´ (k+1)] наблюдаемых значений аргументов. Элемент матрицы xij рассматривается как неслучайная величина (i=1,2,…,n; j=0,1,2,…,k; xоi=1); b – вектор-столбец размерности [(k+1)´1] неизвестных коэффициентов регрессии модели; e – случайный вектор-столбец размерности [n´1] ошибок наблюдений (остатков). Компоненты вектора независимы между собой, имеют нормальный закон распределения с нулевым мат. ожиданием и неизвестной дисперсией. На практике рекомендуется, чтобы n превышало k как минимум в три раза.
Дата: 2019-05-28, просмотров: 193.