Выборка из двумерной генеральной совокупности
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Системой случайных величин (СВ) называют совокупность СВ, характеризующих состояние рассматриваемой системы или исход данного опыта.

Обозначение:

 – n-мерная СВ.

Каждую из величин  называют составляющей или компонентой.

Различают дискретные и непрерывные многомерные СВ: дискретные – если составляющие этих величин дискретны, и непрерывные – когда составляющие этих величин непрерывны.

Полной характеристикой ССВ является ее закон распределения, который может иметь разные формы: функция распределения, плотность распределения, таблица вероятностей отдельных значений случайного вектора и т.д.

Рассмотрим двумерную СВ , возможные значения которой – пары чисел .

Закон распределения дискретной двумерной СВ  может быть задан таблицей распределения (матрицей распределения) (таблица 3), элемент которой, стоящий на пересечении i-той строки и j-того столбца, равен вероятности того, что двумерная случайная величина  имеет значение :

.

Таблица 3

    

 

События  при  образуют полную группу, поэтому сумма всех вероятностей  равна единице:

.

Зная матрицу распределения двумерной ДСВ можно найти законы распределения каждой из составляющих. Чтобы найти вероятность того, что одномерная случайная величина Х или Y примет значение  или , следует сложить все вероятности , стоящие в строке с номером i или столбце с номером j.

Две случайные величины Х и Y называются независимыми, если закон распределения каждой из них не зависит от того, какое возможное значение приняла другая случайная величина. В противном случае величины Х и Y называются зависимыми.

При изучении двумерных случайных величин рассматриваются числовые характеристики одномерных составляющих Х и Y - математические ожидания и дисперсии: . Также рассматриваются условные математические ожидания и условные дисперсии. Например, условным математическим ожиданием одной из случайных величин, входящих в систему , называется ее математическое ожидание, вычисленное при условии, что другая случайная величина приняла определенное значение.

Условное математическое ожидание случайной величины Y при заданном , т.е. функция

,

называется функцией регрессии случайной величины Y относительно случайной величины Х (у на х).  График этой функции называется линией регрессии у на х.

Аналогично определяется функция регрессии х на у,

Числовые характеристики системы не исчерпываются числовыми характеристиками случайных величин, входящих в систему. Может иметь место взаимная связь между случайными величинами, составляющими систему. Для ее описания вводят в рассмотрение числовую характеристику – корреляционный момент.

Корреляционным моментом (или ковариацией)  случайных величин Х и Y называется математическое ожидание произведения отклонения этих величин от своих математических ожиданий:

.

Эта характеристика помимо рассеяния величин Х и Y описывает еще и связь между ними. Если случайные величины Х и Y независимы друг от друга, то корреляционный момент  равен нулю. Обратное утверждение неверно, т.е. из равенства нулю корреляционного момента  не следует независимость случайных величин Х и Y.

Формула для вычисления корреляционного момента дискретных случайных величин:

.

Для характеристики связи между величинами Х и Y в чистом виде переходят от момента  к безразмерной характеристике - коэффициенту корреляции случайных величин Х и Y:

,

где  и  – средние квадратические отклонения величин Х и Y.

Коэффициент корреляции принимает значения на отрезке :

.

Если случайные величины Х и Y независимы, то их коэффициент корреляции равен нулю.

Случайные величины, для которых корреляционный момент, а значит и коэффициент корреляции, равен нулю, называется некоррелированными (несвязанными).

Две независимые случайные величины всегда являются некоррелированными. Обратное утверждение не всегда верно, могут быть случаи, когда случайные величины являются некоррелированными, но зависимыми.

Если , где n – число двумерных случайных величин, то связь между случайными величинами Х и Y достаточно вероятна.

Рассмотрим выборку из двумерной генеральной совокупности, отождествляемой с системой двух случайных величин . В результате n независимых наблюдений получили n пар чисел:

.

Статистический материал сводят в корреляционную таблицу (таблица 4):

Таблица 4

    
 
 
    n

 

где  - частоты наблюденных пар значений признаков , , n – объем выборки.

Если по данным корреляционной таблицы построить законы распределения для каждой компоненты X и Y, то числовые характеристики выборки можно найти по формулам:

Дата: 2019-02-19, просмотров: 185.