Основные статистические характеристики
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Метеорология имеет дело с огромными массивами наблюдений, которые нужно анализировать для выяснения закономерностей, существующих в атмосферных процессах. Поэтому в метеорологии широко применяются статистические методы анализа больших массивов наблюдений. Применение мощных современных статистических методов помогает яснее представить факты и лучше обнаружить связь между ними.

Среднее значение временного ряда рассчитывается по формуле

 

Ḡ = ∑Gi / N

 

где 1< i <n, N - число данных (объем выборки).

В метеорологии используется средняя специального типа, которую называют нормой.

Дисперсия показывает разброс данных относительно среднего значения и находится по формуле

 

Ϭ² = ∑ (Gi - Ḡ) ² / N, где 1< i <n

 

Величина, называемая среднеквадратическим отклонением, представляет собой квадратный корень из дисперсии.

 

Ϭ = ∑ (Gi - Ḡ) ² / N, где 1< i <n

 

Все большее применение в метеорологии находит наиболее вероятное значение случайной переменной - мода.

Также для характеристики метеовеличин используют асимметрию и эксцесс. Если среднее значение больше моды, то распределение частот называют положительно асимметричным. Если среднее значение меньше моды, то отрицательно асимметричным. Коэффициент асимметрии вычисляется по формуле

A = ∑ (Gi - Ḡ) ³ / NϬ³, где 1< i <n

Асимметрия считается малой, если коэффициент асимметрии |A|≤0.25. Асимметрия умеренная, если 0,25<|А|>0.5. Асимметрия большая, если 0,5<|А|>1,5. Исключительно большая асимметрия, если |А|>1,5. Если |А|>0, то распределение имеет правостороннюю асимметрию, если |А|<0, то левостороннюю асимметрию. Для распределения частот, имеющих одинаковые значения средней, асимметрии могут отличаться величиной эксцесса

 

Е = (∑ (Gi - Ḡ) ⁴) - 3/NϬ⁴, где 1< i <n

 

Эксцесс считается малым, если |E|≤0.5; умеренным, если 1≤|E|≤3 и большим, если |E|>3. Если - 0.5≤Е≤3, то эксцесс приближается к нормальному.

Коэффициент корреляции - это величина, показывающая взаимосвязь между двумя коррелируемыми рядами.

Формула коэффициента корреляции имеет следующий вид:

 

R = ∑ ( (Xi-X) * (Yi-Y)) / ϬxϬy

 

где X и Y - средние величины, Ϭx и Ϭy - среднеквадратические отклонения.

Свойства коэффициента корреляции:

Коэффициент корреляции независимых величин равен нулю.

Коэффициент корреляции не изменяется от прибавления к x и y

каких-либо постоянных (неслучайных) слагаемых, а также не

изменяется от умножения величин x и y на положительные числа

(постоянные).

Коэффициент корреляции не изменяется при переходе от x и y к нормированным величинам.

Диапазон изменения от - 1 до 1.

Необходимо делать проверку надежности наличия связи, надо оценить значимость отличия коэффициента корреляции от нуля.

Если для эмпирического R произведение │R│√N-1 окажется больше некоторого критического значения, то с надежностью S можно утверждать, что коэффициент корреляции будет достоверен (достоверно отличатся от нуля).

Корреляционный анализ позволяет установить значимость (неслучайность) изменения наблюдаемой, измеряемой случайной величины в процессе испытаний, позволяет определить форму и направление существующих связей между признаками. Но ни коэффициент корреляции, ни корреляционное отношение не дают сведений о том, насколько может изменяться варьирующий, результативный признак при изменении связанного с ним факториального признака.

Функция, позволяющая по величине одного признака при наличии корреляционной связи находить ожидаемые значения другого признака, называется регрессией. Статистический анализ регрессии называется регрессионным анализом. Это более высокая ступень статистического анализа массовых явлений. Регрессионный анализ позволяет предвидеть Y по признаку X:

 

Yx-Y= (Rxy* Ϭy* (X-X)) / Ϭx (2.1)

Xy-X= (Rxy* Ϭx* (Y-Y)) / Ϭy (2.2)

 

где X и Y - соответствуют среднему, Xy и Yx - частные средние, Rxy - коэффициент корреляции.

Уравнения (2.1) и (2.2) можно записать в виде:

 

Yx=a+by*X (2.3)

Xy=a+bx*Y (2.4)

 

Важной характеристикой уравнений линейной регрессии является средняя квадратическая погрешность. Она имеет следующий вид:

 

для уравнения (2.3) Sy= Ϭy*√1-R²xy (2.5)

для уравнения (2.4) Sx= Ϭx*√1-R²xy (2.6)

 

Ошибки регрессии Sx и Sy позволяют определить вероятную (доверительную) зону линейной регрессии, в пределах которой находится истинная линия регрессии Yx (или Xy), т.е. линия регрессии генеральной совокупности.



Дата: 2019-11-01, просмотров: 207.