Одна из самых важных характеристик распределения – это мера разброса отдельных значений относительно среднего. Известны восемь различных мер этой характеристики, четыре из них широко используются в геологических прикладных науках.
1. Первая мера разброса значений относительно среднего – это размах распределения R:
R = max – min.
2. Вторая мера это дисперсия. Дисперсия – это среднее значение квадратов отклонений всех возможных значений случайной величины от истинного среднего совокупности μ:
σ2 = 1/n*∑(xi – μ)2
Этой формулой рассчитывают истинную дисперсию совокупности, обозначаемую символом σ2. Выборочная дисперсия обозначается символом - S2. Если пункты наблюдения, в которых отбирались пробы для измерения полезного компонента, были распределены равномерно и случайным образом на исследуемой территории и пробы отбирались из совокупности с нормальным распределением, то выборочная дисперсия S2 является лучшей оценкой истинной дисперсии совокупности - σ2. Однако для расчета выборочной дисперсии используется несколько видоизмененная формула:
S2=1/n-1 * ∑ (xi-χ)2 , или
S2=1/n-1 *[∑ xi2 –1/n(∑ χ)2], или
S2=1/n*(n-1) *[n∑ xi2 – (∑ χ)2].
По этой формуле дисперсия определяется как среднее значение от суммы квадратов отклонений от выборочного среднего и появляется новая величина – (n-1), требующая пояснений. Так как при изучении залежей полезных ископаемых и других природных объектов, мы никогда не знаем истинного среднего совокупности μ, а для расчета дисперсии используем оценку истинного среднего - χ, то в этом случае мы занижаем оценку истинной дисперсии. Это связано с тем, что при суммировании квадратов отклонений от выборочного среднего мы находим минимальное значение из всех возможных. При симметричном распределении отклонения от среднего в одну и в другую сторону равны и если, не возводить отклонения в квадрат, то сумма их будет равна нулю. Но если истинное среднее не совпадает с оценочным средним, то симметрия нарушается и рассчитывается большая величина дисперсии. Что бы улучшить оценку дисперсии вместо n в формулу вводится n-1. Введение в формулы вместо количества данных в выборке - n, - n-1, n-2 и так далее – это общее правило в статистике, которое называется учетом степеней свободы, а количество данных с поправкой (n-1, n-2 и так далее) – называется числом степеней свободы. Это правило применяется, когда при расчетах в формулах вместо истинных значений (параметров), используются оценочные значения (статистики), то есть, если в какой-либо формуле, например, используются 2 оценки параметров, то от количества данных отнимают 2 и так далее.
3. Третья мера – стандартное отклонение. Для того чтобы получить параметр, который характеризует разброс данных относительно среднего значения и обладает той же размерностью, что и исходные данные можно воспользоваться третьей мерой разброса – стандартным отклонением или еще эту меру называют средне квадратичным отклонением. Она рассчитывается как квадратный корень из дисперсии и обозначается символом – σ, а стандартное отклонение выборки обозначается символом - S. Небольшое значение стандартного отклонения показывает, что результаты опробования залежи полезного ископаемого группируются около центрального значения и наоборот большое значение стандартного отклонения показывает, что результаты опробования рассеяны относительно среднего значения. Стандартное отклонение иллюстрирует изменчивость характеристик залежи, чем больше стандартное отклонение, тем меньше у нас шансов правильно оценить такие характеристики, как запасы полезных компонентов залежи. Очень полезное свойство нормального распределения заключается в том, что площадь под кривой распределения в пределах любого интервала может быть точно вычислена. Так более 2/3 результатов (68.27%) попадает в интервал равный двум стандартным отклонениям (плюс и минус стандартное отклонение от истинного среднего μ). Примерно 95% всех значений заключается в интервале от -2 до +2 стандартных отклонений от среднего μ и более 99% значений содержится в интервале от -3 до +3 стандартных отклонений от среднего μ. Это отражено на рисунке, расположенном ниже.
Рис. Площади стандартного нормального распределения, заключенные в пределах интервалов, кратных стандартному отклонению.
Это свойство нормального распределения называют правилом - 3-х σ. Из этого правила следует очень важный вывод о том, что если новое измерение какого либо свойства превышает величину, равную 3-м σ, то можно это значение отнести к аномальным значениям. То есть, если говорить формальным языком, то этот результат измерения с очень маленькой вероятностью относится к изучаемой совокупности. Это позволяет эффективно выявлять возможные аномальные значения среди постоянно изменяющихся показаний приборов.
4. Четвертая мера – это коэффициент вариации. Его часто используют при разведке и оценке месторождений полезных ископаемых. Коэффициент вариации определяется как отношение стандартного отклонения на выборочное среднее и умноженное на 100%. Важным свойством коэффициента вариации является его безразмерность, поэтому он так широко и используется в различных методических руководствах, регламентирующих проведение геологоразведочных работ:
VS = (S/χ)*100.
Остальные меры разброса значений относительно среднего, такие как коэффициент осцилляции, среднее линейное отклонение, относительное линейное отклонение и геометрическая дисперсия используются реже.
5. Пятая мера - коэффициент осцилляции, он рассчитывается по формуле:
VR= (R/χ)*100, где R = max – min.
6. Шестая мера – среднее линейное отклонение, рассчитывается по формуле:
d = (∑|xi - χ|)/n.
7. Седьмая мера – это относительное линейное отклонение, рассчитывается по формуле:
Vd = (d/χ)*100.
8. Восьмая мера – геометрическая дисперсия. Она рассчитывается по следующей формуле:
S2G = n-1√П2(xi/χG).
Практическое значение геометрической дисперсии станет ясным при рассмотрении асимметричных распределений.
Дата: 2018-12-28, просмотров: 354.