Ряды с большим числом наблюдений
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

       Ряды с большим числом наблюдений требуют определённого порядка работы. Рассмотрим таблицу 2.2, в которой приведены результаты 160-ти измерений значений предела текучести алюминиевых прутков, изготовленных в одинаковых условиях.

       Для обозримости полученных результатов, значения случайной величины сначала располагают в порядке их возрастания и затем подсчитывают частоты отдельных наблюдений. В результате имеем таблицу 2.3, в которой приведен упорядоченный ряд наблюдений.

Упорядоченный ряд даёт наглядную картину полученных результатов. В частности, видно какие наблюдения встречаются чаще других. Имея упорядоченный ряд, можно по результатам измерений построить полигон частот (см. фиг.2.1).

Таблица 2.2.

Результаты 160-ти измерений предела текучести алюминиевых прутков

 

171 177 175 177 174 174 173 183 183 178
179 178 176 167 171 174 175 177 173 172
169 176 178 182 175 172 177 177 179 167
168 173 167 178 175 167 160 177 182 179
168 176 177 176 168 168 171 183 168 175
175 159 162 173 181 179 166 170 178 177
167 167 171 184 173 176 175 167 167 174
181 181 172 173 178 182 173 166 174 188
168 177 170 165 164 176 181 189 168 175
179 187 168 171 173 190 169 177 170 161
165 181 179 185 170 178 178 183 169 173
173 186 172 177 172 164 168 182 184 185
173 179 181 185 173 173 173 187 179 175
173 170 177 178 184 185 174 177 180 183
167 168 171 189 178 177 172 170 176 181
182 185 176 179 179 182 173 170 173 190

                       

       Полигон частот представляет собой линию с резкими изломами. Для анализа результатов желательно уменьшить число интервалов путём объединения ближайших значений признака. При этом полагают, что оптимальное количество интервалов колеблется от 6-ти до 20-ти.     Действуя указанным способом, имеем интервальный ряд распределения, который приведен в табл.2.3.

       Рассмотрим способ вычисления средней арифметической и дисперсии с помощью условной средней.

       В качестве условной средней  выбирают середину интервала с наибольшей частотой. Затем вычисляют разности между серединами интервалов и условной средней и делят их на ширину интервала d. В нашем случае ; ширина интервала d=3 [MПa].

       Средняя арифметическая и дисперсия следующие: 

; .

       На фиг. 2.2,а представлен полигон частот интервального ряда распределения. Здесь частоты относятся к серединам интервалов.

       Вместо полигона частот часто вычерчивают ступенчатую кривую, называемую гистограммой. Для этого на интервалах, отложенных по оси абсцисс, строят прямоугольники, высота которых пропорциональна частотам интервалов.

       Гистограмма рассматриваемого интервального ряда изображена на фиг.2.2,б.

 

Таблица 2.3

Упорядоченный ряд наблюдений, составленный по результатам 160-ти

измерений предела текучести прутков

 

частота, частота, частота, частота,
159 1 167 9 175 9 183 5
160 1 168 10 176 8 184 3
161 1 169 3 177 14 185 5
162 1 170 7 178 10 186 1
163   171 6 179 10 187 2
164 2 172 6 180 1 188 1
165 2 173 17 181 7 189 2
166 2 174 6 182 6 190 2

Сумма 166

 

 

 
h


x, МПа

 

Фиг.2.1. Полигон частот предела текучести алюминиевых прутков.

 

h
h
x, МПа
x, МПа

 

а)                                                                            б)

 

Фиг.2.2. Полигон частот (a) и гистограмма частот (б) интервального ряда распределения

 

 

Таблица 2.4

Интервальный ряд распределения (  - теоретическая частота)

 

Интервалы Середина интервала Частота ; Относительная частота % Накопленная частота Относительная накопленная частота
156,5-159,4 158 1; 1 0,6 1 0,6
159,5-162,4 161 3; 3 1,9 4 2,5
162,5-165,4 164 4; 7 2,5 8 5,0
165,5-168,4 167 21; 14 13,1 29 18,1
168,5-171,4 170 16; 22 10,0 45 28,1
171,5-174,4 173 29; 28 18,1 74 46,2
174,5-177,4 176 31; 29 19,4 105 65,6
177,5-180,4 179 21; 25 13,1 126 78,7
180,5-183,4 182 18; 17 11,3 144 90,0
183,5-186,4 185 9; 9 5,6 153 95,6
186,5-189,4 188 5; 4 3,1 158 98,7
189,5-192,4 191 2; 1 1,3 160 100,0

Нормальное распределение

 

       Для основательного изучения вопроса рекомендуется учебное пособие: Гмурман В. Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1972. -368 с.

       Напомним, что меру объективной возможности того, что произойдёт событие А, называют его вероятностью Р(А). Если провести N испытаний и определить количество К исходов с осуществлением события А, то величина  будет частностью, которая является оценкой вероятности Р(А).

       Дискретная случайная величина задаётся перечнем её возможных значений и их вероятностей. Такой способ задания не является общим, так как его нельзя применить для непрерывных случайных величин.

       С целью задания любых типов случайных величин вводят интегральные и дифференциальные функции распределения.

       Пусть х - действительное число. Вероятность события, состоящего в том, что случайная величина Х примет значение меньше х обозначим через F(x). Тогда интегральной функцией распределения называют функцию F(x), определяющую для каждого значения х вероятность того, что случайная величина Х примет значение меньше х, т.е. . Полученное равенство можно истолковать так: F(x) есть вероятность того, что случайная величина примет значение, которое изображается на числовой оси точкой, лежащей левее точки х.

       Случайная величина непрерывна, если её интегральная функция распределения F(x) непрерывно дифференцируема.

       Из определения интегральной функции как вероятности вытекают следующие свойства: значения интегральной функции принадлежат отрезку ; F(x) - неубывающая функция, т.е. ; если возможные значения случайной величины принадлежат интервалу , то:

F(x)=0 при ; F(x)=1 при .

Следствия: вероятность того, что случайная величина примет значение, заключённое в интервале , равна приращению интегральной функции на этом интервале, т.е. ; вероятность того, что непрерывная случайная величина Х примет одно определённое значение, равна нулю; если возможные значения непрерывной случайной величины расположены на всей оси х, то справедливы следующие предельные соотношения:

       Функцию

где P  - вероятность попадания случайной величины Х в интервал  называем плотностью распределения непрерывной случайной величины.

       Дифференциальной функцией распределения f(x) (или плотностью вероятности р(х)) является первая производная от интегральной функции, т.е. . Следовательно, интегральная функция это первообразная для соответствующей дифференциальной функции.

Теорема. Вероятность того, что непрерывная случайная величина Х примет значение, принадлежащее интервалу (а,b), следующая:

Результат теоремы означает: вероятность того, что непрерывная случайная величина принимает значение, принадлежащее интервалу (a, b), равна площади криволинейной трапеции, ограниченной осью х, кривой распределения f(x) и прямыми x=a и х=b.

Пример. Дана дифференциальная функция случайной величины Х:

Найти вероятность того, что в результате испытания Х примет значение, принадлежащее интервалу (0,5; 1).

Р е ш е н и е. Искомая вероятность:

.

Дифференциальная функция распределения вероятности непрерывной случайной величины имеет следующие свойства:

1) дифференциальная функция неотрицательна, т.е. f(x)0;

2) несобственный интеграл от дифференциальной функции:

;

3) дифференциальная функция определяет плотность распределения вероятности для каждой точки х.

       Из последнего свойства следует: вероятность того, что случайная величина принадлежит интервалу , приближённо равна площади прямоугольника с основанием Dx и высотой f(x).

       Распределением случайных величин называют совокупность значений этих величин, расположенных в возрастающем порядке. Центр распределения характеризуется математическим ожиданием.

       Эмпирическим называют распределение относительных частот. Эмпирические распределения изучает математическая статистика.

       Теоретическим называют распределение вероятностей. Такие распределения изучает теория вероятностей.

       Математическим ожиданием непрерывной случайной величины Х, возможные значения которой принадлежат отрезку [f,b], называют определённый интеграл:

.

Математическое ожидание в инженерной практике оценивают средним значением результатов наблюдений.

       Дисперсией непрерывной случайной величины называют математическое ожидание квадрата её отклонения, т.е.:

.

Для среднего квадратичного отклонения имеем:

.

       Симметрия рассеивания случайной величины характеризуется асимметрией. Для дискретных наблюдений:

Эксцесс (для дискретных наблюдений):

.

       Асимметрия положительна (А>0), если длинная часть кривой распределения лежит справа от математического ожидания и отрицательная в противном случае. Если эксцесс некоторого распределения отличается от нуля и положительный (Э > 0), то кривая имеет более высокую и острую вершину и наоборот.

       Известен ряд законов распределения непрерывных случайных величин: логарифмическое нормальное, полунормальное, гамма-распределение, бета-распределение и др. Центральное место среди законов распределения занимает нормальный закон распределения. Нормальным (распределением Гаусса) является распределение вероятностей случайной величины, которое описывается функцией:

.

Для нормального распределения асимметрия и эксцесс равны нулю.

       Исследование функции нормального распределения методами математического анализа приводит к следующим результатам: функция определена на всей оси х; при всех значениях х функция принимает положительные значения; ось х служит горизонтальной осью графика функции; при х=а функция имеет максимум, равный ; график функции симметричен относительно прямой х=а; точки графика  являются точками перегиба.

       Математическое ожидание нормального распределения равно параметру а; среднее квадратичное отклонение этого распределения равно параметру s.

       Почему нормально распределённые случайные величины широко распространены на практике? Ответ на вопрос дан математиком А.М. Ляпуновым при доказательстве центральной предельной теоремы теории вероятностей. .Здесь ограничимся следствием из названной теоремы.

       Если случайная величина Х представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждого из которых на всю сумму ничтожно мало, то Х имеет распределение близкое к нормальному.

Пример. Пусть производится измерение некоторого параметра. Любое измерение даёт приближённое значение измеряемой величины, так как на результат оказывают влияние многие независимые случайные факторы (температура, электромагнитные поля, влажность, колебания прибора и др.). Каждый из этих факторов порождает "частную ошибку". Совокупность факторов порождает суммарную ошибку. Рассматривая суммарную ошибку как сумму очень большого числа независимых частных ошибок, можем заключить, что суммарная ошибка имеет нормальное распределение, Это подтверждает опыт.

       На практике часто приходится иметь дело с распределением, которое незначительно отличается от нормального (впрочем, отсюда ещё не следует, что нормальное распределение всегда имеет место).

       Если изобразить графически нормальные распределения (см. фиг.2.3) с одинаковыми математическими ожиданиями, но с различными средними квадратичными отклонениями, то при меньшем значении s кривая будет падать по обе стороны от вершины более круто, чем при s, имеющей большее значение; с увеличением s кривая становиться более пологой (фиг.2.3,б).

       Плотность нормального распределения выражается функцией:

; ,

где e=2,71828; =3,14159; М и s - математическое ожидание и среднее квадратичное отклонение нормального распределения (являются параметрами распределения).

 


      

 

 

а)                                                                            б)

 

 

Фиг.2.3. Нормальное распределение (а) и кривые нормального

распределения с различными дисперсиями (б).

 

Для дальнейшего использования таблиц математической статистики, осуществим замену переменной. Пусть . Тогда

,

где j - плотность нормированного нормального распределения; d - ширина интервала.

       Вычисления площади под кривой нормального распределения показывает, что эта площадь всегда равна единице. В связи с этим свойством, площадь, ограниченная ординатами в точках , представляет собой относительную частоту или вероятность попадания значений признака х в интервал  (в интервал ).

       Если случайная величина Х задана дифференциальной функцией, то вероятность того, что Х примет значение, принадлежащее  такова:

.

Пользуясь функцией Лапласа  (табл.1, Приложение), имеем:                  

.

       С помощью введенных формул легко вычислить теоретические значения частот нормального распределения с любым математическим ожиданием и средним квадратичным отклонением.

Пример. Случайная величина Х распределена по нормальному закону. Математическое ожидание и среднее квадратичное отклонение этой величины соответственно равны 30 и 10. Найти вероятность того, что Х примет значение, принадлежащее интервалу (10, 50).

Р е ш е н и е. По условию a=10, b=50, а=30, s=10, следовательно,

.

По табл. значений функции Лапласа находим Ф(х=2)=0,4772. Отсюда искомая вероятность Р(10<X<50)=20,4772=0,9544.

       Правило трёх сигм. Между границами находится 99,73% всех наблюдений, т.е. практически все значения. Поэтому принимают следующее утверждение: если какое-либо значение появляется за пределами трёхсигмового участка, то оно является случайным.

       На основании правила трёх сигм после вычисления асимметрии и эксцесса можно проверитьподчиняются ли изучаемые наблюдения нормальному закону. Для этого проверяются условия:

.

Если эти условия выполняются, то считают, что наблюдения подчиняются нормальному закону.

 



Дата: 2019-05-29, просмотров: 280.