Ряды распределения в таможенной статистике
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Методические указания

    Таможенная инспекция провела 1%-ю проверку после выпуска товаров. В результате получен следующий дискретный ряд распределения числа нарушений, выявленных в каждой проверке (табл. 22). Проведем анализ этого ряда распределения.

Таблица 22. Ряд распределения числа нарушений, выявленных таможенной инспекцией

Число нарушений 0 1 2 3
Число проверок 24 4 2 1

    Этап 1. Данный в табл. 22 ряд распределения уже ранжирован в порядке возрастания числа нарушений, поэтому переходим сразу к расчету основного обобщающего показателя – среднего числа нарушений. Сначала рассчитаем среднее число нарушений в выборке, а также его дисперсию, для чего построим вспомогательную таблицу 23.

Таблица 23. Ряд распределения числа нарушений, выявленных таможенной инспекцией

Число нарушений X Число проверок f Xf (Х - )2 f m f ’ m’ |f ’– m ’|
0 24 0 3,022 21,7 0,244 24 21,7 2,3
1 4 4 1,665 7,7 1,778 28 29,4 1,4
2 2 4 5,413 1,4 0,257 30 30,8 0,8
3 1 3 6,997 0,2 3,200 31 31 0
Итого 31 11 17,097 31 5,479      

Среднее число нарушений в выборке по формуле (11), приняв за X число нарушений, а за N – численность выборки n: = = 11/31 = 0,355 (нарушений).

Дисперсию определим по формуле (46):

= = 0,552 (нарушений2).

Затем определим среднюю ошибку выборки по формуле (33), так как число величин в генеральной совокупности N неизвестно: = .

Предельная ошибка выборки при вероятности 0,95 по формуле (32):  = 1,96*0,133 = 0,261.

Доверительный интервал среднего числа нарушений в генеральной совокупности по формуле (35): = 0,355 ± 0,261 или 0,094  0,616 (нарушений), то есть среднее число нарушений по всей совокупности товаров, прошедших через таможенную границу, с вероятностью 0,95 лежит в пределах от 0,094 до 0,616 нарушений в 1 партии.

    Найдем еще обобщающий показатель – долю выпущенных товаров без нарушений d (т.е. с числом нарушений X=0). Доля таких товаров в выборке по формуле (6) составила:      24/31 = 0,774, или 77,4%.

    Дисперсия этой доли по формуле (66) [2] составила:

= 0,774*(1–0,774) = 0,175.                            (66)

Средняя ошибка выборки по формуле (33): = .

Предельная ошибка выборки при вероятности 0,95 по формуле (32): = 1,96*0,075 = 0,147.

Доверительный интервал доли выпущенных товаров без нарушений в генеральной совокупности по формуле (36): d = 0,774 ± 0,147 или 0,627  d  0,921, то есть доля выпущенных товаров без нарушений по всей совокупности товаров, прошедших через таможенную границу, с вероятностью 0,95 лежит в пределах от 62,7% до 92,1%.

    Этап 2. Данный ряд распределения не имеет смысла превращать в интервальный в виду очень малой вариации значений признака. Построив график этого распределения (полигон) – рис. 15, видно, что данное распределение не похоже на нормальное.

Рис. 15. Кривая распределения числа нарушений, выявленных таможенной инспекцией

Этап 3. Из структурных характеристик ряда распределения можно определить только моду: Мо = 0, так как по данным табл. 23 такое число нарушений чаще всего встречается (f=24).

Этап 4. По формуле (42) определим размах вариации: H = 3 – 0 = 3, что характеризует вариацию в 3 нарушения.

    По формуле (44) найдем среднее линейное отклонение:

.

Это означает, что в среднем число нарушений в выборке отклоняется от среднего числа нарушений на 0,55.

    Среднее квадратическое отклонение рассчитаем не по формуле (46), а как корень из дисперсии, которая уже была рассчитана нами на 1-м этапе: , тогда , т.е. в изучаемом распределении наблюдается некоторое число выделяющихся нарушений (с большим числом нарушений, выявленных в одной проверке).

    Поскольку квартили на предыдущем этапе не определялись, на данном этапе расчет среднего квартильного расстояния пропускаем.

    Теперь рассчитаем относительные показатели вариации:

– относительный размах вариации по формуле (50): = 3/0,355 = 8,45;

– линейный коэффициент вариации по формуле (51): = 0,550/0,355 = 1,55;

– квадратический коэффициент вариации по формуле (52): = 0,743/0,355 = 2,09.

Все расчеты на данном этапе свидетельствуют о значительных размере и интенсивности вариации нарушений, выявленных таможенной инспекцией.

    Этап 5. Не имеет практического смысла расчет моментов распределения, так как видно из рис. 15, что в изучаемом распределении симметрия отсутствует вовсе, поэтому и расчет эксцесса также бесполезен.

    Этап 6. Выдвинем гипотезу о соответствии изучаемого распределения распределению Пуассона[3], которое описывается формулой (67):

,                          (67)

где P( X)                – вероятность того, что признак примет то или иное значение X;

       e = 2,7182 – основание натурального логарифма;

       X!               – факториал числа X (т.е. произведение всех целых чисел от 1 до X включительно);

       a =         – средняя арифметическая ряда распределения.

Из формулы (67) видно, что единственным параметром распределения Пуассона является средняя арифметическая величина. Порядок определения теоретических частот этого распределения следующий:

1) рассчитать среднюю арифметическую ряда, т.е. = a;

2) рассчитать ea;

3) для каждого значения X рассчитать теоретическую частоту по формуле (68):

.                       (68)

Поскольку a = = 0,355 найдем значение e – 0,355 =0,7012. Затем, подставив в формулу (68) значения X от 0 до 3, вычислим теоретические частоты:

m 0 =  (т.к. 0! = 1);                m 1 = ;

m 2 = ;                                      m 3 = .

Полученные теоретические частоты занесем в 5-й столбец табл. 23 и построим график эмпирического и теоретического распределений (рис. 16), из которого видна близость эмпирического и теоретического распределений.

Рис. 16. Эмпирическая и теоретическая (распределение Пуассона) кривые распределения

    Проверим выдвинутую гипотезу о соответствии изучаемого распределения закону Пуассона с помощью критериев согласия.

    Рассчитаем значение критерия Пирсона χ2 по формуле (62) в 6-м столбце табл. 23: χ2 =5,479, что меньше табличного (Приложение 7) значения χ2табл=5,9915 при уровне значимости α = 0,05 и числе степеней свободы ν=4–1–1=2, значит с вероятностью 0,95 можно говорить, что в основе эмпирического распределения лежит закон распределения Пуассона, т.е. выдвинутая гипотеза не отвергается, а расхождения объясняются случайными факторами.

    Определим значение критерия Романовского по формуле (64):

= 1,74 < 3, что подтверждает несущественность расхождений между эмпирическими и теоретическими частотами.

    Для расчета критерия Колмогорова в последних трех столбцах таблицы 23 приведены расчеты накопленных частот и разностей между ними, откуда видно, что в 1-ой группе наблюдается максимальное расхождение (разность) D = 2,3. Тогда по формуле (65): . По таблице Приложения 6 находим значение вероятности при λ = 0,4: P = 0,9972 (наиболее близкое значение к 0,413), т.е. с вероятностью, близкой к единице, можно говорить, что в основе эмпирического распределения величины нарушений, выявленных таможенной инспекцией, лежит закон распределения Пуассона, а расхождения эмпирического и теоретического распределений носят случайный характер.


Контрольные задания

 

На основе условных ранжированных данных таблицы 24, которые получены с помощью случайного выборочного наблюдения на 50 таможенных постах за отчетный период, провести анализ вариации (6 этапов) величины таможенных сборов (тыс. руб.) с товаров, перемещенных через таможенную границу, собранных таможенными постами.

Таблица 24. Распределение вариантов для выполнения контрольного задания


П/п

Вариант

 

П/п

Вариант

1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 107 109 118 155 104 101 142 123 128 158   26 416 560 593 519 576 603 515 531 574 677 2 139 111 165 178 107 163 143 124 180 177   27 426 571 609 533 577 614 523 544 604 689 3 142 199 168 182 113 200 169 184 208 292   28 428 573 610 539 579 621 526 563 618 702 4 144 226 247 223 133 230 169 247 247 317   29 436 580 612 550 579 633 533 576 624 709 5 150 239 249 227 186 308 223 295 259 327   30 451 593 622 555 589 643 553 584 653 723 6 207 289 293 269 186 314 233 303 262 380   31 496 597 658 555 590 664 559 585 657 734 7 207 318 299 272 195 320 236 312 325 433   32 497 615 680 561 591 666 560 597 673 752 8 217 319 302 286 230 328 290 332 341 449   33 513 649 706 597 598 676 564 602 685 755 9 233 346 339 294 232 367 292 335 344 458   34 517 661 716 600 604 691 580 604 701 756 10 244 390 361 301 243 405 292 351 353 490   35 545 668 726 621 630 692 585 631 702 779 11 271 390 364 306 264 410 338 378 362 505   36 558 680 737 643 687 708 592 639 706 785 12 273 405 405 361 356 420 359 379 366 506   37 571 693 751 674 703 717 595 647 723 802 13 275 428 410 362 368 427 363 388 377 526   38 580 801 795 676 705 726 604 665 734 819 14 300 436 429 392 372 440 367 389 387 553   39 593 813 812 683 729 743 653 671 755 822 15 302 438 439 428 387 458 368 393 389 567   40 597 816 825 689 738 744 671 699 756 829 16 305 450 458 454 403 464 411 420 429 586   41 615 825 849 712 740 753 676 716 785 842 17 312 451 462 462 467 465 436 422 466 604   42 649 675 855 735 776 758 698 719 802 848 18 320 496 492 466 482 482 449 425 485 618   43 661 842 858 766 786 772 700 720 842 864 19 359 497 498 482 491 495 460 461 491 624   44 680 845 861 799 792 793 717 764 864 886 20 369 502 543 487 494 497 480 465 515 627   45 801 650 865 818 825 808 761 803 886 888 21 370 513 550 490 510 545 488 495 523 633   46 816 858 866 824 851 861 808 873 888 926 22 372 517 566 493 511 549 493 498 534 653   47 825 878 867 858 854 867 818 879 926 930 23 382 531 581 501 512 582 500 526 546 656   48 845 958 938 861 895 880 838 898 930 945 24 411 545 588 508 533 590 500 528 550 657   49 961 972 939 898 896 897 869 922 945 951 25 414 558 590 511 540 602 513 531 573 673   50 972 994 989 937 949 929 888 991 961 961

Контрольные вопросы

 

1. Понятие вариации и ее причины, виды рядов распределения.

2. Выборочный ряд распределения и расчет его обобщающих характеристик.

3. Построение ранжированного ряда распределения.

4. Построение интервального ряда распределения и его графиков.

5. Структурные характеристики ряда распределения.

6. Показатели размера и интенсивности вариации.

7. Моменты распределения и показателей его формы.

8. Нормальное распределение и распределение Пуассона, расчет их частот.

9. Критерии согласия.


 


Дата: 2018-12-21, просмотров: 595.