Не так давно в современных школьных учебниках по алгебре появился раздел «Элементы математической статистики, комбинаторики и теории вероятностей». Ранее этот раздел изучался на первых ступенях обучения в высших учебных заведениях. Теперь же, перекочевав в школьные учебники, раздел математической статистики внес определенные трудности в образовательный процесс. И педагоги, и ученики столкнулись с новой для них дисциплиной – «Статистика». Несколько часов, отведенных в учебниках для изучения этой науки, не позволяют вникнуть в ее суть, изучить ее методы и практическое применение. Данная статья предполагает наглядно продемонстрировать, что такое «Статистика» и для чего она нужна.
Итак, статистика просто необходима тем, кто работает с обработкой и анализом данных. Такая задача возникает очень часто, особенно тогда, когда нужно выяснить ранее неизвестный факт. Например, есть ли эффект от нового лекарства? Или: различаются ли рейтинги двух политиков? Или: как будет меняться курс доллара на следующей неделе?
Большое значение статистики в современном обществе объясняется тем, что она представляет собой одно из наиболее важных средств, с помощью которых ведется учет в экономике. Статистика является основой планирования в сферах производства, строительства, транспорта, торговли и т.д. Роль статистики в нашей жизни настолько значительна, что люди, часто не задумываясь, используют элементы статистической методологии не только в профессиональной деятельности, но и в повседневной жизни.
Работая и отдыхая, делая покупки, знакомясь с другими людьми, человек пользуется определённой системой имеющихся у него сведений и фактов, систематизирует, анализирует их, делает выводы и принимает определённые решения. Таким образом, в каждом человеке заложены элементы статистического мышления, представляющего собой способности к анализу и синтезу информации об окружающем нас мире.
В общем, если бы люди знали, что можно сделать методами анализа данных, ошибок и неясностей в нашей жизни стало бы гораздо меньше. Тем, кто заканчивал ВУЗ, часто читали курс «Теория вероятностей и математическая статистика», однако кроме длинных математических формул большинство из этих курсов ничего не помнит. А ведь на теории вероятностей и основаны большинство методов анализа данных! С другой стороны, ведь совсем не обязательно знать радиофизику для того, чтобы слушать любимую радиостанцию. Значит, чтобы анализировать данные в практических целях, не обязательно свободно владеть математической статистикой и теорией вероятностей. И тут на помощь приходит всем нам хорошо известный персональный компьютер. С его помощью и набором простых программ можно легко и доступно, на конкретных примерах, разобраться и с теорией вероятностей, и с математической статистикой.
Ещё интереснее будет, если воспользоваться для объяснения данного материала возможностями ИКТ-технологий.
Средства вычислительной техники позволяют в полном объеме проводить статистические расчеты с минимальными затратами и высокой точностью, а их использование повысит интерес к изучению данного раздела математики. С другой стороны, рассмотрев решения некоторых задач статистики с помощью табличного процессора Exсel, мы в очередной раз имеем возможность показать ученикам возможности компьютера.
Мы хотели бы показать на конкретном примере возможность использования компьютера для решения математических задач.
Всякое статистическое исследование начинается с целенаправленного сбора информации об изучаемом явлении или процессе. Для обобщения и систематизации данных, полученных в результате наблюдения, их по какому–либо признаку разбивают на группы и результаты группировки сводят в таблицы.
Этапы статистического исследования: 1 - Статистическое наблюдение; 2 - Группировка собранных данных; 3 - Анализ полученных данных; 4 - Подготовка отчета.
Чаще всего результатами измерения являются числа. Каждое число, встретившееся в конкретном измерении, называют вариантой измерения. Если записать все варианты измерения по порядку их получения, то получится ряд данных измерения. Если же начать с наименьшей из всех вариант измерения и записать все варианты в порядке возрастания их числовых значений, то получится сгруппированный ряд данных.
Рассмотрим способы применения статистических расчетов на примере следующей задачи: по результатам теста, выполненного 40 учениками 9 класса, отмечено число верно решенных заданий:
6, 5, 4, 0, 5, 7, 9, 1, 6, 8, 7, 9, 5, 8, 6, 7, 2, 5, 7, 6, 3, 4, 4, 5, 6, 8, 6, 7, 7, 4, 3, 5, 9, 6, 4, 7, 8, 6, 9, 8.
Для того, чтобы было удобно анализировать собранные данные, упорядочим и сгруппируем числовой ряд:
0, 1, 2, 3,3, | 4,4,4,4,4, 5,5,5,5,5,5, 6,6,6,6,6,6,6,6, | 7,7,7,7,7,7,7, 8,8,8,8,8, 9,9,9,9. |
Представим полученные данные в виде таблицы частот:
Число верно решенных заданий | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
Частота | 1 | 1 | 1 | 2 | 5 | 6 | 8 | 7 | 5 | 4 |
Заметим, что сумма частот равна общему числу проверяемых работ, т.е. 40.
Вообще, если собранные данные представлены в виде таблицы частот, то сумма частот равна общему числу данных в ряду.
При анализе полученных данных используются различные статистические показатели – среднее арифметическое, размах, мода, медиана и т. д.
Проанализируем результаты проведенной проверки работ.
Среднее арифметическое ряда чисел – частное от деления суммы всех результатов измерения на объем измерения.
В табличном процессоре Excel используется статистическая функция СРЗНАЧ (диапазон ячеек). Например: =СРЗНАЧ(А1:А20)
Размахом ряда чисел называется разность между наибольшим и наименьшим их этих чисел. Для нахождения наибольшего и наименьшего чисел в Excel используются функции МАКС(диапазон ячеек) и МИН(диапазон ячеек). Тогда размах вычисляется по формуле: = МАКС(…) - МИН(…).
Модой ряда чисел называется число, чаще других встречающееся в данном ряду.
Ряд может иметь более одной моды: 47, 46, 50, 47, 52, 49, 45, 43, 52; или не иметь моды совсем: 69, 68, 66, 80, 67, 65, 71, 74, 63. В Excel используется статистическая функция МОДА(диапазон ячеек).
Среднюю варианту в сгруппированном ряде данных называют медианой измерения. В Excel используется статистическая функция МЕДИАНА (диапазон ячеек).
1) Для создания формул выполните следующие действия:
- выберите команду [Вставка - Функция]
- щелкните по кнопке «мастер функции fх»;
- далее выберите Статистические и далее МИН, МАКС, или Срзнач, нажмите ОК;
2) Для нахождения размаха чисел необходимо в свободной ячейке создать формулу, находящую разность. Для этого:
- наберите на клавиатуре знак «=»;
- введите адрес ячейки, содержащей значение МАКС (т. е. В15);
- наберите на клавиатуре знак «-»;
- введите адрес ячейки, содержащей значение МИН (т. е В14);
- нажмите «Enter».
3) Для заполнения вправо выделим диапазон В14:В17. Подведем указатель мыши к правому нижнему углу выделенного диапазона и протянем вправо.
Проверьте себя:
Среднее арифметическое: (0*1+1*1+2*1+3*2+4*5+5*6+6*8+7*7+8*5+9*4)/40 = 232/40 =5,8
Значит, в среднем учащиеся выполнили по 5,8 заданий, т.е. примерно 2/3 общего объема работы.
Размах: Наибольшее число верно выполненных заданий – 9, наименьшее – 0, значит размах ряда равен 9 – 0 = 9, т.е. различие в числе верно выполненных заданий достаточно велико.
Мода: Из таблицы частот очевидно, что чаще всего встречаются работы, в которых верно выполнены 6 заданий, т.е. мода равна 6.
Медиана: т.к. в ряду 40 чисел, то медиана равна среднему арифметическому 20-го и 21-го чисел соответствующего упорядоченного ряда. Из таблицы частот следует, что на 20-ом и 21-ом местах в таком ряду будет число 6. Значит и медиана ряда равна 6.
Построение таблицы частот в Excel:
Для составления таблицы частот используется статистическая функция ЧАСТОТА (данные; интервалы).
Иногда составляют таблицу, в которой для каждого данного указывается относительная частота.
Относительная частота - отношение частоты к общему числу данных в ряду, выраженное в процентах.
Технология работы:
Внесите в таблицу исходные данные;
Запишите в таблицу значения ряда.
Выделите группу ячеек, где будут сохраняться результаты (в нашем примере - F2:F11);
Выберите статистическую функцию ЧАСТОТА;
Укажите массив данных – A2:D11, массив интервалов – E2:E11;
Нажмите F2;
Нажмите Ctrl + Shift + Enter.
Для составления таблицы частот также используется статистическая функция режим «Гистограмма»
Технология работы:
«Сервис» - «Анализ данных» - «Гистограмма»
Укажите входной интервал – диапазон исходных данных, интервал карманов – диапазон значения ряда. Выделите ячейку, где будут сохраняться результаты;
Сделайте активным окно - вывод графика
Для наглядного представления данных, полученных в результате статистического исследования, широко применяют различные типы диаграмм. При этом чаще других используются 3 основных типа: Гистограмма (столбчатая диаграмма)
Круговая диаграмма График (полигон)
Гистограмму используют тогда, когда хотят проиллюстрировать динамику изменения данных во времени или распределение данных, полученных в результате статистического исследования. Круговую диаграмму удобно использовать для наглядного изображения соотношения между частями исследуемой совокупности данных.
График, так же, как и гистограмма, используется для иллюстрации изменения статистических данных с течением времени, либо для наглядного изображения распределения полученных данных.
Технология построения диаграмм:
Выделите на рабочем листе Excel данные, на основе которых требуется построить диаграмму;
Запустите «Мастер диаграмм» (кнопка стандартной панели инструментов), выберите тип диаграммы и его разновидность, укажите необходимые параметры диаграммы – заголовки, подписи данных, легенда и т.д., укажите место размещения диаграммы и щелкните на кнопке «Готово».
Числовую характеристику данных измерения, отвечающую за разброс (рассеивание) данных вокруг их среднего значения, называют дисперсией и обозначают буквой D; число s=ÖD называют средним квадратическим отклонением.
Дисперсия – среднее арифметическое квадратов разностей между значениями случайной величины и ее средним значением, т. е.:
где а1, а2, а3, … аn - данные,
S – среднее арифметическое,
n – количество чисел в ряду.
Для вычисления дисперсии числового ряда в Excel используется статистическая функция ДИСПР (диапазон ячеек).
Подготовка отчета.
Отчет по результатам статистического исследования, как правило, включает себя:
Расчетные таблицы с исходными данными и найденными статистическими характеристиками;
Графики и диаграммы, наглядно иллюстрирующие результаты проведенного исследования;
Анализ проведенных расчетов и выводы из полученных в ходе исследования результатов.
Таким образом, с помощью табличного процессора Exсel можно освободиться от рутинной работы по группировке и анализу результатов статистического исследования.
В результате мы выполнили поставленную задачу: познакомили учащихся с задачей по статистике и показали возможность применения известного им табличного процессора для решения данной задачи.
Зуевская средняя общеобразовательная школа муниципального района Нефтегорский
Дата: 2019-07-24, просмотров: 304.