Принципы отбора содержания тестовых заданий.
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Задачи: 

1. Исследовать историю возникновения тестов как формы контроля.

2. Выяснить, что такое тест, что представляет собой его структура.

3. Понять, по какому принципу происходит отбор тестового материала.

4. Изучить знания как предмет тестового контроля.

5. Показать примеры применения тестов на уроках русского языка.



План работы

I. Введение.

Обоснование цели выбранной темы.

 

II. Основная часть.

1. История теста.

2. Наука о тестах.

3. Что такое тест?

4. Структура теста.

5. Критерии отбора содержания тестового материала.

6. Знания, как предмет тестового контроля.

7. Измерение знаний и его объективность.

8. Оценка, отметка.

9. Критерии учебных достижений.

 

III. Заключение.

Методическая часть. Конспект урока с применением тестов.

 

IV. Литература.

 



Введение.

Педагогические технологии должны идти в ногу со временем. Темп современной жизни предъявляет новые требования к процессу обучения. Если раньше выпускные экзамены по русскому языку были в форме сочинения, то сейчас это уже ЕГЭ. Не за горами введение ЕГЭ уже в 9 классе средней школы, а это значит, что учащиеся должны быть готовы к сдаче экзамена в форме теста. Тесты дают возможность заметно улучшить образовательный процесс, потому что обладают рядом преимуществ перед другими методами контроля знаний; являясь обязательной частью многих педагогических новаций, они снижают затраты времени на проверку знаний, помогают выявить индивидуальный темп обучения, а также пробелы в текущей и итоговой подготовке.

Раньше тесты применялись в двух основных сферах: в образовании и в сфере профотбора-профориентации. Затронутые тестами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений в пользу и против тестов. Большой энтузиазм тех, кто их применял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в результате его неправильного использования, привели к тому, что одни видели в тестовом контроле средство принижения роли педагога, воспринимали тесты как средство выражения недоверия к традиционно выставляемым оценкам и потому проявляли определенную настороженность, и только немногие рассматривали их как средство радикального преобразования учебного процесса в сторону его объективизации - и становились энтузиастами этого метода. Как прозорливо отмечал П.П. Блонский «... тесты - это больше, чем средство контроля; это средство рационализации школьного дела...», и хочется добавить, образования в целом.

В сочетании с ПК, тесты помогают перейти к созданию современных систем адаптивного обучения и контроля - наиболее современных в организации учебного процесса. Без тестов невозможен переход к прогрессивному обучению на основе принятой у нас системы полного усвоения знаний. Обучение начинается с входного тестирования, сопровождается текущим контролем с помощью заданий в тестовой форме и заканчивается объективным тестированием учебных достижений. Кроме того, тесты позволяют наладить самоконтроль - самую полезную для обучения и гуманную форму контроля знаний, а также организовать рейтинг - эффективное средство повышения учебной мотивации.



История теста

Первые тесты для объективного контроля знаний, умений и навыков появились в начале XX века. Они быстро завоевали популярность среди преподавателей вузов и школ в Англии и США, а позже в России и СССР. Примерно с этого времени их стали в США называть педагогическими. Именно эти тесты вызывали настороженное к себе отношение у сторонников традиционной, "чистой", без тестов, педагогической науки и практики, т.к. экзамен оказывает разрушительное действие на учащихся и студентов.

Эти же годы характеризуются широким использованием тестов в других странах. Во Франции они стали применяться для дефектологических целей и для профориентации, в США тесты использовались при приеме на работу, в вузы, для оценки знаний школьников и студентов, для проведения социально - психологических исследований. Была сделана первая попытка объективно сравнить знания студентов различных колледжей штата Пенсильвания. Но и критика не успокаивалась. Она начинала приобретать все более широкий размах и выходить за рамки чисто научных дискуссий.

В СССР практика тестирования этого периода характеризовалась серьезными противоречиями: по мере роста числа тестов и тестовых исследований имели место попытки торможения и даже запрета. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, с порога. В 1936 году было принято Постановление Совета Народных Комиссаров под многозначительным названием "О педологических извращениях в системе Наркомпроссов". Что на долгое время помешало попыткам разработки и применения тестовых методов в сфере образования, профотбора и профориентации.

Тесты запретили в 1936 году как "буржуазные и вредные", но истинные причины запрета - расстановка сил в политической борьбе того периода. Воцарившаяся после запрета ситуация отрицательного отношения к тестам не давала практической возможности публиковать что-либо в их защиту. И эта ситуация продолжалась в течение примерно сорока лет. В течение всего этого времени печатались в основном статьи о вредности тестов, о недопустимости использования последних в отечественной педагогической науке и практике.

Хотя в тридцатых годах практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в нашей стране полностью не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний; и наоборот, различные испытания нередко назывались тестами. Официально запрет на применение тестов так и не был отменен. Его отменила сама жизнь.

Тестовые методы не призваны заменять преподавателя и его личный опыт, а наоборот, призваны помогать ему, освободив его от рутинной работы и дать, тем самым, ему возможность сосредоточиться на повышении качества преподавания.

В то время как в нашей стране обсуждался вопрос, быть тестам или не быть, в США ставились другие вопросы: как повысить качество тестов, как сделать результаты тестирования независимыми от группы испытуемых и от того или иного набора заданий?

Война существенно обострила интерес к вопросам соотнесения способностей человека с требованиями профессий. К началу второй мировой войны там уже был накоплен большой опыт разработки тестов. Война дала сильный толчок авиастроению. Соответственно, понадобились сотни тысяч пилотов, штурманов, механиков, стрелков-радистов, специалистов по наладке навигационного оборудования. Каждая из перечисленных профессий требовала наличия определенных способностей - интеллектуальных, физических, психомоторных, и все эти способности надо было быстро и эффективно оценить. Поскольку обучение военного летчика стоит дороже подготовки профессора, а отчисление неудачников проводилось, как правило, не ранее того, как курсанты проходили примерно третью часть срока подготовки, нетрудно было представить себе масштабы экономии средств за счет использования тестов. Один из активных участников процесса отбора военных специалистов подсчитал, что на каждый доллар, затраченный на эту программу, бюджет сэкономил тысячу долларов.

Анализ положения дел с тестовым контролем в СССР и в других странах показывал: многие страны опережали нас по масштабам практической работы, по финансированию научных исследований, по числу публикаций, по подготовке научных кадров, по уровню и качеству развития теории тестов, по технической и программно-вычислительной оснащенности тестового процесса. Хотя интерес к тестам в СССР заметно вырос, ситуация с ними не только не улучшилась, а в некотором отношении даже ухудшилась, потому что кажущаяся простота создания тестов, в сочетании с конъюнктурными интересами породили множество некачественных самоделок, дискредитирующих этот перспективный метод научной организации самоконтроля и объективного педагогического контроля знаний.

Наиболее развитые в тестовом отношении страны - Нидерланды, США, Англия, Япония, Дания, Франция, Израиль, Финляндия, Канада, Австралия, Новая Зеландия и др.  Нет никакой случайности в том, что в этот список попали страны с высоким уровнем жизни населения. Здесь связь опосредована цепочкой: применение тестов благотворно влияет на качество образования; качество образования связано с качеством управления; качественное управление создает предпосылки для повышения качества жизни населения.

Тесты дают возможность заметно улучшить образовательный процесс, потому что обладают рядом преимуществ перед другими методами контроля знаний; являясь обязательной частью многих педагогических новаций, они снижают затраты на проверку знаний, помогают выявить индивидуальный темп обучения, а также пробелы в текущей и итоговой подготовке.

В сочетании с персональным компьютером, тесты помогают перейти к созданию современных систем адаптивного обучения и контроля - наиболее современных организации учебного процесса. Без тестов невозможен переход к самой прогрессивному на сегодня обучению учащихся на основе так называемой у нас системы полного усвоения знаний. Именно в такой системе тесты и задания в тестовой форме буквально пронизывают всю учебную деятельность преподавателей и учащихся.

Обучение начинается с входного тестирования, сопровождается текущим контролем с помощью заданий в тестовой форме и заканчивается объективным тестированием учебных достижений. Кроме того, тесты позволяют наладить самоконтроль - самую полезную для обучения и гуманную форму контроля знаний, а также организовать рейтинг - эффективное средство повышения учебной мотивации.

Наука о тестах.

Для понимания сущности тестов важно разобраться в системе понятий. Понятия вообще образуют основу любой науки, и в этом смысле деятельность по разработке и эффективному применению тестов не является исключением.

Первые научные труды по теории тестов появилась в начале ХХ века, на стыке психологии, социологии, педагогики и других так называемых поведенческих наук (Behavioral Sciences).

Зарубежные психологи называют эту науку психометрикой (Psychometrika), а педагоги - педагогическим измерением (Educational measurement). Поскольку общего названия на русском языке пока нет, то мы будем придерживаться аванесовского варианта названия данной науки - тестология, которая может быть педагогической, психологической или социологической, в зависимости от того, где применяется и развивается.

Незамутненная идеологией и политикой, интерпретация названия "тестология" проста и прозрачна: наука о тестах.

Педагогическая тестология призвана заниматься вопросами разработки тестов для объективного контроля подготовленности учащихся ("учащихся" в самом широком смысле этого слова, а не просто "школьников", как можно предположить).

Педагогическая тестология - это прикладная методическая теория научной педагогики.

Ключевыми понятиями тестологии, как одной из методических теорий, являются измерение, тест, содержание и форма заданий, надежность и валидность результатов измерения. Кроме того, в тестологии используются такие понятия статистической науки, как выборочная и генеральная совокупность, корреляция[1] и др.

 

 

Что такое тест?

Слово "тест" вызывает у людей самые различные представления. Одни полагают, что это вопросы или задачи с одним готовым ответом, который надо угадать. Другие считают тест формой игры или забавы. Третьи пытаются истолковать это как перевод с английского слова "test", (проба, испытание, проверка). В наши дни существует много видов тестов, поэтому дать универсальное определение для всех этих видов вряд ли можно.

Существуют два основных класса тестов: традиционные и нетрадиционные.

Традиционный тест представляет собой стандартизованный метод диагностики уровня и структуры подготовленности. В таком тесте все испытуемые отвечают на одни и те же задания, в одинаковое время, в одинаковых условиях и с одинаковыми правилами оценивания ответов.        

Педагогический тест определяется как система заданий определенного содержания, возрастающей трудности, специфической формы, позволяющая качественно и эффективно измерить уровень и оценить структуру подготовленности учащихся. В педагогическом тесте задания располагаются по мере возрастания трудности - от самого легкого до самого трудного.

К традиционным тестам относятся тесты гомогенные и гетерогенные.

Гомогенные тесты

Гомогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по одной учебной дисциплине.

Легко видеть, что в своей основе определение гомогенного теста совпадает с определением традиционного теста.

Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства. Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное.

Гетерогенные тесты

Гетерогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по нескольким учебным дисциплинам.

Нередко в такие тесты включаются и психологические задания для оценки уровня интеллектуального развития.

Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и, кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.

Традиционный тест представляет собой метод диагностики испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых условиях и с одинаковой оценкой.

Главная цель применения традиционных тестов - установить отношение порядка устанавливаемых между испытуемыми по уровню проявляемых при тестировании знаний. И на этой основе определить место (или рейтинг) каждого на заданном множестве тестируемых испытуемых. В тест стараются отобрать минимально достаточное количество заданий, которое позволяет сравнительно точно определить уровень и структуру подготовленности. Интерпретация результатов тестирования ведется преимущественно с опорой на среднюю арифметическую и, на так называемые, процентные нормы, показывающие, - сколько процентов испытуемых имеют тестовый результат худший, чем у любого другого испытуемого. Такая интерпретация тестовых результатов называется нормативно-ориентированной.

Интегративные тесты

Интегративным можно назвать тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника образовательного учреждения.

Диагностика проводится посредством предъявления таких заданий, правильные ответы на которые требуют интегрированных (обобщенных, явно взаимосвязанных) знаний в области двух и большего числа учебных дисциплин. Создание таких тестов дается только тем преподавателям, которые владеют знаниями ряда учебных дисциплин, понимают важную роль межпредметных связей в обучении, способны создавать задания, правильные ответы на которые требуют от учащихся знаний различных дисциплин и умений применять такие знания. Интегративному тестированию предшествует организация интегративного обучения. К сожалению, существующая сейчас классно-урочная форма проведения занятия, в сочетании с чрезмерным дроблением учебных дисциплин, вместе с традицией преподавания отдельных дисциплин (а не обобщенных курсов), еще долго будут тормозить внедрение интегративного подхода в процессы обучения и контроля подготовленности.

Преимущество интегративных тестов перед гетерогенными заключается в большей содержательной информативности каждого задания и в меньшем числе самих заданий.

Методика создания интегративных тестов сходна с методикой создания традиционных тестов, за исключением работы по определению содержания заданий. Для отбора содержания интегративных тестов использование экспертных методов является обязательным.

Адаптивные тесты

Адаптивный тест работает, как хороший экзаменатор. Сначала он "задает" вопрос средней сложности, и полученный ответ немедленно оценивается. Если ответ правильный, то оценка возможностей тестируемого повышается. В этом случае задается более сложный вопрос. При успешном ответе следующее задание ПК подбирает более трудным, при неуспешном - легким.

Преимущества адаптивного теста.

Главное преимущество адаптивного теста перед традиционным - эффективность. Адаптивный тест может определить уровень знаний тестируемого с помощью меньшего количества вопросов (иногда длина теста уменьшается до 60%).

В адаптивном тесте на каждый вопрос в среднем выделяется больше времени для обдумывания, чем в обычном тесте. Например, вместо 2 минут на каждый вопрос, у сдающего адаптивный тест может получиться 3 или 4 минуты (в зависимости от того, на сколько вопросов ему понадобится ответить).

Достоверность результатов адаптивного теста совпадает с достоверностью тестов фиксированной длины. Оба вида тестов одинаково точно оценивают уровень знаний.

Тем не менее, очень широко распространено мнение, что адаптивный тест более точно оценивает уровень знаний. Это неверно.

Содержание теста можно определить как оптимальное отображение учебного материала в системе тестовых заданий. Внеучебное содержание (например, проверка уровня интеллектуального развития) в педагогический тест не включается. Это предмет психологического измерения.

Поскольку в педагогическом тесте задания упорядочиваются по принципу возрастающей трудности, одни испытуемые "заваливаются" уже на самом легком, первом задании, другие - на последующих заданиях. Ученики среднего уровня подготовленности могут ответить правильно только на половину заданий теста и, наконец, только самые знающие в состоянии дать правильный ответ на задания самого высокого уровня трудности, расположенные в конце теста.

Ответ на задание педагогического теста представляет собой краткое суждение, связанное по содержанию и по форме с содержанием задания. Каждому заданию ставятся в соответствие ответы правильные и неправильные. Критерии правильности заранее определяются авторами теста. Вероятность правильного ответа на любое задание зависит от соотношения уровня знаний испытуемого и уровня трудности задания. При наличии сопоставимых шкал эту вероятность выражают значением от нуля до единицы. Посредством тестирования, чаще других признаков, проверяются знания, умения, навыки и представления. С точки зрения педагогических измерений полезно ввести два основных показателя качества знаний - уровень и структура знаний. Они оценивается посредством регистрации оценок, как за знание, так и за незнание всех требуемых компонентов проверяемого материала. Для объективизации этого процесса все компоненты должны быть одинаковы. Одинаковыми являются и правила выставления оценок испытуемым. Эти условия открывают дорогу для объективного сравнения индивидуальных структур знания и незнания.

Уровень знаний выявляется при анализе ответов каждого ученика на все задания теста. Чем больше правильных ответов, тем выше индивидуальный тестовый балл испытуемых. Один и тот же уровень знаний может быть получен за счет ответов на различные задания.

Структура теста

Тест, как система, обладает составом, целостностью и структурой

Целостность означает взаимосвязь заданий, их принадлежность общему измеряемому фактору. Каждое задание теста выполняет отведенную ему роль и потому ни одно из них не может быть изъято из теста без потери качества измерения.

Структура теста образует способ связи заданий между собой. 

Время нередко называется в качестве другого системообразующего фактора. Требование экономии времени становится естественным в массовых процессах, каковым и стало образование. От времени тестирования существенно зависит качество результатов. Каждый тест имеет оптимальное время тестирования, уменьшение или превышение которого снижает качественные показатели теста.

Качество теста традиционно сводится к определению меры его надежности и вопросов валидности[2] полученных результатов.

Валидность зависит от качества заданий, их числа, от степени полноты и глубины охвата содержания учебной дисциплины (по темам) в заданиях теста. Кроме того, валидность зависит также от баланса и распределения заданий по трудности, от метода отбора заданий в тест из общего банка заданий, от интерпретации тестовых результатов, от организации сбора данных, от подбора выборочной совокупности испытуемых. 

Оценка, отметка.

 

Оценки делятся на две группы: абсолютные и относительные. В формулировании относительных оценок используются термины "хорошо", "плохо" и т.п. Оценки преподавателей вузов ближе к абсолютным оценкам, разделенным на четыре уровня (градации)- отлично, хорошо, удовлетворительно и неудовлетворительно.

Оценки нередко отождествляются с отметками. Последние являются численными аналогами оценочных суждений. Отметки вошли в жизнь в царский период, затем на волне ложно понимаемой демократизации были отменены. В советский период они были вновь введены директивным путем- Постановлением Совета Народных Комиссаров РСФСР от 10 января 1944 года.

Пятибалльная шкала отметок имеет своим главным преимуществом простоту и привычность, что объясняет ее широкую и длительную, по времени, распространенность. Но она имеет и недостаток - уже отмечавшуюся субъективность, большую зависимость от того, кто оценивает, и кого оценивают. Каждый преподаватель дает оценку на основе своего личного понимания.

Другой недостаток пятибалльной шкалы оценок касается ее слабой дифференцирующей способности.

 



Цель.

Выяснить уровень усвоения знаний по теме.

Ход урока.

На предыдущем уроке было повторение темы «Фонетика. Графика. Орфография», поэтому главная цель проведения теста – выявить пробелы в знаниях для их ликвидации.

Бланк ответов.

                  № ответов № вопросов 1 2 3 4 5 6 7 8 9 10 11 12
I                        
II                        
III                        
IV                        
V                        
VI                        
VII                        
VIII                        
IX                        
X                        

Учебник «Русский язык. 5 класс».

Авторы: Т.А.Ладыженская, М.Т.Баранов, Л.Т.Григорян, И.И.Кулибаба, Л.А.Тростенцова.

Тип урока: Повторение изученного.

Тема: Повторение и систематизация изученного за курс 5 класса.

 


Цель.

Выяснить уровень усвоения знаний за курс 5 класса.

Итоговый тест

 

I вариант

I.    Укажите звонкие согласные:

1) к, 2) д; 3) ш; 4) с.

 

Бланк ответов

  1 2 3 4
1        
2        
3        
4        
5        
6        
7        
8        
9        
10        
11        

Список источников.

1.Аванесов В.С. "Научные основы тестового контроля знаний". М. Иссл. центр, 1994 .

2. http://www.usatic.narod.ru

 


Содержание:                                    Страницы:

 

1. История теста..........................................................5-7

2. Наука о тестах..........................................................8

3. Что такое тест?......................................................9-13

4. Структура теста.....................................................14-15

5. Критерии отбора содержания тестового материала............................................................................16-17

6. Знания, как предмет тестового контроля.....18-20

7. Измерение знаний и его объективность...........21

8. Оценка, отметка........................................................22

9. Критерии учебных достижений...........................23

10. Фрагменты уроков с применением тестов..24-28

11. Список источников.................................................29

 


[1] КОРРЕЛЯЦИЯ, в математической статистике — вероятностная или статистическая зависимость. В отличие от функциональной зависимости корреляция возникает тогда, когда зависимость одного из признаков от другого осложняется наличием ряда случайных факторов.

[2] ВАЛИДНОСТЬ означает пригодность тестовых результатов для той цели, ради чего проводилось тестирование.




Задачи: 

1. Исследовать историю возникновения тестов как формы контроля.

2. Выяснить, что такое тест, что представляет собой его структура.

3. Понять, по какому принципу происходит отбор тестового материала.

4. Изучить знания как предмет тестового контроля.

5. Показать примеры применения тестов на уроках русского языка.



План работы

I. Введение.

Обоснование цели выбранной темы.

 

II. Основная часть.

1. История теста.

2. Наука о тестах.

3. Что такое тест?

4. Структура теста.

5. Критерии отбора содержания тестового материала.

6. Знания, как предмет тестового контроля.

7. Измерение знаний и его объективность.

8. Оценка, отметка.

9. Критерии учебных достижений.

 

III. Заключение.

Методическая часть. Конспект урока с применением тестов.

 

IV. Литература.

 



Введение.

Педагогические технологии должны идти в ногу со временем. Темп современной жизни предъявляет новые требования к процессу обучения. Если раньше выпускные экзамены по русскому языку были в форме сочинения, то сейчас это уже ЕГЭ. Не за горами введение ЕГЭ уже в 9 классе средней школы, а это значит, что учащиеся должны быть готовы к сдаче экзамена в форме теста. Тесты дают возможность заметно улучшить образовательный процесс, потому что обладают рядом преимуществ перед другими методами контроля знаний; являясь обязательной частью многих педагогических новаций, они снижают затраты времени на проверку знаний, помогают выявить индивидуальный темп обучения, а также пробелы в текущей и итоговой подготовке.

Раньше тесты применялись в двух основных сферах: в образовании и в сфере профотбора-профориентации. Затронутые тестами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений в пользу и против тестов. Большой энтузиазм тех, кто их применял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в результате его неправильного использования, привели к тому, что одни видели в тестовом контроле средство принижения роли педагога, воспринимали тесты как средство выражения недоверия к традиционно выставляемым оценкам и потому проявляли определенную настороженность, и только немногие рассматривали их как средство радикального преобразования учебного процесса в сторону его объективизации - и становились энтузиастами этого метода. Как прозорливо отмечал П.П. Блонский «... тесты - это больше, чем средство контроля; это средство рационализации школьного дела...», и хочется добавить, образования в целом.

В сочетании с ПК, тесты помогают перейти к созданию современных систем адаптивного обучения и контроля - наиболее современных в организации учебного процесса. Без тестов невозможен переход к прогрессивному обучению на основе принятой у нас системы полного усвоения знаний. Обучение начинается с входного тестирования, сопровождается текущим контролем с помощью заданий в тестовой форме и заканчивается объективным тестированием учебных достижений. Кроме того, тесты позволяют наладить самоконтроль - самую полезную для обучения и гуманную форму контроля знаний, а также организовать рейтинг - эффективное средство повышения учебной мотивации.



История теста

Первые тесты для объективного контроля знаний, умений и навыков появились в начале XX века. Они быстро завоевали популярность среди преподавателей вузов и школ в Англии и США, а позже в России и СССР. Примерно с этого времени их стали в США называть педагогическими. Именно эти тесты вызывали настороженное к себе отношение у сторонников традиционной, "чистой", без тестов, педагогической науки и практики, т.к. экзамен оказывает разрушительное действие на учащихся и студентов.

Эти же годы характеризуются широким использованием тестов в других странах. Во Франции они стали применяться для дефектологических целей и для профориентации, в США тесты использовались при приеме на работу, в вузы, для оценки знаний школьников и студентов, для проведения социально - психологических исследований. Была сделана первая попытка объективно сравнить знания студентов различных колледжей штата Пенсильвания. Но и критика не успокаивалась. Она начинала приобретать все более широкий размах и выходить за рамки чисто научных дискуссий.

В СССР практика тестирования этого периода характеризовалась серьезными противоречиями: по мере роста числа тестов и тестовых исследований имели место попытки торможения и даже запрета. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, с порога. В 1936 году было принято Постановление Совета Народных Комиссаров под многозначительным названием "О педологических извращениях в системе Наркомпроссов". Что на долгое время помешало попыткам разработки и применения тестовых методов в сфере образования, профотбора и профориентации.

Тесты запретили в 1936 году как "буржуазные и вредные", но истинные причины запрета - расстановка сил в политической борьбе того периода. Воцарившаяся после запрета ситуация отрицательного отношения к тестам не давала практической возможности публиковать что-либо в их защиту. И эта ситуация продолжалась в течение примерно сорока лет. В течение всего этого времени печатались в основном статьи о вредности тестов, о недопустимости использования последних в отечественной педагогической науке и практике.

Хотя в тридцатых годах практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в нашей стране полностью не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний; и наоборот, различные испытания нередко назывались тестами. Официально запрет на применение тестов так и не был отменен. Его отменила сама жизнь.

Тестовые методы не призваны заменять преподавателя и его личный опыт, а наоборот, призваны помогать ему, освободив его от рутинной работы и дать, тем самым, ему возможность сосредоточиться на повышении качества преподавания.

В то время как в нашей стране обсуждался вопрос, быть тестам или не быть, в США ставились другие вопросы: как повысить качество тестов, как сделать результаты тестирования независимыми от группы испытуемых и от того или иного набора заданий?

Война существенно обострила интерес к вопросам соотнесения способностей человека с требованиями профессий. К началу второй мировой войны там уже был накоплен большой опыт разработки тестов. Война дала сильный толчок авиастроению. Соответственно, понадобились сотни тысяч пилотов, штурманов, механиков, стрелков-радистов, специалистов по наладке навигационного оборудования. Каждая из перечисленных профессий требовала наличия определенных способностей - интеллектуальных, физических, психомоторных, и все эти способности надо было быстро и эффективно оценить. Поскольку обучение военного летчика стоит дороже подготовки профессора, а отчисление неудачников проводилось, как правило, не ранее того, как курсанты проходили примерно третью часть срока подготовки, нетрудно было представить себе масштабы экономии средств за счет использования тестов. Один из активных участников процесса отбора военных специалистов подсчитал, что на каждый доллар, затраченный на эту программу, бюджет сэкономил тысячу долларов.

Анализ положения дел с тестовым контролем в СССР и в других странах показывал: многие страны опережали нас по масштабам практической работы, по финансированию научных исследований, по числу публикаций, по подготовке научных кадров, по уровню и качеству развития теории тестов, по технической и программно-вычислительной оснащенности тестового процесса. Хотя интерес к тестам в СССР заметно вырос, ситуация с ними не только не улучшилась, а в некотором отношении даже ухудшилась, потому что кажущаяся простота создания тестов, в сочетании с конъюнктурными интересами породили множество некачественных самоделок, дискредитирующих этот перспективный метод научной организации самоконтроля и объективного педагогического контроля знаний.

Наиболее развитые в тестовом отношении страны - Нидерланды, США, Англия, Япония, Дания, Франция, Израиль, Финляндия, Канада, Австралия, Новая Зеландия и др.  Нет никакой случайности в том, что в этот список попали страны с высоким уровнем жизни населения. Здесь связь опосредована цепочкой: применение тестов благотворно влияет на качество образования; качество образования связано с качеством управления; качественное управление создает предпосылки для повышения качества жизни населения.

Тесты дают возможность заметно улучшить образовательный процесс, потому что обладают рядом преимуществ перед другими методами контроля знаний; являясь обязательной частью многих педагогических новаций, они снижают затраты на проверку знаний, помогают выявить индивидуальный темп обучения, а также пробелы в текущей и итоговой подготовке.

В сочетании с персональным компьютером, тесты помогают перейти к созданию современных систем адаптивного обучения и контроля - наиболее современных организации учебного процесса. Без тестов невозможен переход к самой прогрессивному на сегодня обучению учащихся на основе так называемой у нас системы полного усвоения знаний. Именно в такой системе тесты и задания в тестовой форме буквально пронизывают всю учебную деятельность преподавателей и учащихся.

Обучение начинается с входного тестирования, сопровождается текущим контролем с помощью заданий в тестовой форме и заканчивается объективным тестированием учебных достижений. Кроме того, тесты позволяют наладить самоконтроль - самую полезную для обучения и гуманную форму контроля знаний, а также организовать рейтинг - эффективное средство повышения учебной мотивации.

Наука о тестах.

Для понимания сущности тестов важно разобраться в системе понятий. Понятия вообще образуют основу любой науки, и в этом смысле деятельность по разработке и эффективному применению тестов не является исключением.

Первые научные труды по теории тестов появилась в начале ХХ века, на стыке психологии, социологии, педагогики и других так называемых поведенческих наук (Behavioral Sciences).

Зарубежные психологи называют эту науку психометрикой (Psychometrika), а педагоги - педагогическим измерением (Educational measurement). Поскольку общего названия на русском языке пока нет, то мы будем придерживаться аванесовского варианта названия данной науки - тестология, которая может быть педагогической, психологической или социологической, в зависимости от того, где применяется и развивается.

Незамутненная идеологией и политикой, интерпретация названия "тестология" проста и прозрачна: наука о тестах.

Педагогическая тестология призвана заниматься вопросами разработки тестов для объективного контроля подготовленности учащихся ("учащихся" в самом широком смысле этого слова, а не просто "школьников", как можно предположить).

Педагогическая тестология - это прикладная методическая теория научной педагогики.

Ключевыми понятиями тестологии, как одной из методических теорий, являются измерение, тест, содержание и форма заданий, надежность и валидность результатов измерения. Кроме того, в тестологии используются такие понятия статистической науки, как выборочная и генеральная совокупность, корреляция[1] и др.

 

 

Что такое тест?

Слово "тест" вызывает у людей самые различные представления. Одни полагают, что это вопросы или задачи с одним готовым ответом, который надо угадать. Другие считают тест формой игры или забавы. Третьи пытаются истолковать это как перевод с английского слова "test", (проба, испытание, проверка). В наши дни существует много видов тестов, поэтому дать универсальное определение для всех этих видов вряд ли можно.

Существуют два основных класса тестов: традиционные и нетрадиционные.

Традиционный тест представляет собой стандартизованный метод диагностики уровня и структуры подготовленности. В таком тесте все испытуемые отвечают на одни и те же задания, в одинаковое время, в одинаковых условиях и с одинаковыми правилами оценивания ответов.        

Педагогический тест определяется как система заданий определенного содержания, возрастающей трудности, специфической формы, позволяющая качественно и эффективно измерить уровень и оценить структуру подготовленности учащихся. В педагогическом тесте задания располагаются по мере возрастания трудности - от самого легкого до самого трудного.

К традиционным тестам относятся тесты гомогенные и гетерогенные.

Гомогенные тесты

Гомогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по одной учебной дисциплине.

Легко видеть, что в своей основе определение гомогенного теста совпадает с определением традиционного теста.

Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика. В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства. Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное.

Гетерогенные тесты

Гетерогенный тест представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по нескольким учебным дисциплинам.

Нередко в такие тесты включаются и психологические задания для оценки уровня интеллектуального развития.

Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и, кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.

Традиционный тест представляет собой метод диагностики испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых условиях и с одинаковой оценкой.

Главная цель применения традиционных тестов - установить отношение порядка устанавливаемых между испытуемыми по уровню проявляемых при тестировании знаний. И на этой основе определить место (или рейтинг) каждого на заданном множестве тестируемых испытуемых. В тест стараются отобрать минимально достаточное количество заданий, которое позволяет сравнительно точно определить уровень и структуру подготовленности. Интерпретация результатов тестирования ведется преимущественно с опорой на среднюю арифметическую и, на так называемые, процентные нормы, показывающие, - сколько процентов испытуемых имеют тестовый результат худший, чем у любого другого испытуемого. Такая интерпретация тестовых результатов называется нормативно-ориентированной.

Интегративные тесты

Интегративным можно назвать тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника образовательного учреждения.

Диагностика проводится посредством предъявления таких заданий, правильные ответы на которые требуют интегрированных (обобщенных, явно взаимосвязанных) знаний в области двух и большего числа учебных дисциплин. Создание таких тестов дается только тем преподавателям, которые владеют знаниями ряда учебных дисциплин, понимают важную роль межпредметных связей в обучении, способны создавать задания, правильные ответы на которые требуют от учащихся знаний различных дисциплин и умений применять такие знания. Интегративному тестированию предшествует организация интегративного обучения. К сожалению, существующая сейчас классно-урочная форма проведения занятия, в сочетании с чрезмерным дроблением учебных дисциплин, вместе с традицией преподавания отдельных дисциплин (а не обобщенных курсов), еще долго будут тормозить внедрение интегративного подхода в процессы обучения и контроля подготовленности.

Преимущество интегративных тестов перед гетерогенными заключается в большей содержательной информативности каждого задания и в меньшем числе самих заданий.

Методика создания интегративных тестов сходна с методикой создания традиционных тестов, за исключением работы по определению содержания заданий. Для отбора содержания интегративных тестов использование экспертных методов является обязательным.

Адаптивные тесты

Адаптивный тест работает, как хороший экзаменатор. Сначала он "задает" вопрос средней сложности, и полученный ответ немедленно оценивается. Если ответ правильный, то оценка возможностей тестируемого повышается. В этом случае задается более сложный вопрос. При успешном ответе следующее задание ПК подбирает более трудным, при неуспешном - легким.

Преимущества адаптивного теста.

Главное преимущество адаптивного теста перед традиционным - эффективность. Адаптивный тест может определить уровень знаний тестируемого с помощью меньшего количества вопросов (иногда длина теста уменьшается до 60%).

В адаптивном тесте на каждый вопрос в среднем выделяется больше времени для обдумывания, чем в обычном тесте. Например, вместо 2 минут на каждый вопрос, у сдающего адаптивный тест может получиться 3 или 4 минуты (в зависимости от того, на сколько вопросов ему понадобится ответить).

Достоверность результатов адаптивного теста совпадает с достоверностью тестов фиксированной длины. Оба вида тестов одинаково точно оценивают уровень знаний.

Тем не менее, очень широко распространено мнение, что адаптивный тест более точно оценивает уровень знаний. Это неверно.

Содержание теста можно определить как оптимальное отображение учебного материала в системе тестовых заданий. Внеучебное содержание (например, проверка уровня интеллектуального развития) в педагогический тест не включается. Это предмет психологического измерения.

Поскольку в педагогическом тесте задания упорядочиваются по принципу возрастающей трудности, одни испытуемые "заваливаются" уже на самом легком, первом задании, другие - на последующих заданиях. Ученики среднего уровня подготовленности могут ответить правильно только на половину заданий теста и, наконец, только самые знающие в состоянии дать правильный ответ на задания самого высокого уровня трудности, расположенные в конце теста.

Ответ на задание педагогического теста представляет собой краткое суждение, связанное по содержанию и по форме с содержанием задания. Каждому заданию ставятся в соответствие ответы правильные и неправильные. Критерии правильности заранее определяются авторами теста. Вероятность правильного ответа на любое задание зависит от соотношения уровня знаний испытуемого и уровня трудности задания. При наличии сопоставимых шкал эту вероятность выражают значением от нуля до единицы. Посредством тестирования, чаще других признаков, проверяются знания, умения, навыки и представления. С точки зрения педагогических измерений полезно ввести два основных показателя качества знаний - уровень и структура знаний. Они оценивается посредством регистрации оценок, как за знание, так и за незнание всех требуемых компонентов проверяемого материала. Для объективизации этого процесса все компоненты должны быть одинаковы. Одинаковыми являются и правила выставления оценок испытуемым. Эти условия открывают дорогу для объективного сравнения индивидуальных структур знания и незнания.

Уровень знаний выявляется при анализе ответов каждого ученика на все задания теста. Чем больше правильных ответов, тем выше индивидуальный тестовый балл испытуемых. Один и тот же уровень знаний может быть получен за счет ответов на различные задания.

Принципы отбора содержания тестовых заданий.

Содержание теста можно определить как оптимальное отображение учебного материала в системе тестовых заданий. Слова "оптимальное отображение" предполагают необходимость отбора такого контрольного материала, ответы на который с высокой вероятностью (больше 95 %) свидетельствовали бы об уровне подготовленности каждого учащегося.

Есть всего четыре формы заданий:
1)Задания с выбором одного или нескольких правильных ответов из числа предложенных;
2) Задания открытой формы, где ответ испытуемый дописывает сам, в отведенном для этого месте;
3) Задания на установление соответствия;
4) Задания на установление правильной последовательности действий.

Число заданий традиционного теста обычно бывает не меньше тридцати. Банк заданий адаптивного теста содержит большее число заданий.

Некоторые элементы проверяемых знаний (преимущественно по отдельным темам) используются только в текущем контроле. Другие элементы, охватывающие знания нескольких тем, используются в рубежном контроле, например, в конце учебной четверти. И, наконец, в итоговом контроле используются задания, правильные ответы на которые требуют знания многих, а и иногда и всех тем, изученных в течение учебного года.

 







Структура теста

Тест, как система, обладает составом, целостностью и структурой

Целостность означает взаимосвязь заданий, их принадлежность общему измеряемому фактору. Каждое задание теста выполняет отведенную ему роль и потому ни одно из них не может быть изъято из теста без потери качества измерения.

Структура теста образует способ связи заданий между собой. 

Время нередко называется в качестве другого системообразующего фактора. Требование экономии времени становится естественным в массовых процессах, каковым и стало образование. От времени тестирования существенно зависит качество результатов. Каждый тест имеет оптимальное время тестирования, уменьшение или превышение которого снижает качественные показатели теста.

Качество теста традиционно сводится к определению меры его надежности и вопросов валидности[2] полученных результатов.

Валидность зависит от качества заданий, их числа, от степени полноты и глубины охвата содержания учебной дисциплины (по темам) в заданиях теста. Кроме того, валидность зависит также от баланса и распределения заданий по трудности, от метода отбора заданий в тест из общего банка заданий, от интерпретации тестовых результатов, от организации сбора данных, от подбора выборочной совокупности испытуемых. 

Дата: 2019-12-22, просмотров: 259.