Использование тестов для оценки качества знаний учащихся по математике

Аналитическое образование » Тесты в технологии блочного обучения математике учащихся полной средней школы » Использование тестов для оценки качества знаний учащихся по математике

Страница 1

Методологически слабая обеспеченность в области тестирования привела к тому, что в педагогическом сообществе в настоящее время нет единого понимания терминологии. Под тестом понимается:

– проба, испытание, исследование (Советский энциклопедический словарь);

– инструмент, который состоит из задания на деятельность данного уровня, позволяющего выявить факт усвоения (В. П. Беспалько);

– стандартизированный метод диагностики уровня и структуры подготовленности (В. С. Аванесов);

– система специально составленных заданий, решение которых имеет однозначно правильные ответы (Е. А. Михайлычев);

– метод педагогической диагностики (К. Ингекамп).

Примем следующее определение теста.

Тест – это инструмент, состоящий из системы стандартизированных заданий, стандартизированной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов.

Отметим, что все основные функции контроля: обучающая, развивающая, мотивационная, диагностическая и прогностическая - реализуются через его нетрадиционную форму – тесты.

Самое существенное требование, отличающее тест от экзамена и от остальных методов контроля, - это обязательная проверка его качества. Существуют соответствующие научнообоснованные критерии, которые позволяют оценить качество теста: объективность, надежность, валидность, трудность, эффективность.

Остановимся подробнее на каждом из показателей.

Объективность. Тесты, как показывает опыт, являются значительно более качественным и объективным способом оценивания. Объективность тестирования достигается путем стандартизации процедуры его проведения и проверки показателей качества заданий и тестов целиком. Тесты — более емкий инструмент, их показатели ориентированы на измерение степени, определение уровня усвоения ключевых понятий, тем и разделов учебной программы, умений, навыков, а не на констатацию наличия у школьников определенной совокупности усвоенных знаний. Стандартизированная форма оценки, используемая в тестах, позволяет соотнести уровень успехов учащегося по предмету, как в целом, так и по отдельным разделам со средним уровнем учащихся в классе. К тому же тесты — более объемный инструмент. Выполняя тестовые задания, каждый ученик использует знания по всем темам, предусмотренным программой. Еще одно существенное отличие тестов от традиционных методов аттестации состоит в том, что использование при тестировании процедур и единых критериев оценки приводит к снижению экзаменационных стрессов. Тест — широкий инструмент и с точки зрения интервала оценивания. Если провести аналогию с прыжками в высоту, то традиционная контрольная работа представит собой не линейку, а палочку, на которой нанесены три риски — 5, 4 и 3. В случае выполнения учеником всех заданий он получает отличную отметку. При этом совершенно не ясно, перепрыгнул он палочку с запасом в несколько раз или пролетел прямо над ней. То же можно сказать и про нижнюю отметку. При сравнении тестирования и традиционного оценивания можно увидеть, что первое предоставляет возможность расширить шкалу оценивания как вверх, так и вниз. Означает ли тот факт, что если ученик не выполнил ни одного задания, что он ничего не знает? Скорее всего, нет. Давая широкие возможности для проявления достижений, тест представляет собой измерительный инструмент примерно трехметровой высоты, риски на котором расположены практически от земли. В этом отношении тестирование приходит в противоречие с учительским стереотипом о том, что отличную оценку нужно выставлять только в том случае, если все задания выполнены правильно. Можно отметить и гуманизм тестирования, который заключается в том, что всем предоставляются равные возможности, а широта теста дает возможность ученику показать свои достижения на широком поле материала. Таким образом, ученик получает некоторое право на ошибку, которого он лишен при традиционном способе оценивания.

Надежность. Под надежностью понимают согласованность результатов проведения теста на одной и той же группе испытуемых, но при изменении условий проведения, чаще всего либо времени, либо набора тестовых заданий. Надёжность - фундаментальная характеристика теста, которая показывает, в какой степени стабильны результаты тестирования при неоднократном обследовании. Обычно для оценки надежности тест проводят два раза и сравнивают полученные тестовые баллы. Чем более схожи результаты двух тестирований, тем более высок уровень надежности тестов.

Валидность. Валидность теста - его пригодность для достижения поставленной цели: пригодность по содержанию, пригодность к применению в конкретных обстоятельствах, пригодность по какому-либо критерию. Валидность педагогического теста по содержанию может быть определена опытным преподавателем-экспертом, который отмечает, что задания теста: соответствуют учебной программе; охватывают всю программу; имеют высокую вероятность того, что учащийся, успешно ответивший на задания теста, знает предмет в соответствии с полученной оценкой (при установлении соответствия тестового балла принятой систем отметок в качестве критериев обычно берутся оценки, выставляемые учащимся группой преподавателей-экспертов при традиционной форме контроля знаний). Тест может быть валидным, если, помимо прочих требований, средние результаты соответствуют большей части учащихся группы, а сами данные распределяются по нормальному закону. Если это условие не выполняется, то такой тест считается невалидным с точки зрения соответствия стандартам распределения. Мера валидности теста может определяться так же сравнением с тестом-эталоном и сопоставлением с более объективными показателями, полученными другими методами. Валидность теста существенно уменьшается из-за снижения его различающей способности. Различающая способность теста тем выше, чем меньше одинаковых тестовых баллов набирают сами учащиеся. Валидность теста зависит и от длины теста. Под длиной теста понимают количество заданий, входящих в тест. Существуют тесты очень короткие, состоящие из 7-15 заданий, и очень длинные, состоящие из более 500 заданий. Если тест очень длинный, то ухудшается мотивация и внимание учащихся, а это снижает надежность и валидность. Практика показывает, что если тестирование занимает более полутора часов, то испытуемые с неохотой соглашаются отвечать на вопросы теста. С другой стороны, с точки зрения теории, чем тест длиннее, тем он надежнее. Возникающее противоречие между теорией и практикой решается компромиссом в ту или в другую сторону, в зависимости от конкретного случая.

Страницы: 1 2 3 4


Статьи по теме:

Навигация

Copyright © 2024 - All Rights Reserved - www.basicpedagog.ru