В предыдущей статье содержание теста определялось как оптимальное отображение содержания учебной дисциплины в системе тестовых заданий. Такое отображение открывает возможность нетрадиционного построения учебного процесса, в котором тестовые материалы используются не только для контроля подготовленности, но и для обучения. Например, применение заданий в компьютерных контрольно-обучающих программах позволяет учащимся самостоятельно обнаруживать пробелы в знаниях и принимать меры для их ликвидации. В таких случаях можно говорить об обучающем потенциале тестовых заданий.
При разработке теста каждый автор старается подобрать свою систему заданий, вследствие чего по одной и той же учебной дисциплине может оказаться несколько различных тестов, с неодинаковым охватом учебных тем, с несовпадающим числом заданий, и с разными баллами испытуемых. Возникает естественный вопрос - какой из тестов лучше измеряет интересующие знания? Ответ на этот вопрос дают эксперты. Лучшим часто считается тест, у которого содержание шире и оно охватывает более глубокие уровни знаний. Такое содержание определяется с опорой на ряд педагогических принципов.
Первый принцип разработки содержания теста - соответствие содержания теста целям тестирования - уже был рассмотрен в предыдущей статье. Остается добавить, что для оценки знаний выпускников образовательных учреждений на соответствие требованиям минимума содержания учебных программ, в средства оценки придется включать немало сравнительно легких заданий. Но тогда ни о каком тесте, в нормативном понимании этого слова, говорить не придется. Возникнет и ряд таких спорных вопросов, как определение минимально "проходного" балла (или процента правильного выполнения числа заданий, как было задумано в проекте закона об аттестации учащихся). По мнению автора, слова "минимальное содержание" (если они утвердятся в официальном лексиконе, вопреки тому, что такие слова вообще противоречат сути гуманитарно-ориентированной образовательной практики, декларируемой Министерством образования и науки РФ) можно будет соотнести с минимальной положительной оценкой. Это будет оценка "три". В то время как хорошие и отличные оценки должны выставляться за знания более широкие и глубокие, нежели минимально требуемые в образовательном стандарте. Отсутствие четко сформулированных, общественно одобряемых целей, согласованных с методами и организационными формами их достижения, заводят тестирование в России не столько в кризисное состояние (после которого могли бы ещё остаться надежды на выздоровление), сколько в тупик, выход из которого бывает в одном направлении - назад, к исходной точке. И это уже было в истории тестов советского периода.
Второй принцип - определение значимости проверяемых знаний. Принцип значимости указывает на необходимость включения в тест только тех элементов учебной программы, которые можно отнести к наиболее важным, без которых знания становятся несущественными, фрагментарными, состоящими из второстепенных элементов. Поскольку именно ключевые элементы формируют основу подлинных знаний, в тест в первую очередь включают, конечно, эти элементы. Отбор значимых элементов проводится с опорой на мнения педагогов-экспертов, имеющих личный опыт преподавания и проверки знаний по интересующей учебной дисциплине.
Третий принцип - взаимосвязь содержания и формы. При разработке тестов может оказаться уместной некоторая ассоциация с созданием произведений искусства. Настоящее искусство представляет собой, по словам Гегеля, законченное внутри себя соединение содержания с вполне соответствующей ему формой (1). Настоящий тест так же можно охарактеризовать как результат соединения содержания заданий с наиболее подходящей для них формой. Одновременно форма является способом существования и сохранения содержания задания. Вне тестовых форм ни тест, ни его содержание не существуют. Начинающие разработчики тестов часто допускают ошибки несоответствия формы задания его содержанию. Главное средство предупреждения таких ошибок - овладение классификацией видов знаний, которая будет опубликована в ближайших выпусках газеты. Не всякое содержание поддается выражению в форме тестового задания. Доказательства, обширные вычисления, многословные описания не поддаются представлению в тестовой форме. Из этого вытекает важный вывод - тестовую форму нельзя рассматривать как универсальную, пригодную на все случаи проверки знаний. Да и вряд ли в педагогике есть вообще какая-либо одна форма, которая могла бы выразить все богатство изучаемых знаний. Вместе с тем, тестирование является одной из наиболее объективных и технологичных форм проведения массового контроля знаний. В этом смысле сравниться с тестированием ни один из известных методов проверки знаний не может. Содержание контроля по каждой учебной дисциплине рассматривается сквозь призму подходящей формы. При этом анализ содержания теста относится к учебной дисциплине, в то время как поиск наилучших форм является предметом науки о тестах, т.е. педагогических измерений. В этой науке имеется несколько довольно развитых и конкурирующих теорий. Сейчас стало ясно, что нет абсолютно никаких оснований считать какую-либо одну теорию измерений более современней, чем другие теории.
Четвертый принцип - содержательная правильность тестовых заданий. В тест включается только то содержание учебной дисциплины, которое является объективно истинным и поддаётся аргументации. Хотя в педагогической литературе последних лет справедливо обосновывается правомерность выделения двух сложившихся методов познания мира - рационального, естественно научного и интуитивно-образного (2), в содержание тестового контроля знаний наметилась традиция включать те элементы знаний, которые поддаются преимущественно рациональной, нежели интуитивно-образной аргументации. Каждое задание теста опирается, как правило, на факт, правило, теорему, норму, закон или на апробированный в практике метод. Спорные точки зрения, вполне приемлемые в науке, не рекомендуется включать в содержание тестовых заданий. В отличие от вопросно-ответной формы заданий, где даются ответы, правильные в различной степени, тестовые задания обычно требуют определенных ответов, признаваемых в качестве точных и бесспорных.
Пятый принцип - репрезентативность содержания учебной дисциплины в содержании теста. При разработке теста обращается внимание на полноту и достаточность числа заданий для аргументированного вывода о знаниях. В самом деле, проверить знания учащихся можно по пяти-шести заданиям. Но где уверенность, что учащиеся знают остальные элементы содержания учебной дисциплины? Путь к появлению такой уверенности лежит в наиболее полном отображении необходимого знания в заданиях теста. Репрезентативность не означает обязательного включения в тест всех значимых элементов содержания или строго пропорционального включения в тест заданий по различным темам. Ведь многие из них явно связаны между собой в общей структуре знаний, включены один в другой, полностью или частично. Кроме того, много элементов в структуре знаний иерархически соподчинены, а потому из соображений экономии, нет смысла включать в тест задания из всех изучавшихся тем.
Задания, которые выявляют знания таких элементов, можно назвать содержательно-структурными заданиями теста. Примерный план создания содержательной системы репрезентативных заданий можно найти в первой тестовой публикации автора данной статьи (3). Стремление к повышению валидности тестовых результатов путем расширения числа тем учебной дисциплины и увеличения числа заданий в тесте нельзя, в принципе, признать правильным. Нет таких тестов, содержание которых вбирало бы в себя все содержание учебной дисциплины. При создании теста обычно ставится задача отобразить в нем то основное, что отражает идею измерения уровня и структуры подготовленности учащихся, как результат образовательной деятельности.
Можно сказать так: содержание учебной дисциплины всегда шире содержания теста. Содержание некоторых заданий теста заметно связано, иногда перекрывает содержание других заданий, и потому может замещаться, что позволяет уменьшить общее число заданий в тесте. Репрезентативность заданий связана с числом заданий. В общем случае, чем больше заданий, тем репрезентативнее могут оказаться результаты. Число заданий традиционного теста обычно бывает не меньше тридцати. Банк заданий адаптивного теста содержит большее число заданий.
Число заданий в тесте зависит, во-первых, от содержания проверяемого материала: чем больше объем проверяемых знаний, тем большее обычно требуется число заданий. Во-вторых, от вида тестов; интегративные тесты требует меньшего числа заданий, в силу того, что для правильного решения каждого задания надо обладать знаниями различных учебных дисциплин. Следовательно, тест, состоящий из интегративных заданий, охватывает большее число проверяемых учебных элементов. И в-третьих, точность педагогических измерений зависит от числа заданий; в традиционном тесте точность измерения растёт по мере увеличения числа заданий.
Шестой принцип - соответствие содержания теста уровню современного состояния науки. Этот принцип вытекает из естественной необходимости проверять знания школьников не на устаревшем, а на современном учебном и контрольном материале. Трудность реализации этого принципа заключается в опосредованной связи содержания теста с уровнем развития науки. Здесь полезно напомнить, что учебный предмет представляет своеобразную проекцию научного знания в плоскость усвоения (4, с. 4).
Седьмой принцип - комплексность и сбалансированность содержания теста. Тест, разработанный для итогового контроля знаний, не может состоять из материалов только одной темы, даже если эта тема является самой ключевой в учебной дисциплине. Необходимо искать задания, комплексно отображающие основные, если не все, темы учебного курса. В то же время существует стремление сбалансировано отобразить в тесте основной теоретический материал - понятия, законы и закономерности, гипотезы, факты, вместе с методами научной и практической деятельности, с умениями эффективно решать типовые задания. Особенно важен этот принцип для разработки интегративных тестов, рассмотренных в статье "Нетрадиционные тесты" (УШ № 33, сентябрь 1999 г.).
Восьмой принцип - системность содержания. Это означает формулирование такого содержания тестовых заданий, которое отвечало бы требованиям системности при проверке знаний. Помимо подбора заданий с системным содержанием важно иметь задания, связанные между собой общей структурой знаний. Это возможно в тех случаях, когда каждое задание проверяет преимущественно свою часть в общей системе знаний. Идеальный вариант при разработке теста - когда задания не пересекаются по содержанию между собой, но все имеют положительные корреляции с каким-либо внешним критерием знаний испытуемых.
Девятый принцип - вариативность содержания. После первого применения теста его содержание становится известным испытуемым. И если есть условия для передачи информации о содержании заданий другим учащимся, то это почти всегда делается. Испытанным в практике способом защиты тестовых результатов от возможных искажений такого рода является создание множества вариантов заданий одного и того же теста. Соответственно варианты теста, состоящие из вариантов заданий, называются параллельными, если при этом выполняются еще и некоторые статистические условия. Например, они должны быть примерно равны по трудности, иметь сходные показатели вариации тестовых баллов испытуемых.
Литература
1. Гегель Г. Энциклопедия философских наук // Соч. Т. 1, 1929.
2. Зорина Л.Я. Единство двух культур в содержании непрерывного образования //Педагогика, № 5, 1998, с. 22-28.
3. Аванесов В.С. Вопросы объективизации оценки результатов обучения. НИИ проблем высшей школы. Обзорная информация. Серия: Обучение и коммунистическое воспитание в высших и средних специальных учебных заведениях. М. 1976.- 66с.
4. Давыдов В.В. Виды обобщения в обучении. М. Педагогика, 1972. - 424с.