Келлі, Ч. Спірмена - присвячені створенню системи базо-вих тестових завдань. У радянській школі були невдалі спроби пра-цювати за тестовою технологією в 30-х і 70-х роках, але розпо-всюдження цей вид контролю не отримав. З упровадженням мо-дульно-рейтингової системи тестові завдання є базою для перевірки досягнутого рівня розвитку здібностей, знань і вмінь.
Традиційний тест являє собою стандартизований метод оцін-ки рівня знань і структури підготовленості людини. При проведенні такого тестування всі відповідають на одні й ті ж завдання, протягом однакового часу, в однакових умовах і з однаковими правилами оцінювання відповідей. Головна мета застосування тра-диційних тестів - визначити співвідношення порядку, що встанов-люється за рівнем знань між тими, хто проходить тестування. І на цій основі визначити місце (чи рейтинг) кожного. Тут виникає одне з головних питань теорії тестів - питання підбору опти-мального за деякими критеріями тесту. Кожен тест може від-різнятися від інших тестів кількістю завдань, їх складністю, а також багатьма іншими характеристиками. З прагматичної точки зору краще робити тест, що має порівняно меншу кількість завдань, але який може відобразити весь спектр задачі.
Поняття "довжина тесту" введено на початку XX століття Ч. Спірманом і означає кількість завдань у тесті. Чим довший тест, тим більше в ньому завдань. Від кількості завдань деяким чином за-лежить точність виміру знань. Для тестування намагаються відібра-ти мінімально достатню кількість завдань, що дозволяє порівняно точно визначити рівень і структуру підготовленості. Інтерпретація результатів тестування ведеться переважно з опорою на середню арифметичну й на так звані процентні норми, що показують, скільки відсотків випробуваних мають тестовий результат гірший, ніж у будь-якого іншого випробуваного. Така інтерпретація тесто-вих результатів називається нормативно-орієнтованою.
Навчальний тест характеризується як система завдань визначеного змісту, зростаючої складності, специфічної форми, що дозволяє якісно й ефективно виміряти рівень і оцінити структуру підготовленості учнів. Навчальний тест є класичним представни-ком традиційних тестів. Для кращого розуміння визначення на
вчального тесту розглянемо коротке тлумачення його основних термінів. Будь-який тест складається з тестових завдань, але останні є не просто сукупністю довільно об'єднаних завдань, а утворюють систему.
Один з актуальних напрямків сучасної організації тестового контролю - це індивідуалізація контролю, що приводить до значної економії часу тестування. Контроль ведеться за допомогою зазда-легідь відкаліброваних за рівнем складності завдань. З іншого боку, від часу тестування істотно залежить якість результатів. Кожен тест має оптимальний час тестування, зменшення чи перевищення якого знижує якісні показники тесту. Оптимальний час тестування визначається емпірично, за показником дисперсії тестових даних. Якщо по осі абсцис відкласти час тестування, а по осі ординат - значення дисперсії тестових результатів, що отримується після кожної спроби контролю, то, з'єднавши точки, одержимо подання зміни дисперсії; де максимум значення останньої вкаже на оптимум часу, необхідного для тестового контролю.
Якість тесту традиційно зводиться до визначення міри його на-дійності й валідності отриманих результатів. Якісним, як і об'єктивним, можна назвати тільки той метод виміру, який обґрунто-ваний науково і здатний дати необхідні результати. Валідність означає відповідність тестових результатів меті, заради якої проводилося тестування. Валідність залежить від якості завдань, їхньої кількості, від ступеня повноти й глибини охоплення змісту навчальної дисципліни в завданнях тесту. Крім того, валідність залежить також від балансу й розподілу завдань за складністю, методу добору завдань у тест із загального банку завдань, інтер-претації тестових результатів, організації збору даних, підбору вибіркової сукупності випробуваних. Специфічна форма тестових завдань говорить про те, що завдання тесту являють собою не питання і не задачі, а завдання, сформульовані у формі вислов-лювань, істинних чи помилкових, залежно від відповідей. Визначений зміст означає використання в тесті тільки такого контрольного матеріалу, що відповідає змісту навчальної дисцип-ліни; інше в навчальний тест не включається. Зміст тесту існує, зберігається і передається в одній із чотирьох основних форм завдань. Поза тестовими формами ні тест, ні його зміст не існують. Теоретично виправданим критерієм упорядкування змісту є кри-терій складності завдань. Позанавчальний зміст (наприклад, перевірка рівня інтелектуального розвитку) у навчальний тест не включається. Це предмет психологічного виміру.
Складність завдань можна визначати двома способами:
на основі оцінки передбачуваних кількості й характеру розу-мових операцій, необхідних для вдалого виконання завдань і оцінки підготовки студента;
на основі емпіричної перевірки завдань із підрахунком частки неправильних відповідей на запитання тестів різної складності.
У класичній теорії тестів багато років розглядалися тільки емпіричні показники складності. У сучасних теоріях навчальних тестів, які використовуються в дистанційному навчанні, більше уваги почали приділяти характеру розумової діяльності в процесі виконання тестових завдань різних форм і психологічного типу учня. Показник складності завдання розглядається як важливий системо- й одночасно структуроутворюючий фактор тесту.
Наступний критерій – це критерій логічної визначеності тестового завдання. Його можна сформулювати словами, близь-кими до формулювання X. Каррі: "Завдання є визначеним, якщо на нього можна відповісти позитивно чи негативно і якщо існує ефективний процес для знаходження такої відповіді". Відповідь на завдання навчального тесту являє собою коротке судження, пов'язане за змістом і за формою зі змістом завдання. Кожному завданню ставляться у відповідність правильні й неправильні відповіді. Критерії правильності заздалегідь визначаються авторами тесту. Ймовірність правильної відповіді на будь-яке завдання залежить від співвідношення рівня знань випробуваного й рівня складності завдання. При наявності порівняльної шкали цю ймо-вірність виражають значенням від нуля до одиниці або шкалами інших видів. Оцінка відповідей за ступенем їх правильності про-водиться досить рідко, але при необхідності створюються завдання з такими