ланцюжка: завдання => відповіді => висновки про відповідність заданому критерію.
Під критеріально-орієнтованою інтерпретацією маються на увазі порівняння змісту атестаційних матеріалів із результатами тестування і висновок: що із заданого стандарту й на якому рівні реально засвоєно. При критеріально-орієнтованій інтерпретації по-трібна трохи менша кількість завдань, за допомогою яких визна-чається, що випробуваний знає і чого не знає із заданого стандарту. Інакше кажучи, тут відповіді оцінюються не з усієї області (Domain) необхідних знань, а тільки з області, обмеженої конкретним стандартом чи рівнем (критерієм) знань.
Концепція добору змісту тестових завдань
Зміст тесту можна визначити як оптимальне відображення навчального матеріалу в системі тестових завдань [12]. Слова "оптимальне відображення" припускають необхідність добору такого контрольного матеріалу, відповіді на який з високою ймовірністю (більше 95%) свідчили б про рівень підготовленості кожного учня. Оптимальне відображення припускає також можли-вість вибору придатної форми й необхідної кількості завдань. Виді-ляють чотири форми:
завдання з вибором однієї чи декількох правильних відповідей з числа запропонованих;
завдання відкритої форми, де відповідь дописується у відведеному для цього місці;
3)завдання на встановлення відповідності;
4)завдання на встановлення правильної послідовності дій. Кількість завдань традиційного тесту звичайно буває не менше тридцяти. Банк завдань адаптивного тесту містить більше завдань. При тестуванні перевіряється не весь програмний матеріал, а лише та частина навчальної програми, яка входить у зміст. Це знання, що підлягають обов'язковій перевірці в кожній системі дистанційного навчання. Деякі елементи знань, що перевіряються (переважно з окремих тем), використовуються тільки в поточному контролі. Інші елементи, що охоплюють знання декількох тем, використовуються в рубіжному контролі, наприклад наприкінці навчальної чверті. І, нарешті, в підсумковому контролі використовуються завдання, правильні відповіді на які вимагають знання багатьох, а іноді й усіх тем, вивчених протягом навчального року.
Складність тесту і його вплив на оцінку знань Якщо педагогічний тест визначити коротко як систему завдань зростаючої складності, то стане зрозуміло, що складність завдань є найважливішим тестоутворюючим показником [13]. Пер-ша вимога до тестових завдань: у тесті завдання повинні розріз-нятися за рівнем складності, що випливає з даного раніше визна-чення тесту й розглянутого принципу. Завдання мають шанс стати тестовими лише після емпіричної перевірки міри їх складності. Показник складності тесту й тестових завдань є змістовним і формальним одночасно. Змістовним показником тому, що в хоро-шому тесті складність може залежати як від змісту, так і від рівня підготовленості самих випробуваних, у той час як у поганому тесті на результати починають помітно впливати форма завдань (особливо якщо вона не адекватна змісту), погана організація тестування і т. д. Формальна складова сторона показника складності виникає при розгляді тестування як процесу протистояння про-понованим завданням. Одержуваний при цьому результат корисно розглядати як результат такої боротьби. При спрощеному тлумаченні кожного випадку протистояння з черговим завданням звичайно розглядаються тільки два результати: перемога при правильному рішенні завдання, де отримується один бал, чи поразка, за що дається нуль балів. Оцінка результату такої боротьби залежить від співвідношення рівня знання до рівня складності завдання, від обраної одиниці виміру знань і від заздалегідь прийнятого прав«,а - що вважати "перемогою", а що ні. Тради-ційною мірою складності кожного завдання довгі роки була частка правильних відповідей у групах, де проводиться тестування, яка зображається символом pj (індекс j указує на номер завдання – 1, 2 і т. д.). Наприклад, якщо правильні відповіді на третє завдання тесту оцінювати одним балом, а неправильні – нулем, то значення показника р3 можна знайти з елементарного відношення:
,
де R3 означає кількість правильних відповідей на дане завдання, а N - загальну кількість випробуваних у групі. Загальна формула розрахунку частки правильних відповідей на будь-яке завдання (j) має відповідний вигляд:
.
Показник pj довго використовувався як міра складності в класичній теорії тестів. Пізніше була усвідомлена суттєва неточність, що міститься в ній: збільшення значення pj вказує не на зростання складності, а, навпаки, на зростання легкості, якщо можна використовувати таке слово. Тому в останні роки з показ-ником складності завдань стали асоціювати протилежну статистику - частку неправильних відповідей (qj). Ця частка обчислюється з відношення кількості неправильних відповідей (Wj - від англ. слова wrong – неправильний) до кількості випробуваних (N):
Таким чином, приймається, що .
У класичній теорії тестів багато років розглядалися тільки емпіричні показним складності. У нових варіантах психологічних і педагогічних теорій тестів більше уваги стали приділяти характеру розумової діяльності учнів у процесі виконання тестових завдань різних форм. Зміст кету не може бути тільки легким, середнім чи важким. Тут повною мірою виявляється відома думка про залеж-ність результатів застосовуваного методу. Легкі завдання тесту створюють тільки видимість наявності знань в учнів, тому що ними перевіряються мінімальні знання. Спотворює результати тестування підбір свідомо важких завдань, у результаті чого в більшості студентів виявляються занижені бали. Орієнтація на важкі завдання нерідко розглядається як засіб посилення мотивації до навчання однак цей засіб діє неоднозначно. Одних важкі завдання можуть підштовхнути до навчання, інших - навпаки. Подібна орієнтація спотворює результати й, у підсумку, знижує якість педагогічного виміру. Якщо тест побудований строго із завдань зі зростаючою складністю, то цим відкривається шлях до створення однієї із найцікавіших шкал виміру - шкали Л.Гутмана. Розповсюджена донедавна рекомендація включати в тест більше завдань середньої складності виправдана з; погляду визначення надійності виміру за формулами класичної теорії тестів.