Теории тестов TCT и TRI
Тесты используются в психологии в качестве измерительных инструментов. Чтобы немного приблизиться к понятию и не быть полностью точным, так же, как мы используем измеритель для измерения длины, мы могли бы использовать тест для измерения интеллекта, памяти, внимания ... Одним из различий между одним и другим действием будет то, что тесты не так легко построить, в дополнение к тому, как мало они так легко применяются.
Кроме того, так же, как одно измерение не позволяет нам говорить об объеме объекта, администрирование одного теста также не позволяет нам диагностировать или предлагать вмешательство. так, тесты важны для оценки, но они не являются определяющими.
Именно здесь психолог играет наиболее важную роль: каким-то образом он должен использовать информацию, которую он получил из теста и из других источников, для придать форму последовательной оценке, которая уступит место планированию вмешательства. Другими словами, именно во время интеграции результатов из разных источников качество профессионала наиболее заметно. Мы говорим об опыте, который достигается с помощью знаний, но и с многолетним опытом.
Краткая история теорий испытаний
Происхождение тестов обычно указывается в тестах, проводимых китайскими императорами в 3000 лет до нашей эры. Таким образом, они имели целью оценить профессиональную компетентность офицеров, которые собирались поступить на службу. (1)
Текущие тесты имеют самое близкое происхождение в тестах, проведенных Galton (1822-1911) в своей лаборатории. Однако именно Джеймс Кэттелл впервые использовал термин мысленный тест, в 1890 году. Поскольку эти первые тесты не оказались слишком предсказуемыми для когнитивных способностей человека, такие исследователи, как Бине и Саймон (1905), вводят в своей новой шкале когнитивные задачи для оценки таких аспектов, как суждение, понимание и рассуждение.
Шкала Binet открывает традицию индивидуальных весов. В дополнение к когнитивным тестам в личностных тестах достигнуты большие успехи..
Зачем нужны теории тестов??
Прежде чем все достигнутые успехи, они начинают поочередно разрабатывать теории измерения (теории испытаний), которые непосредственно влияют на испытания как на инструменты. При стремлении создать инструменты, которые измеряют то, что мы хотим, чтобы они измеряли и делали это с наименьшей возможной ошибкой, появляется психометрия. Психометрия, которая потребует каждый тест или измерительный инструмент, который утверждает, что он действителен и надежен,
Напомним, что надежность понимается как стабильность или последовательность измерений при повторении процесса измерения. Другими словами, тест будет тем надежнее, чем лучше он будет повторять результаты при измерении двух предметов - или одного и того же предмета в разных возможностях - которые имеют одинаковый уровень в измеряемом. Со своей стороны, Обоснованность относится к степени, в которой эмпирические данные и теория подтверждают интерпретацию результатов. из тестов. (2)
Таким образом, есть две большие теории тестов или подходов, когда мы говорим об анализе и построении инструментов этого типа: классическая теория испытаний (TCT) и теория отклика на предметы (TRI).
Классическая теория тестов (TCT)
Это доминирующая теория в построении и анализе тестов. Чаша: сравнительно легко построить тесты, которые соответствуют минимальным требованиям этой парадигмы. Оценка самого теста с точки зрения упомянутых параметров также относительно проста: надежность и достоверность.
Он возник в работах Спирмена в начале 20-го века.. Затем, в 1968 году, исследователи Лорд и Новик проводят переформулировку этой теории и открывают путь к новому подходу TRI..
Эта теория основана на классической линейной модели. Эта модель была предложена Спирменом и состоит из предположения, что оценка, которую человек получает в ходе теста, который мы называем его эмпирической оценкой и который обычно обозначается буквой X, состоит из двух компонентов. (2)
С одной стороны, мы находим истинную оценку объекта в тесте (V), а с другой - ошибку (e). Это выражается следующим образом: X = V + e.
Спирмен добавляет три допущения к этой теории:
- Сначала определите истинный счет (V) как математическая надежда эмпирическая оценка: Это оценка, которую человек получил бы в тесте, если бы он делал это бесконечное количество раз.
- не есть отношения между количество истинных результатов и размер ошибок которые влияют на эти оценки.
- Наконец, Погрешности измерения в тесте они родственный с ошибки измерения в другом другом тесте.
Чтобы завершить эту теорию, Спирман определяет параллельные тесты как те тесты, которые измеряют одно и то же, но с разными предметами.
Ограничения классического подхода
Первое ограничение заключается в том, что в рамках этой теории измерения не являются инвариантными. по отношению к используемому инструменту. Это означает, что если психолог оценивает интеллект трех человек с разными тестами для каждого, результаты не сопоставимы. Но почему это происходит??
Ну, результаты трех измерительных приборов не в той же шкале: у каждого теста своя шкала. Чтобы иметь возможность сравнивать, например, интеллект X людей, которые были оценены с помощью различных тестов интеллекта, необходимо преобразовать полученные оценки непосредственно из теста в других масштабах.
Проблема в том, что, трансформируя баллы в baremadas, мы предполагаем, что нормативные группы, в которых они были разработаны шкалы различных тестов сопоставимый - то же среднее, то же стандартное отклонение-, что сложно гарантировать на практике. (1) Таким образом, новый подход TRI предполагал большой прогресс по этому факту. Таким образом, TRI достигнет того, что результаты, полученные с использованием различных инструментов, будут в одном масштабе.
Второе ограничение этого подхода - отсутствие инвариантности свойств теста. в отношении людей, использовавших для его оценки. Таким образом, в рамках TCT важные психометрические свойства тестов зависят от типа выборки, используемой для их расчета. Это факт, который также находит решение, по крайней мере частичное, в подходе TRI.
Теория ответа предмета (TRI)
Теория реагирования на предметы (TRI) рождается как дополнение к теории классических тестов.. Другими словами, TCT и TRI могут оценить один и тот же тест, а также установить оценку или релевантность для каждого из пунктов, что, в свою очередь, может дать нам разные результаты для каждого человека. С другой стороны, чтобы указать, что TRI даст нам гораздо более качественный калиброванный инструмент, проблема в том, что эта парадигма имеет гораздо более высокую стоимость и участие специализированных специалистов..
У TRI есть несколько допущений, но, возможно, самое важное из них говорит нам, что любой измерительный прибор должен соответствовать идее: функциональная связь между значениями переменной, которая измеряет элементы, и вероятностью попадания в них. Эта функция называется Характеристическая кривая изделия (ТПП). Что мы предполагаем тогда??
Ну, то, что со стороны может показаться очень логичным и что TCT не оценивает. Например, самыми трудными будут те, на которые отвечают только самые умные люди. С другой стороны, предмет, на который все люди хорошо отвечают, не будет стоить того, потому что он не сможет различить. Другими словами, это не даст никакой информации. Это всего лишь небольшой набросок революции, предложенной ТРИ.
Чтобы лучше увидеть различия между одной моделью измерения и другой, мы можем взять в качестве справочной таблицы Хосе Муньиса (2010):
Таблица 1. Различия между TCT и TRI (Muñiz, 2010)
аспекты | TCT | TRI |
модель | линейный | нелинейный |
допущения | Слабый (легко встретить для данных) | Сильный (трудно встретить для данных) |
Измерение инвариантности | не | да |
Инвариантность тестовых свойств | не | да |
Шкала баллов | От 0 до максимума в тесте | бесконечность |
акцент | тест | пункт |
Отношение предмет-тест | Не указано | Характеристическая кривая изделия |
Описание предметов | Индексы сложности и дискриминации | Параметры a, b, c |
Погрешности измерений | Типичная ошибка измерения, общая для всего образца | Информационные функции (варьируется в зависимости от уровня способностей) |
Размер образца | Он может хорошо работать с образцами от 200 до 500 предметов примерно | Рекомендуется более 500 предметов |
Вот как связаны обе теории тестов. Хотя, будучи почти равным, кажется, что TRI родился в ответ на ограничения или проблемы, которые может развить TCT. Тем не менее, очевидно, что исследованиям в этой области психометрии еще предстоит пройти долгий путь..
Психологические тесты: характеристики и функционирование Психологические тесты - это инструменты, которые используются в психологии для измерения переменных, которые интересуются знанием. Читать дальше "