Теория ответа на предмет - Приложения и тесты
В области Теория психометрических тестов Появились разные деноминации, которые в настоящее время принимают название «Теория ответа предмета» (F.M. Lord, 1980). Это наименование представляет некоторые различия в отношении классической модели: 1.- отношение между ожидаемым значением баллов субъекта и признаком (характеристика, ответственная за значения), обычно не является линейным. 2.- стремится делать индивидуальные прогнозы без необходимости ссылаться на характеристики нормативной группы.
Вы также можете быть заинтересованы в: Индекс классической теории испытаний- Теория ответа на предмет или модели скрытой черты в теории испытаний
- Модели теории ответа предмета (три)
- Оценка параметров
- Тестовая конструкция
- Приложения теории ответа предмета
- Интерпретация баллов
Теория ответа на предмет или модели скрытой черты в теории испытаний
Таким образом, мы видим, что эта Теория Ответа на предмет дает возможность описать как предметы, так и отдельных людей; Он также считает, что ответ, данный субъектом, зависит от уровня навыка, который имеет в рассматриваемом диапазоне. Происхождение этих моделей связано с Лазарсфельдом, 1950, который ввел термин «скрытая черта» .
Отсюда считается, что каждый человек имеет индивидуальный параметр, который отвечает за характеристики субъекта, также называемый «черта». Эта особенность не поддается непосредственному измерению, поэтому отдельный параметр называется скрытой переменной. При применении тестов вы можете получить две разные вещи, истинный балл и шкалу фитнеса; Это достигается, если мы сдадим два теста на одну и ту же пригодность в одну группу.
В теории скрытого признака или теории ответа на предмет Истинная оценка - это та величина, которая ожидается от наблюдаемой оценки. По словам Господа, истинная оценка и приспособленность - это одно и то же, но они выражены в разных шкалах измерения..
Модели теории ответа предмета (три)
Модели биномиальных ошибок: были введены Лордом (1965), в котором предполагается, что наблюдаемая оценка соответствует количеству правильных ответов, полученных в тесте (элементы которого имеют одинаковую сложность и локальную независимость, то есть вероятность на правильный ответ на предмет не влияют ответы, данные на другие предметы).
Модели Пуассона: эти модели подходят для тех тестов, которые имеют большое количество пунктов и в которых вероятность правильного или неправильного ответа мала. В пределах этой группы, в свою очередь, у нас есть разные модели:
- Пуассоновская модель Раша, чьи гипотезы таковы: каждый тест имеет большое количество двоичных элементов, которые являются локально независимыми. вероятность ошибки в каждом элементе мала. Вероятность того, что субъект допустил ошибку, зависит от двух вещей: сложности теста и способности субъекта. аддитивность трудностей, понимаемая как результат смешения двух эквивалентных тестов в одном тесте, сложность которого равна сумме трудностей двух начальных тестов.
- Модель Пуассона для оценки скорости: Эта модель была также предложена Rasch и характеризуется тем, что скорость выполнения теста принимается во внимание. Модель может быть предложена двумя способами: подсчитать количество допущенных ошибок и количество слов, прочитанных за единицу времени. подсчитайте количество допущенных ошибок и время, потраченное на завершение чтения текста. Вероятность реализации определенного количества слов в тесте (i) субъектом (j) за время (t)
- Оджива Нормальные Модели: это модель, предложенная Лордом (1968), которая используется в тестах с дихотомическими элементами и только с одной общей переменной. Ее график будет следующим: Основные предположения, которые характеризуют эту модель:
- пространство латентного варианта одномерно (k = 1).
- местная независимость между целями.
- метрика для скрытой переменной может быть выбрана так, чтобы кривая каждого предмета была нормальной боеголовкой.
Логистические Модели; Это модель, очень похожая на предыдущую, но она также имеет больше преимуществ по сравнению с математической обработкой. Логистическая функция принимает следующую форму: Существуют разные логистические модели в зависимости от количества параметров, которые имеют:
- 2 параметра логистической модели, Birnbaum 1968, среди его характеристик отметим, что он одномерный, есть локальная независимость, элементы дихотомические и т. Д.
- 3 параметра логистической модели, Господа, характеризуется тем, что вероятность удара по гаданию является фактором, который будет влиять на эффективность теста. 4,3. Логистическая модель с четырьмя параметрами: модель, предложенная Макдональдом в 1967 году и Бартоном-Лордом в 1981 году, целью которой является объяснение тех случаев, когда субъекты с высоким уровнем физической подготовки не реагируют правильно на предмет.
- Логистическая модель Rasch: Эта модель создала наибольшее количество заданий, несмотря на недостаток, заключающийся в том, что ее адаптация к реальным данным более сложна, но, в отличие от этого, преимущество, которое делает ее столь используемой, состоит в том, что она не требует больших Размеры выборки для вашей корректировки.
Оценка параметров
Метод, который использовался чаще всего, это Максимальное правдоподобие, рядом с этим методом используются процедуры численного приближения, такие как Ньютон-Рафсон и Скоринг (Рао). Метод максимального правдоподобия основан на принципе получения оценок неизвестных параметров, которые максимизируют вероятность получения указанных выборок. В дополнение к максимальному правдоподобию, также используется байесовская оценка, основанная на теореме Байеса, которая состоит из включения всей известной информации, априори, которая имеет отношение к процессу принятия выводов. Более глубокое исследование байесовского метода для оценки параметров пригодности - это Birnbaum (1996) и Owen (1975). .
ИНФОРМАЦИОННЫЕ ФУНКЦИИ
Лучший тест, который можно построить, - это тот, который предоставляет больше информации о скрытой характеристике. Количественная оценка этой информации осуществляется с помощью «информационных функций». Формула информационной функции, Birnbaum 1968, следующая: необходимо учитывать, что информация, полученная в тесте, является суммой информации каждого элемента, кроме того, вклад каждого элемента не зависит от остальных элементов. что составляет тест. В общих чертах можно сказать, что информация во всех моделях:
- зависит от уровня физической подготовки.
- Чем больше наклон кривой, тем больше информации.
- зависит от дисперсии баллов, чем выше это, тем меньше информации.
Тестовая конструкция
Первое задание и одним из наиболее важных на момент создания теста является выбор элементов, предшествующий аккорд теоретических предположений, которые должны определять характеристику, которую тест намеревается измерить. Понятие «предметный анализ» относится к набору формальных процедур, которые выполняются для выбора тех предметов, которые в конечном итоге образуют тест. Информация, которая считается наиболее актуальной в отношении предметов:
- Сложность пункта, процент людей, ответивших на него.
- Дискриминация, корреляция каждого элемента с общим баллом по тесту.
- Анализ отвлекающих факторов или ошибок, его влияние имеет значение, влияет на сложность предмета и приводит к недооценке значений дискриминации.
Во время установления показателей различных индексов обычно используются статистические данные или индексы, наиболее часто используются следующие:
Индекс сложности Индекс дискриминация Индекс надежности Индекс действительности Известные индексы, которые необходимо учитывать при выборе элементов, которые будут формировать тест, посмотрим, какие шаги необходимы для построения теста:
- Спецификация проблемы.
- Представить широкий набор элементов и отладить их.
- Выбор модели.
- Проверьте предварительно выбранные предметы.
- Выберите лучшие предметы.
- Изучите качества теста
- Установить нормы интерпретации полученного итогового теста.
Из предыдущих пунктов следует отметить, что выбор модели, пункт 3, будет зависеть от целей, которые преследует тест, характеристик и качества данных, а также от имеющихся ресурсов. Когда модель выбрана, учитывая теоретические условия, в которых она может быть применена, нет несмотря на его достоинства они должны быть проанализированы в каждом конкретном случае и при определенных обстоятельствах. Свойства, относящиеся к тем моделям, которые составляют Теория ответа на предмет (TRI), На них могут повлиять:
- размерность теста скудная доступность выборки нехватка компьютерных ресурсов При использовании той или иной модели есть ряд предпочтений, давайте посмотрим на них: нормальные модели боеголовок обычно не используются в приложениях, их значение теоретическое.
- Rasch: подходит для горизонтального сравнения (сопоставимые тесты по уровням сложности с аналогичными распределениями фитнеса). иметь разные формы одного и того же теста. * 2 и 3 параметра: те, которые лучше всего подходят для множества задач.
- обнаруживать ошибочные образцы ответа. для вертикального выравнивания тестов (сравните тесты с разными уровнями сложности и разными распределениями для пригодности).
1 и 2 параметры:
- подходит для построения единой шкалы, так что вы можете сравнить навыки на разных уровнях.
На выбор модели, помимо преследуемой цели, может влиять размер выборки; В случае, когда выборка велика и репрезентативна, не будет проблем ни с классической моделью, ни с латентной чертой. Но в ТРИ ( теория ответа предмета ) небольшая выборка заставляет выбирать модели с небольшим количеством параметров, даже однопараметрическую модель.
Приложения теории ответа предмета
Давайте посмотрим, каковы наиболее распространенные приложения: а) Выравнивание тестов, иногда необходимо связать оценки, полученные в разных тестах, с двумя возможными целями:
- Горизонтальное выравнивание: ищется получить разные формы одного и того же теста.
- Вертикальное выравниваниеЦель: построить единую шкалу способностей с разными уровнями сложности. Что касается выравнивания тестов, Лорд (1980) вводит концепцию «справедливости», которая подразумевает, что для каждого субъекта два теста могут быть взаимозаменяемыми, так как применяется то, что одно или другое не изменяет уровень оцененных способностей. для предмета.
Изучение смещения предмета, предмет искажается, когда в среднем он дает значительно отличающиеся оценки в конкретных группах, которые, как предполагается, являются частью одной и той же популяции.
Тесты адаптированные или средние , С помощью TRI могут быть построены индивидуальные тесты, которые позволяют более точно определить истинную ценность рассматриваемой черты. Пункты будут администрироваться последовательно, выбор того или иного элемента будет зависеть от ответов, приведенных выше. Существуют различные типы адаптированных тестов, отметим следующее:
- двухэтапная процедура, лорд 1971; Берц и Вайс, 1973–1974 годы. Сначала проходит один тест, а в зависимости от результатов - второй тест.
- Процедура в несколько этапов, такая же, как и предыдущая, только процесс включает в себя больше этапов.
- Фиксированная модель ветвления, Лорд 1970, 1971, 1974; Муссио 1973. Все испытуемые решают один и тот же предмет, в зависимости от ответа решается набор предметов.
- Переменная разветвленная модель, основанная на независимости между элементами и свойствами оценки максимального правдоподобия.
Банк предметов, Наличие большого набора элементов - это то, что улучшит качество теста, но для этого элементы должны сначала пройти процесс отладки. Чтобы классифицировать элементы, необходимо учитывать, какая функция предназначена для измерения теста, частью которого будет этот элемент..
Интерпретация баллов
весы: его цель состоит в том, чтобы предложить континуум для упорядочения, классификации или определения относительной величины оцениваемого признака; это позволит нам установить различия и сходства людей в отношении этой черты. Шкалы, используемые в психологии: номинальные, порядковые, интервальные и разумные; эти шкалы построены на основе результатов тестов, которые называются «прямые оценки» .
олицетворять : типизировать тест - значит преобразовать прямые оценки в другие, которые легко интерпретируются, поскольку типизированные результаты покажут положение субъекта по отношению к группе и позволят нам проводить внутренние и межпредметные сравнения. Существует два типа набора текста:
- Линейные, сохраняют форму распределения и не изменяют размер корреляций.
- Нелинейные, они не сохраняют распределение или размер корреляций .
МАСШТАБА ОТНОШЕНИЯ В TRI построенная шкала - это та шкала, которая соответствует уровням пригодности; Эта шкала характеризуется тем, что оценки и ссылки делаются непосредственно в отношении способности и ее шкалы. Кроме того, эта способность, которая оценивается, зависит только от формы характеристической кривой предметов. В пределах возможных масштабов мы указываем два:
- Масштаб, предложенный Вудкоком (1978) и определяется следующей формулой:
- Шкала WITS, предложенная Wright (1977), является модификацией предыдущей и определяется следующими соотношениями:
Эта статья носит исключительно информативный характер: в онлайн-психологии у нас нет факультета, чтобы поставить диагноз или рекомендовать лечение. Мы приглашаем вас пойти к психологу для лечения вашего случая в частности.
Если вы хотите прочитать больше статей, похожих на Теория ответа на предмет - Приложения и тесты, Мы рекомендуем вам войти в нашу категорию экспериментальной психологии.