Классическая теория испытаний

Тест это научный инструмент в той мере, в которой он измеряет то, что он намеревается, то есть он действителен, и он измеряет хорошо, то есть он точен или надежен. Если мы найдем инструмент, которому мы не можем доверять мерам, которые они предоставляют, поскольку они время от времени меняются, когда мы измеряем один и тот же объект, мы скажем, что он ненадежен. Инструмент для измерения правильно что-то, это должно быть точным, потому что иначе, измерить то, что вы измеряете, измерить это неправильно Следовательно, точность является необходимым, но не достаточным условием. Кроме того, он должен быть действительным, то есть то, что он точно измеряет, будет тем, что он должен измерять, и ничем иным.

Вы также можете быть заинтересованы: Теория ответа на вопрос - приложения и тестирование

надежность:

Абсолютная и относительная надежность. Мы можем решить проблему надежности теста двумя различными способами, хотя на заднем плане они совпадают.

Надежность как неточность его измерений: когда субъект отвечает на тест, он получает эмпирическую оценку, на которую влияет ошибка. Если бы не было ошибки, испытуемый получил бы свой истинный балл. Тест является неточным, поскольку эмпирическая оценка не соответствует истинной истинной оценке. Эта разница между двумя показателями является ошибкой выборки, ошибкой измерения. типичная ошибка измерения будет стандартное отклонение погрешности измерения. типичная ошибка измерения указывает абсолютную точность теста, поскольку позволяет оценить разницу между полученным измерением и тем, которое было бы получено, если бы не было ошибки.

Надежность как стабильность измерений: тест будет тем надежнее, чем более постоянными или стабильными будут результаты, которые он дает при повторении. Чем стабильнее результаты в двух случаях, тем больше корреляция между ними. Это соотношение называется коэффициент надежности. Это выражает нас не в величине ошибки, а в согласованности теста с самим собой и постоянства информации, которую он предлагает. коэффициент надежности выражает относительную достоверность теста.

Коэффициент надежности и индекс надежности: - Коэффициент надежности теста - это корреляция теста с самим собой, полученная, например, в двух параллельных формах: rxx. - Индекс точности является корреляцией между эмпирическими оценками теста и его истинными оценками: rxv Индекс точности всегда будет больше, чем коэффициент надежности. Чтобы узнать коэффициент надежности, стоит выделить следующие три классических метода:

Найти корреляцию между тестом и его повторением: метод повторения или метод тест-повторное тестирование: он состоит в применении одного и того же теста к одной и той же группе два раза, и вычисляется корреляция между двумя сериями баллов. Эта корреляция является коэффициентом надежности. Этот метод обычно дает более высокий коэффициент надежности, чем полученные другими процедурами, и может быть загрязнен мешающими факторами.
Найдите корреляцию между двумя параллельными формами теста: метод параллельных форм: подготовьте две параллельные формы одного и того же теста, то есть две эквивалентные формы, которые дают одинаковую информацию, и применимы к одной и той же группе предметов. Корреляция между двумя формами является коэффициент надежности. С помощью этого метода, не повторяя одно и то же испытание, можно избежать мешающих источников надежности повторного испытания..
Найти корреляцию между двумя параллельными половинами теста: метод двух половинок: тест делится на две эквивалентные половины, и корреляция между ними найдена. Это предпочтительный метод, так как он прост и игнорирует ограничения предыдущих процедур. Вы можете выбрать нечетные элементы теста, составляющие одну половину, а четные элементы - другую..

Коэффициент надежности и корреляция между параллельными тестами

коэффициент надежности теста указывает на долю, что истинная дисперсия имеет эмпирическую дисперсию: gráfico33 Коэффициент достоверности теста варьируется от 0 до 1. Например: если корреляция между двумя параллельными тестами равна rxx´ = 0,80 означает, что 80% дисперсии теста обусловлено реальной мерой, а остальные, то есть 20% дисперсии теста, обусловлены ошибкой. индекс надежности теста - это корреляция между его эмпирическими оценками и индексом достоверности истинных оценок = индекс надежности равен квадратному корню из коэффициента надежности

После разработки двух параллельных форм теста применяется процедура анализа отклонений для проверки однородности отклонений и разницы между показателями. Если отклонения являются однородными, разница между средними значениями несущественна, и две формы построены с одинаковым количеством элементов одного типа и психологического содержания, можно сказать, что они параллельны. Если нет, вы должны реформировать их, пока они не будут. Недостаточная надежность определяется значением rxx´= 0 4.- Типичная ошибка измерения: разница между эмпирической и реальной оценкой является случайной ошибкой, называемой ошибкой измерения. Стандартное отклонение ошибок измерения называется типичной ошибкой измерения. типичная ошибка измерения позволяет оценить абсолютную достоверность теста, то есть оценить, насколько погрешность измерения влияет на оценку.

Надежность и длина: длина теста относится к числу его элементов. Надежность зависит от этой длины. Если тест состоит из трех элементов, субъект может однажды получить 1 балл, а другим или параллельно - балл

От одного случая к другому, оценка менялась на одно очко; точка выше трех - это вариация 33%, высокая вариация. Если испытуемые получают случайные изменения этого типа, корреляция теста с самим собой или с двумя параллельными формами теста будет значительно снижена и не может быть высокой. Если тест намного дольше, если у вас есть, например, 100 предметов, субъект может получить 70 баллов за один раз и 67 баллов за параллель. От одного к другому изменилось 3 балла; это относительно небольшая разница по отношению к общему тесту, а именно 3%. Эти небольшие случайные изменения этой величины, которые происходят в баллах испытуемых при переходе от одной формы к параллели, относительно не важны и не будут уменьшаться так сильно, как до корреляции между обоими.

Коэффициент надежности будет намного выше, чем в предыдущем случае. Уравнение Спирмена-Брауна выражает связь между надежностью и длиной. Точность теста равна нулю, когда длина равна 0, и увеличивается с увеличением длины. Хотя увеличение относительно меньше, поскольку длина какой части больше. Это означает, что точность возрастает вначале и сравнительно меньше в дальнейшем. Когда длина стремится к бесконечности, коэффициент надежности стремится к

Увеличивая продолжительность теста, его точность увеличивается, потому что он увеличивает истинную дисперсию со скоростью, превышающей дисперсию ошибки. Это означает, что точность теста увеличивается, потому что доля отклонений из-за ошибки уменьшается. Формула Рулона, а также формулы Фланагана и Гутмана особенно применимы при расчете коэффициента надежности методом двух половин. Это формулы, которые используются для расчета коэффициента надежности.

Надежность и постоянство: коэффициент надежности можно найти и другим способом, это так называемый коэффициент альфа или коэффициент обобщения или репрезентативности (Кронбах). Этот альфа-коэффициент указывает точность, с которой некоторые элементы измеряют аспект личности или поведения. Это может быть интерпретировано как: оценка средней корреляции всех возможных элементов в определенном аспекте. Мера точности теста в зависимости от его согласованности или внутренней согласованности (взаимосвязь между его элементами, в какой степени тестовые элементы измеряют все одинаково) и его длины. Указывает репрезентативность теста, то есть количество, в котором выборка предметов, из которых он состоит, представляет совокупность возможных предметов того же типа и психологического содержания. коэффициент альфа в основном отражает две основные концепции точности теста: 1. взаимосвязь между его элементами: степень, в которой все они измеряют одно и то же.

Продолжительность теста: при увеличении количества случаев выборки и устранении систематических ошибок выборка представляет популяцию лучше, чем она извлекается, и более вероятно, что произошла случайная ошибка. Если элементы теста являются дихотомическими (да или нет, 1 или 0, согласие или несогласие и т. Д.), Уравнение коэффициента альфа упрощается, что приводит к уравнениям Кудер-Ричардсон (KR20 и KR21). Учитывая определенное количество элементов, тест будет более надежным, когда он будет более однородным. Коэффициент альфа говорит нам о надежности, поскольку он представляет однородность и согласованность или внутреннюю согласованность элементов теста.

Стандарты и критерии надежности

В соответствии с моделью пространства образцов предметов, цель теста состоит в том, чтобы оценить меру, которая была бы получена, если бы использовались все предметы в пространстве образцов. Эта мера была бы истинной оценкой, к которой реальные измерения приближаются более или менее. В зависимости от степени, в которой выборка предметов соотносится с истинными баллами, тест является более или менее надежным. В этой модели матрица корреляций между всеми элементами в пространстве образца является центральной, и эта модель образца более непосредственно настаивает на внутренней согласованности и, поскольку она обеспечивает ее, косвенно гарантирует стабильность..

Линейная модель параллельных тестов настаивает больше на стабильности оценок, и в той степени, в которой она достигает стабильности, она косвенно способствует внутренней согласованности. Если мы применяем тест для установления индивидуальных диагнозов и прогнозов, коэффициент надежности должен быть 0,90. В прогнозах и коллективных классификациях это не так уж и много, хотя от 0'90 до 0'80 уходить не очень удобно.

Иногда в определенных видах тестов, таких как тесты на личность, трудно достичь коэффициентов более 0,70. Если параллельные формы или параллельные половины применяются после более или менее большого интервала, случайных ошибок может быть больше, чем тех, которые влияют на коэффициент альфа. Это так, потому что то, что уменьшает корреляцию, это не только случайные ошибки, присущие тесту и в одном случае, которые учитывают коэффициент альфа, но также влияют на все ошибки, которые могут возникнуть в двух разных ситуациях. , которые могут отличаться в многочисленных деталях. Следовательно, коэффициент альфа обычно больше, чем другие коэффициенты..

За исключением коэффициента, найденного при повторении одного и того же теста, поскольку существует большая вероятность того, что случайные ошибки первого приложения повторяются во втором, и вместо уменьшения корреляции между ними увеличьте его. Необходимо обеспечить, чтобы второе приложение полностью не зависело от первого. Если мы добьемся этого, то это будет самый простой и дешевый метод, который рекомендуется использовать при оценке стабильности результатов, особенно в течение длительных периодов времени и сложных тестов. > Далее: Срок действия тестов

Эта статья носит исключительно информативный характер: в онлайн-психологии у нас нет факультета, чтобы поставить диагноз или рекомендовать лечение. Мы приглашаем вас пойти к психологу для лечения вашего случая в частности.

Если вы хотите прочитать больше статей, похожих на Классическая теория испытаний, Мы рекомендуем вам войти в нашу категорию экспериментальной психологии.

« Теория социального обмена, что это такое и каковы ее авторы Молекулярно-кинетическая теория 3 состояния материи »