Критические значения гадать об истинных и ложных-множественного выбора испытаний
Исправление для угадывания была постоянной проблемой в интерпретации верно / не верно, и с несколькими вариантами тестов. Многие авторы утверждают, что никакого решения этой проблемы не за горами. Торндайк (1971) отметил: "Практика в организациях США испытания и испытания среди издателей в связи с использованием формулы коррекции по-прежнему разделена" (стр. 59). Пейн (1992) согласился: "Ученые уже более 30 лет изучению проблемы или не справедливо для гадания. Существует до окончательного ответа или согласия между экспертами" (стр. 108).
Один из подходов к коррекции на угадывание в том, чтобы исследовать условия, при которых влияние слепых гадание на оценки теста является незначительной. Sax (1989) указал, что учителя должны включать в себя несколько элементов в тестах не учитывать влияние только догадываться. Хопкинс и Стэнли (1981) утверждал: "Это должно быть очевидно, что чем больше вариантов по каждому пункту, тем меньше вероятность того, что один будет выбрать правильный вариант случайно и, следовательно, тем меньше величина взвешивания неправильный ответ "(стр. 149). Большинство исследователей решила, что влияние слепых гадание на оценки испытания уменьшается продолжительность испытания и ряд вариантов по каждому пункту возросло (например, Эбель и Фрисби, 1991; Браун, 1981 и Меренс и Леман, 1984) .
Тем не менее, когда коррекция угадывать игнорируются, становится возможным, что студент может пройти тест через догадки. С точки зрения статистики, альтернативная гипотеза ([H.sub.a]) может быть сформулировано, что эффект угадывания можно пренебречь. Ошибка игнорирования роли гадать, когда эффект угадывания делает выхода называется ошибку Типа я. В социальных науках, приемлемый риск принятия ошибку Типа я условно установлен на [Alpha] = .05.
Критическое значение статистики, которая знаменует край сохраняя области [H.sub.a] в [Alpha] = .05 (Хейман, 1992). В длинном правда-ложь или множественного выбора тест, то вероятность получения высокой оценки путем угадывания невелика (Sax, 1989). Прохождения оценки испытание статистики, которая контролирует риск ошибку Типа я. Чем выше проходными баллами, тем меньше риск сохранения альтернативная гипотеза ([H.sub.a]). Сохраняя области [H.sub.a] содержит оценки, при котором вероятность успешного прохождения испытания по угадывать менее 5%. Низкий проходной балл, который гарантирует не более 5% риск критического значения проходной балл для коррекции догадываться. Установив ли проходной балл теста выше, чем соответствующие критические значения, может быть принято решение с 95% доверительный в том, коррекция гадать не требуется.
Цель
Критическое значение проходной балл определяется структура теста и стохастические модели гадать, в которых вероятность успешного прохождения теста через угадывать по форме. Тем не менее, ни один такой стохастической модели было подчеркнуто, в сфере образования и психологические измерения еще Нечего и говорить, строительство критических значений для удовлетворения структуры различных испытаний (Brown, 1981; Меренс
Применение таблицы очень прост. Для испытаний с заданной общее количество элементов (N), а вероятность угадывания пункта правильно (р), в таблице приведены критические значения ([x.sub.o]) определены из стохастической модели. На основании обоснование гипотезы, поправка на угадать не могут быть проигнорированы, если проходной балл (х) тест был установлен на уровне х [больше] [x.sub.o] уровне. Таким образом, критическое значение [x.sub.o] действует, как порог, который определяет, когда эффект угадывания можно пренебречь.
Стохастическая модель
Вероятность успешного прохождения испытания по слепой угадать могут быть смоделированы как бросание монеты процесса. Голову и хвост из монет бросил два события соответствующие успехи и неудачи в пункт домысливания процесса, соответственно. Учитывая, что пункт п вариантов, вероятность получить правильный вариант через слепых угадывать 1 / n. Поскольку количество вариантов каждого элемента составляет не менее 2, то вероятность угадывания правильных ответов не превышает 50% в целом. Таким образом, бросил монеты являются несбалансированными. Отношения между ряд вариантов пункта, и вероятность угадывания ответа правильно указаны в таблице 1.
Бросание монеты процесс элементарных стохастический процесс, и была легко решена в большинстве математике-статистических учебников (Каселла
В статистике, одна монета бросил это испытание Бернулли и полностью с подбрасыванием монет N следующим биномиальных (N, р), распределение р равна вероятности головы в каждом испытании (Бхат, 1984). Таким образом, вероятность наличия х головок испытаний N является:
[Математических выражений Опущено]
х = 0, 1, 2, ..., N (1)
Общее количество элементов (N) и ряд вариантов по каждому пункту (п) структурные характеристики теста. Вероятность угадывания пункта правильно (р) определяется в таблице 1 на количество вариантов по каждому пункту (п). События прохождения испытания включают случаи, в которых один получает более высокие оценки, чем проходной балл. Критическое значение низкий проходной балл, при которых вероятность успешного прохождения теста через гадать меньше, чем .05. Таким образом, совокупная вероятность получения баллов больше критического значения путем угадывания можно рассчитать Биномиальное (N, р) распределения. Для данного N и р, критическое значение ([x.sub.o]) следует формула (2):
[Математических выражений Опущено]
Строительство критических значений по формуле (2) потребности кумулятивных сумм слагаемых биномиального распределения. Эйзенхарт (1949) отметил:
Накопительное сумму членов биномиального распределения могут быть получены непосредственно из таблицы неполной бета-функции (под редакцией Карла Пирсона, Biometrika Office, Университетский колледж, Лондон, 1934), но из-за конфликта между записью таблицы, и что обычно используется для биномиального распределения, добыча биномиальных вероятностей из таблицы особенно трудно на каждом новом случае, и даже для постоянного использования требует терпения и заботы. (Стр. IV)
Феррис (1994) предоставляются:
Для образца размером до 50, как правило, в том числе первый объема выборки при двойном плана отбора проб, необходимых биномиальных значения можно читать прямо из компиляции Карла Пирсона. Однако, для второй выборки выше 50 уровня и качества в пределах указанных выше, никаких таблиц любого масштаба были доступны. (Стр. 1)
К счастью, стол Пирсона была преобразована в таблицах биномиального распределения вероятностей Национальным бюро стандартов (1950) для выборки (N), равной 1, 2, ..., 49. Баллистическая исследовательская лаборатория (1944) также собираются Таблицы биномиальной вероятности N равным 60, 75, 90, 100, 150, 200, 250 и 300. По Берингтон и в мае (1970), они обширных таблиц биномиального распределения.
Номера для слепых гадать могут быть смоделированы в Baysian стохастический процесс. Потому что студент может иметь частичные знания, информационный думаю, можно сделать в верно / не верно или несколькими вариантами тестов. На основе байесовской статистике, вероятность совершения думаю, может быть описан в условной вероятности. При условии, что предположение было сделано, то вероятность сделать правильную догадку, может быть упрощена в биномиального распределения (Каселла
Таблица критических значений
Критических значений построены в настоящем документе, основаны на два таблицы собрались в Национальном бюро стандартов (1950) и баллистических Научно-исследовательская лаборатория (1944). Потому что критерий [альфа] = .05 установлен в формуле (2), не все группы N и р имеет критическое значение [x.sub.o]. Например, для испытания с малым и большим N р, например, N = 4, р =. 5, то вероятность получить полный балл по угадывать .0625, большего значения, чем .05. Таким образом, независимо от того, что проходной балл был выбран, действие гадать на этот тест не является незначительным, в [Alpha] = .05 уровне. В тот же выход ситуации на тест с N = 3 и р = .5, или п = 4 и р [больше] .22 структур.
Кроме того, следует отметить, что оценка из нескольких вариантов испытаний, в том числе оценка мимоходом, это целое рассчитывал на большее количество правильно ответил пунктов. Вместе с тем, критическое значение ([x.sub.o]) вычисляется по формуле (2) не может быть целым числом. Дробные значения [] x.sub.o не физически интерпретируемых критических значений, поскольку представляют собой минимальный проходной оценки, которая не может быть достигнуто путем слепой догадкой [Alpha] = .05 уровне. Чтобы гарантировать, что риска вероятность не больше, чем [Alpha], критическое значение ([x.sub.o]), рассчитанная по формуле (2) округляется до целого числа. В результате, с уровнем проходной балл выше критического значения, то риск позволяет студенту прохождения испытания путем угадывания составляет менее [Alpha].
Критические значения ([x.sub.o]) прохождения оценки для часто используемых стандартизированных тестов приведены в таблице 2 с вероятностью угадать правильно пункта (р), определенных на количество вариантов по каждому пункту (п) и длину тест представляет общее количество тестовых заданий (N).
Последствия Таблица 2 два раза. Во-первых, было показано, что критическое значение ([x.sub.o]) по мере роста количества вариантов по каждому пункту (п) убывает. Во-вторых, в то время критических значений ([x.sub.o]) наряду с увеличением длины теста (N), в рационе [x.sub.o] / N обычно уменьшается с ростом N. Таким образом, показано в таблице 2, что эффект слепой угадать уменьшается число вариант по каждому пункту и продолжительность теста увеличивается.
Обсуждение
Кейн (1994) отметил: "Срок действия тест-обоснованные решения о готовности к курса или профессии зависит от целесообразности в связи с кончиной оценки используются для решения" (стр. 425). Критическое значение проходной балл представлены в таблице 2 представляет собой инструмент для измерения эффекта угадывания в ограниченное число верно / не верно или нескольких тестов выбор. Для теста с длиной (N), а число вариантов по каждому пункту (п), не перечисленных в таблице 2, формулы (3) и (4) могут быть использованы для построения критического значения (Каселла
[Математических выражений Опущено]
P (X = х) = (N - х 1) / х п / 1 - р P (X = х - 1) (4)
Формула (3) основывается на обширных таблицы неполной бета-распределения. Формула (4) является уравнением рекурсии для расширения списка критических значений. Причина для использования (3) и (4), а не линейная интерполяция, что "линейная интерполяция как правило, не с точностью до более чем двух знаков после запятой, а иногда и меньше" (Берингтон