Преподавание смешанных дизайн модели: блок-схемы для облегчения понимания
Сценарий исследований
Предположим, что выпускник помощник преподавания был заинтересован в изучении успеваемости студентов, обучающихся в своем вступительном курсы статистики. Ассистент три гипотезы в виду, о ее первой и второй половине классов. Во-первых, она считает, что студентов в классе утром лучше, чем учащихся в классе во второй половине дня. Она также предположил, что к концу семестра, студент производительность в своем классе улучшится. Наконец, она также предположил, что успеваемость учащихся, может зависеть от времени суток. Один семестр студенты в обоих классов вводили 3 испытаний равные трудности, связанные с учебными материалами в ходе семестра.
Ассистент столкнулся с трудностями, как анализировать данные, чтобы заговорить с ней гипотез исследования. В ходе ее аспирантуры, она приняла некоторые исследования и статистические данные курсы, но ее опыт был ограничен. Она тем не менее, знать о ней следующие исследования: во-первых исследований ее дизайн состоит из двух независимых переменных и одна зависимая переменная. Один независимой переменной участие повторное измерение испытаний; это напомнило ей о зависимых выборок (иногда называют парных выборок) Т-тест. Второй независимой переменной участие сравнения первой и второй половине класса, это сравнение напомнил ей о т независимых испытаний образцов или один-дисперсионного анализа (ANOVA).
Зависимой переменной являлась фактическим тестов из студентов. Наконец, она смутно напомнила, что некоторые предварительные анализы, часто необходимы перед тестированием нулевой гипотезы. Таким образом, предположения, как правило, связано со многими статистических тестов для того, чтобы сделать выводы к населению ..
Введение смешанной Дизайн модели
Дизайн исследования сценарий выше известна как смешанная модель (ММ) дизайн. Эта модель может быть использована для изучения влияния нескольких независимых переменных на зависимую переменную. М. считает, дизайн как внутри субъектов проектирования, а также между субъектами-дизайна. В пределах субъектов дизайн включает в пределах субъектов фактора или независимой переменной, которая считает, повторил меры с 2 или более уровнях, а между субъектами-дизайн, который включает в себя между субъектами-фактора или независимой переменной, включает в себя независимые группы. Между субъектами-дизайн иногда называют совершенно рандомизированных проект, потому что в этой конструкции, предметы случайным образом распределены и служить только один уровень независимой переменной.
Давайте рассмотрим наши исследования сценарий выше. Для дизайна х В, мы будем указывать фактор (тесты), а повторные измерения независимой переменной, а фактор B (класса), а второй независимой переменной, состоящий из независимых групп. Есть 3 уровня фактора в пределах субъектов дизайн, где субъекты принимать все три испытания (т. е. каждый предмет служит на всех уровнях) и Существуют 2 уровней фактора В в между-дизайн, где субъекты предметов либо принадлежать к утру или днем класса (например, предметы служат только в одном уровне).
Предположения
Предпосылки для принятия выводов обратно населения играют важную роль в анализе MM. Поскольку Существуют как между и внутри субъектов конструкций, Есть предположения, связанные с каждым. Предположения по между-дизайн предметов такие же, как один конец ANOVA. Оценки являются независимыми, нормальное распределение населения. и дисперсий равны по численности населения (например, однородность дисперсии). В рамках дизайн-темы, оценки являются независимыми и нормально распределенной среди населения. Кроме того, предположение о сферичности дополнительно требуется, то есть дисперсия оценки разницы между всеми парами уровней в фактор-субъекты равны (Кеппел, 1991).
Кроме того, при наличии между субъектами-фактор (B), оценки воздействия независимой переменной и взаимодействие х B также требуют, чтобы ковариационных матриц на каждого уровня B должны быть идентичны друг другу по населению (Максвелла
Предположение о сферичности, вероятно, нуждается в дальнейшем обсуждении и иллюстрации давайте рассмотрим в пределах предметов дизайна для нашего исследования сценарий выше. За 3 уровней фактора, мы test1, test2, и test3. Разница между оценки всех возможных пар (1 против 2, 1 против 3 и 2 против 3) рассматривается ниже на утро класс для первых 5 баллов,
, где D представляет собой разницу в оценке для испытаний считается. Далее, предположение о сферичности оценивается путем расчета дисперсии для всех трех разница оценки следуют тест эквивалентности. То есть, [математическое выражение, просто непередаваемы В ASCII] проверяется на равенство на всех уровнях. Испытание равных матриц ковариации на каждом уровне B фактором является также абсолютно необходимо, поскольку тестирование на сферичности требует, чтобы ковариационной матрицы объединяются в один. Большинство статистических пакетов программного обеспечения будет предоставлять тест сферичности, а также испытания равных ковариаций и дисперсий когда это требуется.
Нарушение любого из предположения обсуждалось ранее может привести к увеличению вероятности типа I и / или ошибку Типа II (см. Кеппел, 1991; Lomax, 2001 для полного обсуждения.). Результате любого типа ошибка означает, что исследователь может принять неправильное решение, и сделать вывод о нулевой гипотезы. Некоторые нарушения предположений являются более серьезными, чем другие. Во-первых, tenability равных предположение ковариационной матрицы представляет собой серьезную проблему, когда размеры выборки были неравны. Кроме того, предположение о сферичности, скорее всего, были нарушены во многих приложениях (Максвелла
Соответствующие поправки внесены в степенями свободы использованием коррекции альтернативы, такие как парниковых Гейззер (1959) или Huynh-Фельдт (1976) тестов. Любой из двух тестов представляет собой лишь один подход к рассмотрению, когда важные предположения нарушаются. Другие подходы к анализу повторил данные, такие как многомерный или эмпирический метод Байеса также можно рассматривать (Эти методы выходят за рамки данной статьи. См. Кесельман и др.. 2002 для полного обсуждения) ..
Для предположения, которые нуждаются в особом внимании, большинство пакетов программного обеспечения статистика будет генерировать статистические данные, чтобы помочь исследователю в определении, если предположения логичной. Например, будет особенно интересно, если необходимо определить предположения равной дисперсии для субъектов между-фактор и мультитиповой сферичности (сферичности и равных ковариаций) в рамках фактор предметы будут выполнены. В обоих случаях мы будем тестировать следующие нулевой гипотезы: 1) разница / ковариации равны населения и 2) дисперсии разности оценки равны населения. Затем мы примем решение о том, наши предположения будут выполнены. Использование программного пакета SPSS (Статистический товаров и услуг Solutions), мы проиллюстрируем испытание предположениях далее в этой статье.
Наконец, два других предположений независимых и нормально распределенной оценки также должны быть подтверждены. Гистограмма оценки должны дать некоторое представление о нормальности, хотя нарушение этого предположения не могут привести к типу II я или ошибки (Lomax, 2002; Максвелла
Ошибка Условия
Потому что между и внутри предметов дизайна для разработки М.М., Существуют различные условия ошибки для каждой конструкции: один для внутри субъектов фактор, который мы будем обозначать как (х S / B) и один для между субъектами-фактора (S / B). Ошибка срок между субъектами-фактор относится к той же оценке ошибки, как в один конец ANOVA. То есть, в среднем в пределах группы разницы между группами; отражение различия субъектов равные условия в том же уровне (т.е. отклонение оценка индивида от среднего соответствующей группы физического лица). В пределах субъектов регрессия (х S / B) для разработки ММ лучше понять после рассмотрения этого термина для повторных измерений (RM) дизайн для п = 1 в ячейке.
Для RM дизайн, когда есть только одна оценка в каждой клетке, не существует в пределах ячейки изменчивости. Там не может быть получена средняя потому что есть только одно замечание на одну клетку. Различного рода ошибки работает в этом случае производить различия между уровнями лечения. Эта ошибка не из-за различий между субъектами, как и в между-дизайн предметов, потому что в RM случае же вопросу служит на всех уровнях. Вместо этого, ошибка термин отражает противоречивость, с которой те же вопросы работы в рамках различных уровней или лечения. Обращения со стороны субъекта (х S) взаимодействия, то, используется в качестве оценки ошибки для RM-дизайн (Напомним, что взаимодействие означает, что Существуют различия в производительности между уровнях независимых переменных).
В нашем примере, это будет означать, что различия между уровнями испытаний (т. е. среди испытаний 1, 2 и 3) не будет одинаковой для всех субъектов. Теперь, давайте обсуждать эту идею в свете разработки М. ..
В пределах субъектов фактором М. дизайн для п = 1, то ошибка термин, используемый для оценки различий также х S взаимодействия, но эта оценка на каждом уровне фактор B также должны быть рассмотрены. Х S взаимодействие рассчитывается на каждом уровне фактора В, и ошибка термин, который используется на самом деле среднем каждое взаимодействие х S на различных уровнях фактора B (х S / B) (Кеппел, 1991). Концептуально, мы можем думать об ошибке термин М. дизайн как средняя разница в производительности по группам (например, средняя разница в эффективности тестов между первой и второй половине классов).
Наконец, обе эти ошибки условий между и внутри субъектов конструкции объединены средних. Погрешность между субъектами-дизайн (S / B) в среднем в пределах группы разницы между группами, и ошибка в пределах предметов дизайна (х S / B) в среднем отдельных взаимодействий х S на разных уровнях фактора B. Если мы обнаружим, что однородность дисперсии, ковариации, или сферичности предположения нарушаются, это повлияет на наш выбор ошибка термин для любых последующих анализов. Мы будем обсуждать это понятие более в следующем разделе.
Взаимодействие
М. дизайн производит три важных сводной статистики, которые содержат информацию о каждой независимой переменной на зависимую переменную по отдельности, а также совместное сочетание независимых переменных на зависимую переменную. В первом случае мы считаем, независимые испытания переменных (A) и класс (B) на зависимую переменную оценки две основные эффекты, а вторая включает в себя сочетание тестов и класса (A х В) на оценки, как взаимодействие. Важно также помнить, что при исследовании основные эффекты связаны различия в любом столбце (A) или строки (B) означает, в то время как клетка означает находятся в центре внимания для взаимодействия эффектов.
Из толкования основных эффектов, не может быть, когда имеет место взаимодействие (Кеппел, 1991), мы начнем обсуждать меры по изучению природы этой связи. Один из способов решения этой задачи является разделение дизайна в одном-фактор конструкции. Анализ такого рода называют одним эффектов, то есть анализ взаимосвязи между одной независимой переменной и зависимой переменной на всех уровнях другой независимой переменной. Для фактора (A), простой вопрос эффектов: Есть ли связь между А и зависимой переменной в [b.sub.1] (т.е., есть ли связь между испытаний и оценки студентов в классе утром? Это 1 уровень фактора B).
Это эквивалентно анализа для одного RM фактором в пределах предметов дизайна. Мы можем ответить на этот вопрос оценки сводной F-статистики, но это не является абсолютно необходимой, поскольку она способствует повышению вероятности первого рода ошибки. Вместо этого, мы могли бы рассмотреть простой контрастов для наших простых эффектов - контрасты между клеткой средств. Простой контраст для простого эффекта рассмотрении нашего примера может быть: Есть ли разница в баллах между испытания и испытания 1 2 для студентов утром класса (мы могли бы также спросить о разнице в баллах между испытаниями 1 и 3, а также различия в Испытания 2 и 3)? Простые контрастов, по той простой эффект фактора в [b.sub.2] можно рассматривать (Примечание: Комплекс контрастов, с участием более 2 средств, также могут быть рассмотрены) ..
В зависимости от вопроса исследователя, простых эффектов и / или простые контрасты могут быть рассмотрены либо фактора. Для фактор B, простой вопрос эффектов: Есть ли связь между B и зависимой переменной в др. (то есть, есть ли связь между классом и оценки за тест 1? Это уровень 1 фактор - [a.sub. 1]). Это эквивалентно на случайном одним фактором между субъектами-дизайн (т. е. т независимых испытаний образцов или односторонней ANOVA). Опять же, мы можем ответить на этот вопрос оценки сводной F-статистики, но давайте рассмотрим простой контрастов для наших простых эффектов к сокращению многочисленных испытаний. Простой контраст для простого эффекта рассмотрении нашего примера может быть: Есть ли разница в тесте 1 счетов между первой и второй половине занятия? Простые контрастов, по той простой эффект фактора B в [a.sub.2] и [a.sub.3] могут быть рассмотрены ..
Предположения о сферичности и однородности дисперсий и ковариаций играть важную роль, когда контрасты считается (т.е., последующие анализы). Если какой-либо из этих предположений были нарушены, объединенных ошибка выражении (х S / B и S / B) не рекомендуется строить контрастов вручную. Большинство статистических пакетов программного обеспечения, такие, как SPSS, использовать эти условия объединения, а также ошибки. В случае, если предположения нарушаются, исследователь призвал провести анализ (либо вручную, либо с помощью программного обеспечения) с помощью конкретных контрасты интерес. Давайте рассмотрим подробнее об этих контрастов рассмотрения предположений и ошибок условия внутри и между субъектами-дизайна.
В рамках дизайн-темы, мы должны проверить предположения о сферичности и однородности ковариаций. Если эти предположения логичной, можно с уверенностью использовать ошибки срок от внутри субъектов дизайн (х S / B) либо построить вручную (Ломакс, 2001) или интерпретировать контрастов непосредственно с SPSS. То есть, ошибки термин, который создает для SPSS в рамках дизайн-предметы можно использовать для расчета любого простого отличие от руки. Теперь можно толковать любые контрасты порожденных SPSS непосредственно с производства.
Если предположения не выполняются, а затем рассмотреть вопрос об использовании отдельного члена погрешности для каждого отличие тестирование (Ломакс, 2001). В этом случае, зависит т образцов испытаний является жизнеспособной альтернативой для простых контрастов. В нашем примере все возможные простых контрастов для испытаний (например, 1 против 2, 1 против 3 и 2 против 3) можно интерпретировать, потому что в этом случае, каждая отличие имеет свой собственный отдельный термин "ошибка". Максвелл и Делани (1990) рекомендуют, если либо предположения о сферичности или равна матриц ковариации нарушается, отдельные условия ошибки должны рассматриваться для каждого контраст.
Простые эффекты между субъектами-фактор (B) полностью рандомизированных однофакторных конструкций на каждом уровне A. В этом случае опять же могут быть заинтересованы в контрасты с участием ячейки средств. Ошибка срок быть использованы для построения контрасты в руки S / B, если предположение об однородности разницы выполняется для фактора B. Опять же, это ошибка термин, который генерирует SPSS для прямого толкования из вывода.
Если это предположение не выполняется, то использовать отдельный термин "ошибка" для каждого отличие тестирование (Кеппел, 1991). В этом случае, независимые т испытаний образцов (или односторонней ANOVA) является альтернативой для простых контрастов. В нашем примере, просто контраст между первой и второй половине классов на каждом уровне тест может быть интерес, используя либо независимых образцов т-тест или односторонней ANOVA.
Основные действия
Если нет взаимодействия (х B), мы должны проверять каждый основной целью или каждой независимой переменной в отдельности на зависимую переменную. Сводной F-статистики можно оценить факторы, или В или исследователь может предпочесть сосредоточиться непосредственно на контрастах и обойти сводной испытаний. Предположения о сферичности и равных матриц ковариации следует вновь рассмотрел контрастов с участием А. фактором, если эти предположения выполняются, то ошибка срок в пределах предметов дизайна (х S / B), могут быть использованы для построения вручную или исследователь может интерпретировать любые контрасты непосредственно с SPSS. Если один или оба не будут выполнены, то использование отдельных терминов для каждой ошибки контрастность (то есть, в зависимости т образцов-тест) ..
Предположение о равных отклонениях обеспокоенность фактора B. Если это предположение поддерживается, ошибка срок между субъектами-дизайн (S / B), могут быть использованы для построения вручную или исследователь может интерпретировать любые контрасты непосредственно с SPSS. Опять же, отдельные члены ошибка должна быть использована для контрастов при равных дисперсиях не предполагается (например, образцы независимого т-тест).
Может быть, все возможные парные контрастов, с помощью колонки средств для испытаний 1, 2 и 3 могут быть интересны для испытаний (фактор), а простой отличие от строки означает сравнение утренние и вечерние классы (фактор B) является единственным контрастности Основной класс эффект.
Использование SPSS
Учитывая то, что мы только что обсудили, и узнал о дизайне М., давайте проанализируем нашу данных с использованием SPSS для Windows, версия 10.1.0 и ответить на вопросы исследования. Описательная статистика приведены в таблице 2 для испытаний 1, 2 и 3 для утренних и вечерних классов при таблицах 3, 4 и 5 докладов важную информацию о предположениях. Таблица 3 отчеты статистических данных, используемых для проверки предположения о равных для ковариаций в фактор-темы. M Box в статистику с функциями распределения (6, 10462) является 13,9, при р связанных стоимость .047. Если мы используем уровень значимости (а) .10, мы отвергаем нулевую гипотезу о ковариаций похожи населения. В Таблице 4, тест Мочли для предположения о сферичности для внутри-фактор субъектов показывает, что это предположение также не выдерживает критики ([Хи квадрат] (2) = 16,9, р = .000), используя [А] = .10.
И наконец, тест Левен для равенства дисперсий (табл. 5), которые могут быть использованы, если мы хотим оценить влияние B на каждом уровне, сохраняется в течение всех уровнях с использованием [] альфа = .10. Потому что SPSS не предоставляет однородности дисперсии тест для основного класса B эффект - день утром против по разработке М.М., оценки для коэффициента были усреднены для каждого предмета и односторонней ANOVA было проведено для того, чтобы получить этот тест . Результаты показали, учитывая однородность [] альфа = .10 (F (1,38) = .251, р = .619). Таким образом, однородность ковариантности предположение не встречался и сферичности также нарушается в дизайн-темы. Кроме того, предположение об однородности дисперсии сохраняется для B фактором между группами, а также для каждого уровня для межгрупповой фактор.
Проверка взаимодействия в таблице 6, показывает, что есть некоторые свидетельства того, что успеваемость учащихся на испытания в зависимости от времени суток. Потому что предположения о сферичности и равенства ковариаций нарушаются, корректировка в связи с степенями свободы (Кеппел, 1991), либо используя парниковых Гейззер (умеренно консервативная в плане ошибку Типа I) или Huynh-Фельдт (менее консервативный) Коррекция статистических данных. SPSS также предоставляет Гейззер выбросов парниковых Нижняя граница коррекции (наиболее консервативный), которые также могут быть рассмотрены. Использование парниковых Гейззер коррекции, сводной F (1,463, 55,583) = 3,5, р = .049, статистически значимого взаимодействия .05 уровень значимости.
Зависимых т испытаний образцов (или парные образцы Т-тест), могут быть использованы для проведения простых контрастов из-за нарушения сферичности и равенство ковариационной предпосылки для фактор А. Управление familywise (FW) частота ошибок на .05 (деление [А] по количеству контрасты [] альфа = .016) и с учетом всех возможных парных контрастов, результаты показывают, что Существуют статистически значимые различия для студентов утром класс для испытаний 3 (табл. 7). Таким образом, студенты показывают лучшие результаты статистически на тестовых испытаний 3, чем 1 и 2. Существовали нет статистически значимых различий по производительности тестов для студентов, обучающихся в классе во второй половине дня (табл. 8).
Исследование сравнения ячейки средств может также рассматриваться на фактор B с использованием независимых образцов т-тест или односторонней ANOVA. В этом случае, поскольку однородность дисперсии предположение поддерживается (F (1,38) = .251, р = .619), мы можем использовать ошибки срок от этой конструкции построить контрастов (вручную) или интерпретировать прямо вытекает из SPSS, поскольку в соответствии с Максвелла
В этом случае тест Левин показывает, что однородность дисперсии предположение выполняется для всех 3 испытаний - таблица 5). Тем не менее, после контроля familywise (FW) частота ошибок на .05 (например, [] альфа = .016), Есть нет статистически значимых различий между первой и второй половине класса с точки зрения их производительности на тест 1, 2 или 3 (табл. 9) ..
Подводя итог, аспирант деятельности в вводный курс статистики зависит от времени суток. Результаты показывают, что студентов, обучающихся в классе утром показывают лучшие результаты на статистически, проводимых в классе к концу семестра. Существовали никаких различий в успеваемости учащихся на класс тесты для студентов, обучающихся в классе во второй половине дня к концу семестра.
Резюме
Целью настоящей работы являлось ознакомление читателей один подход к анализу М. дизайна. М. дизайн включает в себя как внутри и между субъектами-дизайна. В пределах субъектов фактором участием повторное измерение с двумя или более уровней составляют в пределах предметов дизайна в то время как уровни между субъектами-фактор состоит из независимых групп. Анализ схемы М. зависит от tenability предположений для дизайна. Предположений нормальности, независимости, однородности ковариаций, и сферичности должны рассматриваться в рамках дизайн-темы, нормальности, независимости и однородности разницы требуется для субъектов между-дизайна. Нарушения сферичности мультитиповой и однородности дисперсии может потребоваться исследователю провести отдельный анализ, такие как одностороннее ANOVA или зависимых т образцов испытаний для конкретных контрастов интересов.
В зависимости от сводной результаты проверки, B, а B х, а также решения о предположениях, исследователь может действовать в разных направлениях. Блок-схемы в приложении приводится резюме живописных шаги в этом документе рассматриваются ..
Наконец, этот документ был призван представить читателям М. дизайн, рассматривая один метод анализа. Подход к анализу М. дизайн в данном документе рассматриваются только одномерные метода. Кроме того, выбор парниковых Гейззер перестройки в результате нарушения сферичности также конкретных исследователей. Читатели должны знать, что Есть и другие способы анализа смешанных методов конструкций, таких как многомерный или эмпирический подход Байеса. Хотя эти методы выходят за рамки данной статьи, предложил дальнейшего чтения Максвелла
[Иллюстрация опущены]
Ссылки
Greenhouse, С. В.,
Huynh, H.,
Кеппел, G. (1991). Проектирование и анализ: руководство исследователя (3-е изд.). Аппер-Садл-Ривер, штат Нью-Джерси: Prentice Hall.
Кесельман, H. J., Algina, J.,
Ломакс, Р. Г. (2001). Введение в статистических концепций в области образования и науки о поведении. Mahwah, NJ: Лоуренс Erlbaum Associates.
Максвелла. С. Е.,
Джейми D. MILLS
Университет штата Алабама