Проверка согласия распределений. Критерий Хи-квадрат

Проверялась эффективность 4-х методов обучения. Название метода (см. табл.18) не исчерпывает его суть, но только отражает его главную особенность, то, на чем поставлен основной акцент.  Студенты были разделены на 4 группы равной численности и по отношению к каждой группе применялся только один метод обучения. В каждой группе было подсчитано количество студентов, которые получили все необходимые навыки, причем сделали это вовремя. Самые лучшие результаты получены в результате использования метода «Жесткий контроль». Методы «Под диктовку» и  «Самостоятельно», наоборот, оказались малоэффективными. 

spss-t18

Допустим, исследователя пока что интересует не сравнение эффективности отдельных методов, а только лишь вся картина в целом: влияет ли вообще метод обучения на эффективность? Если так, то здесь целесообразно использовать критерий Хи-квадрат для проверки согласия распределений. Тогда нулевой гипотезе об отсутствии влияния метода будет соответствовать равномерное распределение. Общее количество «эффективно обученных» студентов – 44 (см. табл.18).  Если равномерно распределить его по категориям номинативной переменной (по методам обучения), то в каждой группе получилось бы 11 «эффективно обученных» студентов. Это означало бы не только отсутствие влияния метода, но и отсутствие каких-либо случайных отклонений. Необходимо сопоставить с этим равномерным распределением наблюдаемое распределение (табл.18), т.е. проверить согласие распределений.

Измените имена переменных в файле Sav (переменную Группа мы здесь использовать не будем). Добавьте для номинативной переменной МетодОбучения числовые значения (values) и соответствующие им текстовые надписи (labels). Введите данные.

Весовая (частотная) переменная. Отличается от обычных переменных, как по своему назначению, так и по принципам работы с ней. Поэтому будьте внимательны. Не потому, что частотную переменную сложно использовать. А потому что легко не заметить ее наличие в другом файле Sav и в результате выполнить анализ неверно. Воспользуйтесь меню Data > Weight cases (изменить веса случаев). Выберите в качестве частотной (frequency) переменную (variable) Количество, чтобы именно с помощью (by) нее изменялись веса (weight) случаев (cases). Ок. Заметили ли Вы изменения? Если нет, обратите внимание на надпись weight on (вес включен) в нижней правой части окна. Т.е. внешних изменений мало. Но это только внешне. Теперь файл Sav содержит совершенно другие данные. Если вначале каждый из четырех случаев встречался только один раз, то теперь, например, случаи «Самостоятельно» встречаются 5 раз.

Воспользуйтесь меню Analyze > Nonparametric tests > Chi-Square… Проверяем (test) мы переменную МетодОбучения. Частоты, с которыми встречаются ее категории, мы уже указали в весовой переменной ранее. Эти частоты являются наблюдаемыми значениями. Мы будем сравнивать их с ожидаемыми (expected) значениями (values), которые, в соответствии с нашей нулевой гипотезой, соответствуют равным (equal) частотам всех (all) категорий (categories). Ок.

Это один из тех статистических методов, в которых все результаты вычислений сразу же являются абсолютно ясными. Остатки (residual) – это разности между наблюдаемыми (observed) и ожидаемыми (expected) частотами. Возведя их в квадрат, поделив на ожидаемые частоты и просуммировав, мы получаем значение критерия: Chi-Square = 12,2. Если сопоставляются только 2 распределения, то число степеней свободы df=k-1, где k – количество градаций сопоставляемых распределений. Различия между наблюдаемым и ожидаемым равномерным распределениями являются высоко статистически значимыми (p0,01).

Кроме того, в файл Spo выведена сноска: «0 cells (,0%) have». Это связано с известным ограничением на применение критерия Хи-квадрат: ни одна ячейка не должна иметь ожидаемую частоту, меньшую, чем 5. В данном случае это условие выполняется: ожидаемые частоты равны 11.

Представим наблюдаемое распределение графически. Воспользуйтесь меню Graphs > Bar > Simple > Summaries for groups of cases > Define. На горизонтальной оси (axis) будут расположены категории (category) переменной МетодОбучения, а столбцы (bars) будут представлять (represent) количество случаев (N of cases), соответствующих каждой категории.   Ок.  Вы видите, что под столбиковой диаграммой даже есть напоминание Cases weighted by… (веса случаев изменены в соответствии с переменной Количество). 

По всем вопросам, связанным с использованием материалов Expect.ru, обращайтесь к Никулину Денису Николаевичу
email