Результаты вычислений

Статистические критерии. В таблице Chi-square tests  нас интересуют только 2 метода:  Хи-квадрат Пирсона и Likelihood ratio (отношение правдоподобия) – другая разновидность критерия Хи-квадрат (проверка линейной связи (linear-by-linear association) между номинативными переменными смысла не имеет). Согласно этим двум критериям, связь Присутствие Результат является статистически значимой на уровне p0,05.

Под таблицей мы видим сообщение, относящееся к Хи-квадрат критерию Пирсона: в 4-х ячейках (в 50%) ожидаемая частота меньше 5-ти. Минимальная ожидаемая частота равна 1. Следовательно, результаты критерия Хи-квадрат Пирсона здесь могут быть поставлены под сомнение. Ведь его применение считается корректным, только если ожидаемые частоты превышают значение 5. Нарушение этого условия допустимо не более, чем в 25% ячеек. Тогда при проведении реального исследования нам следовало бы увеличить объем выборки. Но сейчас можно продолжать анализ, поскольку мы ограничиваемся только лишь учебными целями.

Все статистики в таблице Symmetric measures основаны на критерии Хи-квадрат. Здесь они даже показывают такую же вероятность ошибки (p=0,047), что и Хи-квадрат критерий Пирсона.

Столбиковая (bar) диаграмма (chart). Она здесь кластеризована по категориям столбцовой переменной. Каждой категории строковой переменной соответствует 2 столбца (Успешно и Неуспешно), соответствующие категориям столбцовой переменной. Высота столбца равна частоте встречаемости сочетания категории строковой переменной и категории столбцовой переменной. Суммарная частота категории строковой переменной равна суммарной высоте соответствующих ей столбцов. Например, суммарная частота категории Отс. частично равна 10-ти, и она складывается из частоты сочетания {Отс. частично; Успешно} и частоты сочетания {Отс. частично; Неуспешно}. Или, если не пытаться использовать абстрактные термины: из тех, кто отсутствовал часть пары, 4 человека справились с контрольной работой и 6 человек – нет.

В таблицу Присутствие * Результат Crosstabulation можно включить также и другую информацию. Воспользуйтесь меню Analyze > Descriptive statistics > Crosstabs > Cells…, включите нестандартизированные (unstandardized) остатки (residuals) и вместо процентов (percentages) по строкам (row) включите проценты по столбцам.    Continue, Ok.

Остатки. В таблице Присутствие * Результат Crosstabulation сопоставлять наблюдаемые и ожидаемые частоты теперь чуть проще, поскольку сразу же посчитана разница между ними – остатки (residuals). Например, сочетание {Присутствовал; Неуспешно} имеет отрицательный остаток, т.е. из числа присутствовавших на тренировочном занятии не справилось с контрольной работой меньшее количество студентов, чем это ожидалось бы при отсутствии связи между переменными Присутствие и Результат.

Проценты. Отражают теперь совершенно другую информацию. Например, из числа тех, кто не справился с контрольной, 13,3% отсутствовали на тренировочном занятии по уважительной причине. А вообще отсутствовало по уважительной причине 6,7% всех студентов. Т.е. мы вычислили проценты по столбцам: 100% соответствует суммарной частоте столбца. Сопоставьте эту информацию с полученной нами ранее таблицей Присутствие * Результат Crosstabulation, содержащей проценты по строкам. Как Вы думаете, каким образом лучше строить таблицу сопряженности для этих переменных: с вычислением процентов по строкам или с вычислением процентов по столбцам?

Но есть еще третий способ вычисления процентов. Откройте снова диалоговое окно для построения таблиц сопряженности и включите проценты по отношению к суммарной (total) частоте таблицы сопряженности.   Continue, Ok.    Теперь ясно что, например, отсутствовали по неуважительным причинам и при этом не справились с контрольной работой 13,3% от числа всех студентов группы. 

По всем вопросам, связанным с использованием материалов Expect.ru, обращайтесь к Никулину Денису Николаевичу
email