Таблицы сопряженности (контроль)

В таблице 31 содержится описание исходных данных для вашего варианта. Исходные данные находятся над таблицей 31. Здесь 3 номинативных переменных, содержащих по 2 или 3 категории и одна частотная переменная, содержащая частоты встречаемости сочетаний категорий (табл.31). Вначале необходимо выполнить анализ таблицы сопряженности только для двух переменных: строковой (row) и столбцовой. Затем необходимо выполнить тот же анализ, но с использованием переменной слоя (layer).

spss-t29-2

  Переименуйте переменные в файле Spo, добавьте для номинативных переменных числовые значения и соответствующие им текстовые надписи. Используйте меню Data > Weight cases… и Analyze > Descriptive statistics > Crosstabs … Не забудьте активировать переменную, содержащую частоты (frequency) встречаемости сочетаний категорий. Для проверки статистической значимости используйте критерий Хи-квадрат, коэффициент контингенции, критерии Phi и V-Крамера. Но не забывайте, что статистика linear-by-linear association для номинативных переменных не используется. Частоты (counts), проценты и остатки (residuals) вычислите так, чтобы, в конце концов, ваши результаты в файле Spo соответствовали таблице 31. Все несоответствующие ей результаты потом из файлов Spo удалите.

spss-t31

Вначале выполните анализ только для строковой и столбцовой переменных. По результатам этого анализа запишите в текстовый файл ответы на следующие вопросы:

1) Является ли статистически значимой связь между строковой и столбцовой переменными? Если да, то на каком уровне p? Можем ли мы принять решение об отклонении нулевой гипотезы?

2) Во всех ли ячейках таблицы сопряженности выполняется условие применения Хи-квадрат критерия Пирсона? Если нет, то в каком проценте ячеек это условие не выполняется?

3) Посмотрите в табл.31: процент случаев какой комбинации вам надо вычислить? По отношению к суммарной частоте какой категории этот процент надо вычислить? Запишите здесь ответ: в каком проценте случаев встречается эта комбинация по отношению к суммарной частоте этой категории?

4) Посмотрите в табл.31: для категории какой переменной необходимо найти наибольшую разницу? Просмотрите ваши результаты в файле Spo: для какой категории этой переменной наблюдается наибольшая разница между наблюдаемыми и ожидаемыми частотами? Каково абсолютное значение наибольшей разницы? Каким образом увеличение разницы между наблюдаемыми и ожидаемыми частотами влияет на связь между переменными? Становится ли эта связь более сильной или более слабой?  

Теперь выполните тот же анализ еще раз, но с использованием переменной слоя. Обратите внимание, что направление вычисления процентов теперь должно быть другим. Переменная слоя имеет только 2 категории. Рассмотрим результаты анализа только для одной из этих категорий (в табл.31 эта категория названа «изучаемой»). Ответы на все следующие вопросы должны относиться только к изучаемой категории. Запишите эти ответы в текстовый файл:

5) Является ли теперь статистически значимой связь между строковой и столбцовой переменными?

6) В каком проценте ячеек не выполняется условие применения Хи-квадрат критерия Пирсона?      

7) Посмотрите в табл.31: процент случаев какой комбинации вам надо вычислить? По отношению к суммарной частоте какой комбинации этот процент надо вычислить? Запишите здесь ответ: каков этот процент?

8) Посмотрите в табл.31: для категории какой переменной необходимо найти наименьшую разницу? Просмотрите ваши результаты в файле Spo: для какой категории этой переменной наблюдается наименьшая разница между наблюдаемыми и ожидаемыми частотами? Каково абсолютное значение наименьшей разницы? 

По всем вопросам, связанным с использованием материалов Expect.ru, обращайтесь к Никулину Денису Николаевичу
email