MEDIDAS DE ASOCIACIÓN PARA DATOS NOMINALES
El botón Estadísticos permite calcular las medidas de asociación más utilizadas para variables nominales y ordinales. Por defecto no hay ninguna opción activada.
Algunos de los estadísticos que recoge este cuadro de diálogo son:
1. Chi-cuadrado, con esta opción se obtienen los estadísticos:
Si la variable es Nominal los estadísticos que se pueden calcular son los siguientes:
3. Phi y V de Cramer:
- El coeficiente Phi es Este coeficiente toma el valor 0 en caso de independencia, pero su valor máximo depende de las dimensiones de la tabla; para tablas superiores a 2xJ o Ix2 el coeficiente puede tomar valores mayores que 1.
- El coeficiente V de Cramer se calcula también en función de :
(donde k =mín(I,J)) y siempre está acotado entre 0 y 1 (sea cual sea la dimensión de la tabla). Para tablas 2xJ o Ix2 el valor de V coincide con el de .
4. Lambda: Incluye la simétrica y asimétrica y la de Goodman y Kruskal. Ambas medidas se basan en la reducción proporcional del error de predicción cuando se utilizan los valores de la variable independiente para predecir los de la dependiente.
- El coeficiente de Kruskal se calcula:
- Si la es la variable dependiente:
donde fmj es la frecuencia relativa conjunta máxima correspondiente a la columna j-ésima y . es la frecuencia relativa marginal máxima de . El valor de este estadístico, acotado entre 0 y 1, indica en cuanto se reduce la incertidumbre de la variable cuando se dispone de información sobre el comportamiento de
- De forma análoga se calcula
- Si no se puede determinar cual de las dos variables es la dependiente y cual la independiente se calcula el coeficiente simétrica como:
El valor de simétrica está comprendido entre
Un valor igual a 0 indica que la información acerca de la variable independiente no ayuda en absoluto a predecir los valores de la variable dependiente; mientras que un valor igual a 1 indica asociación predictiva perfecta entre las variables.
- La de Goodman y Kruskal indica la reducción en el error de clasificación de los elementos para una de las variables (dependiente) cuando se tiene información sobre el comportamiento de la otra (independiente). Si es la variable dependiente, se calcula: siendo TMCSI=total de elementos mal clasificados sin información acerca de y TMCCI=total de elementos mal clasificados con información acerca de La se define de manera análoga.
5. Coeficiente de incertidumbre, U: mide la reducción proporcional del error cuando los valores de una variable se emplean para predecir valores de la otra.
En el cuadro Nominal por intervalo se encuentra el estadístico:
6. Eta: Este coficiente es apropiado cuando la variable dependiente se mide en una escala de intervalo, mientras que la independiente es una variable nominal. El programa muestra dos valores de Eta según se considere que la variable medida en una escala de intervalo esté en las filas o en las columnas.
|