Página anteriorPágina siguiente

MEDIDAS DE ASOCIACIÓN PARA DATOS NOMINALES

 

El botón Estadísticos permite calcular las medidas de asociación más utilizadas para variables nominales y ordinales. Por defecto no hay ninguna opción activada.

Algunos de los estadísticos que recoge este cuadro de diálogo son:

1. Chi-cuadrado, con esta opción se obtienen los estadísticos:

Chi-cuadrado de Pearson:(donde nij y eij son las frecuencias absoluta observada y esperada, respectivamente). Si la tabla es 2x2, el estadístico se puede calcular mediante la expresión abreviada (donde ni. y nj. son las frecuencias marginales por filas y columnas). Este estadístico es fiable únicamente cuando por lo menos el 80% de las frecuencias esperadas son mayores que 5.

Corrección de continuidad (de Yates):en las tablas 2x2 corrige el error que se comete al calcular el estadístico Chi-cuadrado de Pearson debido a la aproximación de una distribución discreta por una continua. El estadístico corregido es
Contraste de la razón de verosimilitud:se basa en el estadístico que se calcula como

Prueba exacta de Fisher:si la tabla es 2x2 y los totales marginales se consideran fijos, la probabilidad exacta de obtener la tabla analizada bajo el supuesto de independencia es:

 

Si la variable es Nominal los estadísticos que se pueden calcular son los siguientes:

2. Coeficiente de Contingencia de Pearson: se define como Esta medida de asociación no se ve afectada por el tamaño de la muestra y está acotada, Si las variables son independientes se tiene C=0, pero en caso de asociación perfecta nunca alcanza el valor 1. Para tablas cuadradas RxR se puede calcular la cota superior que es ; en tal caso

3. Phi y V de Cramer:

  • El coeficiente Phi es Este coeficiente toma el valor 0 en caso de independencia, pero su valor máximo depende de las dimensiones de la tabla; para tablas superiores a 2xJ o Ix2 el coeficiente puede tomar valores mayores que 1.
  • El coeficiente V de Cramer se calcula también en función de :

(donde k =mín(I,J)) y siempre está acotado entre 0 y 1 (sea cual sea la dimensión de la tabla). Para tablas 2xJ o Ix2 el valor de V coincide con el de .

4. Lambda: Incluye la simétrica y asimétrica y la de Goodman y Kruskal. Ambas medidas se basan en la reducción proporcional del error de predicción cuando se utilizan los valores de la variable independiente para predecir los de la dependiente.

  • El coeficiente de Kruskal se calcula:

- Si la es la variable dependiente:

donde fmj es la frecuencia relativa conjunta máxima correspondiente a la columna j-ésima y . es la frecuencia relativa marginal máxima de . El valor de este estadístico, acotado entre 0 y 1, indica en cuanto se reduce la incertidumbre de la variable cuando se dispone de información sobre el comportamiento de

- De forma análoga se calcula

- Si no se puede determinar cual de las dos variables es la dependiente y cual la independiente se calcula el coeficiente simétrica como:

El valor de simétrica está comprendido entre

Un valor igual a 0 indica que la información acerca de la variable independiente no ayuda en absoluto a predecir los valores de la variable dependiente; mientras que un valor igual a 1 indica asociación predictiva perfecta entre las variables.

  • La de Goodman y Kruskal indica la reducción en el error de clasificación de los elementos para una de las variables (dependiente) cuando se tiene información sobre el comportamiento de la otra (independiente). Si es la variable dependiente, se calcula: siendo TMCSI=total de elementos mal clasificados sin información acerca de y TMCCI=total de elementos mal clasificados con información acerca de La se define de manera análoga.

5. Coeficiente de incertidumbre, U: mide la reducción proporcional del error cuando los valores de una variable se emplean para predecir valores de la otra.

En el cuadro Nominal por intervalo se encuentra el estadístico:

6. Eta: Este coficiente es apropiado cuando la variable dependiente se mide en una escala de intervalo, mientras que la independiente es una variable nominal. El programa muestra dos valores de Eta según se considere que la variable medida en una escala de intervalo esté en las filas o en las columnas.

Página anteriorPágina siguiente