Página anteriorPágina siguiente

MEDIDAS DE ASOCIACIÓN PARA DATOS ORDINALES

 

En el cuadro de diálogo Tablas de contingencia: Estadísticos pueden activarse diversas opciones que proporcionan medidas de asociación cuando las variables se miden por lo menos en una escala ordinal; las más utilizadas son:

 

  1. Correlaciones: con esta opción se obtienen los estadísticos:
  • Coeficiente de correlación de Pearson: es una medida de asociación lineal adecuada para variables medidas en escala de intervalo *.
  • Coeficiente de correlación de Spearman: mide el grado de correspondencia que existe entre los rangos que se asignan a los valores de las variables analizadas. Por ello, este coeficiente se puede calcular con datos ordinales, y se define: , siendo di la diferencia entre los rangos correspondientes a la observación i-ésima. El coeficiente toma valores entre -1 y +1. Un valor cercano a 0 indica que las variables apenas están relacionadas.

 

El cuadro Ordinal recoge una serie de estadísticos basados en el número de concordancias y discordancias que aparecen al comparar las puntuaciones asignadas a los mismos casos según dos criterios (o jueces) diferentes. Así, por ejemplo, si recoge las puntuaciones asignadas a los casos según el primer criterio y según el segundo, para la obtención de concordancias y discordancias que aparecen entre los dos criterios, se procede de la siguiente forma:

  • se ordenan los pares de puntuaciones de acuerdo con el orden natural de las puntuaciones asignadas según el primer criterio, .
  • se compara cada valor de con cada uno de los que le siguen, y se registra una concordancia (+1) cuando los dos valores siguen el orden natural, una discordancia (-1) cuando el orden está invertido y un empate (0) cuando coinciden ambas puntuaciones.
  • se calculan C total de las concordancias, D total de las discordancias y E el número total de empates.

El número total de comparaciones es incluyendo empates.

1. Gamma: El estadístico Gamma se define como Este análisis excluye los casos que presentan la misma puntuación en las dos variables (empates).

2. Tau-b de Kendall. Este coeficiente incluye los empates contemplando por separado los que aparecen en la variable y los que aparecen en la variable.

Se define como

 

3. Tau-c de Kendall. Este estadístico se define como siendo k el menor número de casos no empatados que presentan o

4. d de Somers: A diferencia de los anteriores este estadístico considera que las variables pueden ser simétricas o dependientes. En el primer caso, el estadístico d de Somers coincide con la Tau-b de Kendall. En el segundo supuesto, se diferencia del estadístico Gamma en que incluye los empates de la variable que considera dependiente. Si la variable dependiente es

 

Todas estas medidas toman valores entre -1 y +1, y alcanza los valores extremos cuando existe concordancia o discordancia perfecta. Valores próximos a 0 indican ausencia de asociación.

 

EJEMPLO

Ejemplo 1.

Obtenga una tabla de contingencia con las frecuencias absolutas, relativas y condicionadas para las variables Trans (tipo de transporte) y Resid (vive en Barcelona) de la base de datos Enctran.sav, y el correspondiente diagrama de barras.

En el cuadro de diálogo Tablas de contingencia se activa la opción Mostrar los gráficos de barras agrupadas, y en el cuadro de diálogo Tablas de contingencia > Casillas se activan las opciones Porcentajes Fila, Columna y Total.

Los resultados que se obtienen son los siguientes:

 

En la tabla de contingencia se observan, entre otros resultados, los siguientes:

- Un total de 53 personas utilizan el metro de las cuales 41 viven en Barcelona y 12 no.

- El 36% del total de casos de la muestra utilizan el metro y viven en Barcelona.

- El 58,6% de los que viven en Barcelona utilizan el metro.

- El 77,4% de los que utilizan el metro viven en Barcelona.

- El 10,5% del total de casos utilizan el metro y no viven en Barcelona.

- El 27,3% de los que no viven en Barcelona utilizan el metro.

-El 22,6% de los que utilizan el metro no viven en Barcelona.

Análogamente se interpretan el resto de resultados.

 

Ejemplo 2.

Obtenga la tabla de contingencia para las variables del ejemplo anterior con frecuencias observadas, esperadas y resíduos no tipificados.

La observación de los resíduos permite tener una primera aproximación sobre la existencia de asociación entre las variables.Si los resíduos en valor absoluto son próximos a 0 se espera que la hipótesis de independencia entre las variables no se pueda rechazar. Por el contrario, cuanto mayores sean los valores absolutos de los resíduos se tendrán más indicios sobre la existencia de asociación. En cualquier caso, la confirmación de la existencia o no de asociación entre las variables se obtiene a partir de los estadísticos correspondientes. En este ejemplo se observan unos valores de los resíduos, en general, elevados, lo que nos lleva a pensar en la existencia de asociación entre el tipo de transporte y el lugar de residencia.

 

Ejemplo 3.

Siguiendo con las mismas variables obtenga el coeficiente Chi-cuadrado, coeficiente de contingencia, Phi y V de Cramer e interprete los resultados.

En el cuadro de diálogo Tablas de contingencia: Estadísticos se activan las opciones correspondientes. Los resultados aparecen en los siguientes cuadros.

Como se ha visto en el ejemplo anterior, la tabla de contingencia de las variables Trans y Resi presenta 5 casillas con frecuencia esperada inferior a 5, lo que representa un 41,7% de las casillas. En estas condiciones, los resultados del contraste Chi-cuadrado no son fiables. Para resolver este problema se agrupan clases hasta obtener frecuencias esperadas superiores a 5. Agrupando Moto y Otros se obtiene una clase que tiene frecuencia esperada prácticamente igual a 5. Para agruparlas se recodifica la variable Trans en una nueva variable (Trans2) manteniendo todos los valores de Trans excepto los correspondientes a Moto y Otros, a los que se les asigna un único valor.

Repitiendo el análisis se obtiene:

Como puede observarse en la tabla de contingencia hay tres frecuencias esperadas menores que 5, es decir, el 30% del total; no obstante una de dichas frecuencias es igual a 4,9 que a efectos prácticos puede considerarse igual a 5. Por tanto sólo el 20% de las frecuencias esperadas es inferior a 5 y en estas condiciones los resultados del contraste Chi-cuadrado son fiables. El valor del estadístico Chi-cuadrado* es 19,490 y la razón de verosimilitud 20,043. Estos valores difieren significativamente de 0 para niveles de significación superiores a 0,001, lo que significa que se rechaza la hipótesis de independencia para los niveles de significación habituales.

** NOTA A PIE ** Obsérvese que no se ha realizado la corrección de continuidad de Yates, porque la tabla no es de dimensiones 2x2.

-Las medidas basadas en el estadístico Chi-cuadrado, que son los coeficientes Phi y V de Cramer, toman ambas* el valor 0,413 con un nivel de significación crítico 0,001; lo que implica la existencia de asociación moderadamente fuerte entre las variables.

** NOTA A PIE ** En este caso, ambos coeficientes coinciden por tratarse de una tabla de dimensiones Ix2.

-El coeficiente de contingencia de Pearson toma el valor 0,382, también con el nivel de significación 0,001. Esto es consistente con el valor de los coeficientes anteriores.

 

Ejemplo 4:

Analizar si existe asociación entre las variables Tipo e Internet del archivo Encinf.sav e indicar si es posible establecer una relación de dependencia entre ambas.

Para analizar si existe asociación e indicar el tipo de relación de dependencia se activan las opciones Chi-cuadrado, Coeficiente de contingencia, Phi y V de Cramer y Lambda del cuadro de diálogo Tablas de contingencia: Estadísticos y se seleccionan las nuevas variables, Tipo e Internet.

- El estadístico Chi-cuadrado toma el valor 40,523 que permite rechazar la hipótesis de independencia para cualquier nivel de significación.

- Los valores de los coeficientes Phi, V de Cramer y coeficiente de contingencia de Pearson son superiores a 0,5 y significativos para cualquier nivel. Teniendo en cuenta que el coeficiente de contingencia para una tabla de dimensiones 3x2 tiene una cota superior inferior a 1, el valor 0,512 indica un grado de asociación moderadamente alto.

- Del análisis direccional se deduce que:

- Tomando la variable Tipo como dependiente, Tipo = 0,000, lo cual indica que el conocimiento de los valores de la variable Internet no permite predecir el comportamiento de la variable Tipo.

- Tomando la variable Internet como dependiente, Internet=0,418 con un error típico asintótico igual a 0,129. Así pues, el conocimiento de los valores de la variable Tipo permite reducir la incertidumbre en la predicción del comportamiento de la variable Internet en un 41,8%. Esta estimación de Internet es significativa para niveles de significación superiores a 0,011.

- El estadístico Tau de Goodman con Internet dependiente toma el valor Internet = 0,355 con un error típico de 0,025; este resultado confirma las conclusiones del apartado anterior.

 

Ejemplo 5:

Del archivo Encinf.sav analice si existe concordancia entre las valoraciones dadas por los alumnos al equipamiento informático del centro, con referencia a las variables Dotacion y Software, e indique si es posible establecer una relación de dependencia entre ambas.

Para analizar la concordancia entre variables ordinales se activan las opciones Correlaciones, Gamma, d de Somers, Tau-b de Kendall y Tau-c de Kendall del cuadro de diálogo Tablas de contingencia:Estadísticos.

- Las medidas simétricas de concordancia entre Dotación y Software indican que existe una asociación moderada y positiva. El coeficiente de correlación de Spearman, que es la medida de concordancia más utilizada con datos ordinales, es 0,424 con un error típico asintótico de 0,088; por tanto, difiere significativamente de 0 para cualquier nivel de significación.

- Las medidas direccionales indican que la concordancia es simétrica ya que coinciden todos los valores del coeficiente d de Somers. Esto quiere decir, que si bien las variables presentan un moderado grado de concordancia no existe entre ellas una relación de dependencia.

 

Ejemplo 6:

Analice la concordancia entre las variables Mantenimiento y Aulas del archivo Encinf.sav, e indique si puede admitirse una relación de dependencia entre ambas.

En el cuadro de diálogo Tablas de contingencia se seleccionan las variables Mantenimiento y Aulas en las Filas y Columnas. Con el botón Estadísticos se accede al menú donde se activan las medidas de concordancia entre variables ordinales. Los resultados de este análisis son:

 

Tanto el coeficiente de correlación de Spearman como las restantes medidas simétricas toman valores próximos a 0 y en todos los casos se acepta la hipótesis de que no existe concordancia. A la vista de este resultado no puede suponerse que exista una relación de dependencia entre estas variables; los valores de las medidas direccionales lo confirman.

Página anteriorPágina siguiente