Página anterior

DIAGRAMA DE DISPERSIÓN

 

La representación gráfica más útil para describir el comportamiento conjunto de dos variables es el diagrama de dispersión o nube de puntos, donde cada caso aparece representado como un punto en el plano definido por las variables y Para obtener un diagrama de dispersión la secuencia es:

Gráficos

Dispersión

El cuadro de diálogo siguiente:

recoge diferentes tipos de diagramas de dispersión. Éstos pueden ser:

1. Simple: si el diagrama sólo recoge el comportamiento simultáneo de dos variables, una definida en el eje X (abscisas) y la otra en el eje Y (ordenadas). Con el botón Definir se abre el siguiente cuadro:

  • En Eje X se selecciona la variable que se considera independiente y en Eje Y la dependiente.
  • En Establecer marcas por puede indicarse alguna variable de control cuyas categorías o valores se representan con un símbolo o color distintivo. Esto permite identificar los puntos pertenecientes a cada categoría y poner de manifiesto si existen comportamientos diferenciados.
  • En Etiquetar los casos mediante se puede indicar alguna variable cuyos valores se tomarán como etiquetas de los casos. Para visualizar las etiquetas es preciso activar la opción Mostrar el gráfico con las etiquetas de caso del cuadro de diálogo Opciones.
  • El botón Títulos ofrece la posibilidad de definir dos líneas de título y un subtítulo, y dos líneas de nota al pie del gráfico.

2. Superpuestos: presenta dos o más parejas de variables en un mismo gráfico.

  • En Pares Y-X se indican las parejas de variables a representar seleccionándolas de dos en dos en la lista de variables. Si se quiere intercambiar X por Y se utiliza el botón Intercambiar par.
  • Etiquetar los casos mediante tiene la misma función que en el diagrama simple.
  • Los botones Titulos y Opciones ofrecen las mismas posibilidades ya vistas para el diagrama de dispersión simple.

 

3. Matricial: ofrece una matriz de diagramas de dispersión simples de todos los pares y todas las ordenaciones posibles que se pueden formar con las variables seleccionadas. En el cuadro de diálogo que aparece con el botón Definir se deben seleccionar las variables cuyos diagramas de dispersión simples aparecerán en la matriz.

4. 3-D: proporciona en tres dimensiones el diagrama de dispersión de tres variables.

Si el diagrama de dispersión es Simple o Superpuesto se puede visualizar con la recta que mejor se ajusta a la nube de puntos. Para ello se edita el gráfico en el visor de resultados haciendo doble clic sobre el mismo.

En la barra de menú del editor de gráficos se activa Diseño > Opciones y se abre el cuadro de diálogo:

Se selecciona Ajustar línea > Total. En Opciones de ajuste se puede elegir el método de ajuste deseado entre: Regresión lineal (activado por defecto), Regresión cuadrática, Regresión cúbica y Minsce. También es posible incluir en el diagrama de dispersión una línea paralela al eje de abscisas que pasa por la media de la variable Y con la opción Línea de referencia para la media en Y > Total.

Cuando el diagrama recoge un gran número de observaciones algunos puntos representan a más de un caso ya que estos se superponen . Con la opción Girasoles > Mostrar girasoles cada punto aparece con tantas rayas o 'pétalos' como casos representa. Ésta es una forma gráfica de indicar cuantos casos están representados por un punto.

EJEMPLOS

Con referencia a las variables Peso y Est (estatura) del archivo Encinf.sav comprobar gráfica y analíticamente la existencia de una relación lineal entre ellas.

1. La representación gráfica que permite comprobar la existencia de relación lineal entre dos variables es el diagrama de dispersión y la medida analítica adecuada es el coeficiente de correlación lineal.

Con la secuencia Gráficos > Dispersión > Simple > Definir se abre el cuadro de diálogo Diagrama de dispersion simple. Se seleccionan en el Eje Y la variable Peso y en el Eje X la variable Est, y se obtiene el siguiente gráfico:

Como se observa en el gráfico ambas variables presentan una relación lineal positiva; es decir, a medida que aumenta el valor de la variable Est aumenta también el valor de la variable Peso.

Si se desea ver la nube de puntos con la línea de mejor ajuste superpuesta, y que los casos iguales o muy próximos entre si queden representados por un sólo punto, se edita el gráfico haciendo doble clic sobre el mismo. En el editor de gráficos se selecciona Diseño > Opciones y en el cuadro Opciones del diagrama de dispersión se activa Mostrar girasoles y Ajustar línea > Total.

Para cuantificar el grado de asociación lineal entre las variables la medida adecuada es el coeficiente de correlación lineal de Pearson. Con la secuencia Analizar > Correlaciones > Bivariadas se abre un cuadro de diálogo donde se seleccionan las variables Peso y Est, y con las opciones Coeficiente de correlación > Pearson se obtiene la siguiente matriz de correlaciones.

El valor de r=0,883 es positivo y elevado, así como significativo para cualquier nivel, con lo cual se confirma la impresión
proporcionada por el gráfico acerca de la existencia de asociación lineal entre las variables.