Página siguiente

DISTRIBUCIONES UNIDIMENSIONALES: INTRODUCCIÓN

 

Todo análisis estadístico se inicia con una primera fase descriptiva de los datos. ésta tiene por objeto sintetizar la información mediante la elaboración de tablas de frecuencias, representaciones gráficas y el cálculo de medidas estadísticas (o estadísticos). Estos procedimientos descriptivos dependen de la naturaleza de la variable o atributo que se analiza y, en este sentido, el programa SPSS los recoge en dos menús diferentes según se empleen, básicamente, para sintetizar datos cualitativos o datos cuantitativos. Así mismo, el programa diferencia entre los procedimientos descriptivos que hacen referencia al análisis de una sola variable (análisis unidimensional) de los relativos a dos o más variables conjuntamente (análisis bidimensional o multidimensional).

 

DISTRIBUCIONES DE FRECUENCIAS

Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que recoge:

valores de la variable o modalidades del atributo,

frecuencia absoluta o número de veces que aparece cada valor o modalidad en la muestra,

porcentaje de veces que aparece cada valor de la variable o modalidad del atributo sobre el total de observaciones,

porcentaje válido calculado sobre el total de observaciones excluidos los valores missing,

porcentaje acumulado hasta cada uno de los valores de la variable ordenados de menor a mayor. Este porcentaje tiene interpretación sólo en los casos en que la variable sea susceptible de medida por lo menos en una escala ordinal.

Para obtener la tabla de frecuencias se procede con el menú:

Analizar
  Estadísticos Descriptivos
  Frecuencias

En el cuadro de diálogo Frecuencias se seleccionan las variables para las que se quiere obtener sus correspondientes tablas de frecuencias unidimensional y se trasladan al cuadro Variables con el botón . Para obtener la distribución de frecuencias debe estar activada la opción Mostrar tablas de frecuencias. La tabla que aparece en el visor de resultados no agrupa en intervalos o clases los valores de la variable; si se desea agruparlos es necesario recodificar previamente la variable (en otra variable) definiendo los límites de los intervalos*

Además, el cuadro de diálogo Frecuencias permite activar otras opciones con los botones:

Estadísticos

Gráficos

Formato

Estas opciones pueden utilizarse teniendo o no activada la opción Mostrar tablas de frecuencias.

 

ESTADÍSTICOS

La opción Estadísticos abre un cuadro de diálogo que permite la obtención de las principales medidas de síntesis o estadísticos de una distribución unidimensional de frecuencias. éstos se presentan agrupados en cuatro clases: Valores percentiles, Tendencia central, Dispersión y Distribución.

• Valores percentiles son aquellos valores de la variable que dividen a la distribución de frecuencias en partes con igual número de observaciones: así, los cuartiles la dividen en cuatro partes guales y se obtienen directamente activando la opción Cuartiles. Si interesan los valores que dividen la distribución en k partes iguales se activa la opción Puntos de corte para (por defecto 10) grupos iguales, lo que proporciona los deciles de la distribución. En la opción Percentiles es necesario indicar cuales de ellos se desean, incluyéndolos de uno en uno con el botón Añadir.

Tendencia central permite seleccionar Media, Mediana y Moda de la distribución, así como la Suma de todos los valores de la distribución.

Dispersión permite seleccionar las siguientes medidas: Varianza, como resultado del cálculo de la expresión, y Desviación típica; el error típico de la media (E.T.media) que se define como , así como los valores Mínimo y Máximo de la variable y la Amplitud o recorrido de la variable.

• Por último, en Distribución pueden obtenerse las siguientes medidas relativas a la forma de la distribución:
coeficiente de Asimetría, error típico de asimetría, coeficiente de Curtosis y error típico de curtosis, calculadas mediantelas siguientes expresiones:

Asimetría


Error típ. de asimetría


Curtosis


Error típ.de curtosis

 

GRÁFICOS

Los gráficos asociados a la tabla de frecuencias que recoge del cuadro de diálogo Frecuencias son: Gráficos de barras, Gráficos de sectores o Histogramas. Para seleccionar el que interesa se activa la opción Gráficos que abre el siguiente cuadro de diálogo:

Si la característica objeto de análisis es un atributo los gráficos adecuados son el gráfico de barras o de sectores; en ambos casos pueden realizarse con frecuencias absolutas o con relativas seleccionando Frecuencias o Porcentajes, respectivamente. Si la característica es cuantitativa el gráfico adecuado es el histograma que, a su vez, puede obtenerse superponiéndole la Curva de la distribución normal activando la opción correspondiente.  

 

FORMATO

Para modificar el aspecto de los resultados, ya sean, tablas o estadísticos, se activa la opción Formato que abre el cuadro de diálogo siguiente:

Con las siguientes opciones:

Ordenar por: se puede elegir entre distintos criterios de ordenación de los valores de la variable en la tabla de frecuencias. Por defecto, los valores aparecen en orden ascendente; pero también es posible una ordenación descendente o una ordenación por frecuencias, tanto ascendente como descendente, activando las opciones correspondientes.

Múltiples variables: se puede seleccionar el tipo de presentación de los cuadros de estadísticos cuando se realiza simultáneamente el análisis unidimensional de dos o más variables. Por defecto, está activada la opción Comparar variables que proporciona un único cuadro que contiene los estadísticos seleccionados correspondientes a todas las variables. Si se selecciona la opción Organizar resultados según variables se obtiene un cuadro de estadísticos para cada variable por separado.

El cuadro Frecuencias: Formato también ofrece la posibilidad de limitar la elaboración de tablas de frecuencias sólo para Aquellas variables que presentan un número reducido de valores o categorías. Para ello se debe indicar en el recuadro Suprimir tablas con más de (por defecto 10) categorías el número de categorías a partir del cual no se desea la elaboración de la tabla.

 

EJEMPLOS

Ejemplo 1. Con la base de datos Enctran.sav obtener la tabla de frecuencias, el diagrama de barras y los estadísticos media, mediana, moda, desviación tipo, varianza y las medidas de forma (asimetría y curtosis) de las variables: Como, Rapi e Inde.

Vamos a realizar la descripción de la variable Como, dejando al lector la descripción de las variables Rapi e Inde.

Con la secuencia Analizar > Estadísticos Descriptivos > Frecuencias se abre un cuadro de diálogo donde se selecciona la variable Como; con el botón Estadísticos se activan las medidas que se desean obtener y con el botón Gráficos se activa la opción Gráficos de barras.

Se obtienen los siguientes cuadros:

En base a estos resultados se concluye:

- La base de datos no presenta para esta variable ningún valor missing, de forma que las 114 observaciones son todas válidas.

- Las medidas de posición (media, mediana y moda) indican el valor central de la distribución, y en este caso aproximadamente coinciden los tres estadísticos en el valor 5. Esto significa que la distribución es bastante simétrica y que la valoración media de la comodidad del medio de transporte no es ni buena ni mala.

- La desviación típica es 2,52 que sobre una media de 5,1 indica que la dispersión de los datos con respecto a la media es moderada.

- El coeficiente de asimetría toma el valor 0,182 que no es significativo ya que presenta un error estándar 0,226 y, por lo tanto, puede considerarse que la distribución es simétrica. La curtosis de esta variable es -0,126 con un error estándar de 0,449 lo que indica que la distribución es mesocúrtica.

- La distribución de la variable es unimodal, prácticamente simétrica y campaniforme como se observa en el gráfico.

 

Ejemplo 2. Con la misma base de datos Enctran.sav obtener la tabla de frecuencias y el diagrama de barras de la variable Trans.

Entre otros resultados se observa que los porcentajes correspondientes a las tres modalidades de transporte público acumulan el 83,3% de los estudiantes y, únicamente, el 12,2% utiliza transporte privado. Al ser una variable cualitativa el único estadístico representativo de la distribución es la moda que, en este caso, es la modalidad Metro que representa un 46,5% del total.

Ejemplo 3. Con la base de datos Enctran.sav obtener la tabla de frecuencias y la representación gráfica adecuada para la variable Coste, agrupando los valores en los siguientes intervalos: [0,5000) [5000,10000) [10000,15000) [15000, 20000).

Para obtener la tabla con los valores agrupados en intervalos es necesario, en primer lugar, recodificar los valores en una nueva variable. Para ello, se activa la opción Recodificar > En distintas variables del menú Transformar. En el cuadro de diálogo que aparece:

• Se selecciona la variable Coste.

• En Variable de Resultado se indica el nombre elegido para la nueva variable, por ejemplo, 'Coste1'.

• Se etiqueta la nueva variable, 'Coste recodificado'.

• Se definen los intervalos activando Valores antiguos y nuevos. Para definir el primer intervalo se activa en Valor antiguo la opción Rango: Del menor hasta 5000 y se le asigna como Valor nuevo 1; los siguientes intervalos se definen activando Rango límite inferior hasta límite superior, asignándoles los valores 2 y 3. El último intervalo se define mediante Rango 15000 hasta el mayor y se le asigna Valor nuevo 4.

• Se etiquetan los valores de la variable Coste1. En la ventana Vista de variable o bien con doble clic sobre la variable Coste1, introducimos las etiquetas de los valores. En Valores se indica:

Valor

 Etiqueta de valor 

1

 0-5000 

2

 5000-10000 

3

 10000-15000 

4

 15000-20000

• Por último, con Analizar > Estadísticos Descriptivos > Frecuencias se obtiene la tabla de frecuencias y el histograma, que es el adecuado dada la naturaleza continua de la variable.


Página siguiente