Página anteriorPágina siguiente

ESTIMACIÓN

 

Para estimar la línea de regresión poblacional a partir de la nube de puntos se utiliza el método de los mínimos cuadrados ordinarios (MCO), que considera como recta que mejor se ajusta a la que minimiza la suma de los cuadrados de los resíduos.

Si la recta de mejor ajuste es los errores o resíduos se definen como: y los estimadores por MCO de la ordenada en el origen,, y de la pendiente,, son:

Para evaluar la bondad del ajuste se calcula el coeficiente de determinación R2 y, para medir la dispersión de los puntos alrededor de la recta estimada, el error típico de la estimación Su. Estas medidas se definen como:

Donde SCT o suma total de cuadrados es la variación total de Y en la muestra y SCR o suma de cuadrados de la regresión es la parte de la variación total explicada por la recta ajustada. Por lo tanto, R2 indica la proporción de variación total explicada mediante larelación lineal entre X e Y, y toma valores entre 0 y 1. Un valor de R2 próximo a 1 indica que la recta ajustada es un buen modelo para explicar el comportamiento de la variable Y, y por lo tanto existe relación lineal entre X e Y. Por el contrario, un valor próximo a 0 indica que la recta ajustada no explica la variación observada en Y.

Para establecer el intervalo de confianza para la pendiente de la recta de regresión, , y contrastar si el valor de este parámetro es o no significativamente diferente a cero es necesario calcular el error típico de b que se define como:

El estadístico de prueba del contraste es que presenta una distribución de probabilidad t de Student con n-2 grados de libertad.

Para la obtención de la recta de regresión la secuencia es:

Analizar

Regresión

Lineal

Se abre el cuadro de diálogo Regresión lineal donde se seleccionan las variables Dependiente e Independientes.

  • La opción Método permite elegir el método de estimación. Si se trata de una regresión lineal simple (con una sola variable independiente) se conserva la definida por defecto (Introducir) siendo el resto de opciones para modelos con más de una variable explicativa.
  • Cuando se desee realizar un ajuste lineal basado únicamente en los casos que pertenecen a un subgrupo determinado por un valor o conjunto de valores de otra variable, ésta se deberá indicar en Variable de selección del cuadro de diálogo Regresión lineal e introducir la Regla o condición que debe verificar un caso para ser incluido en el análisis.
  • Opcionalmente se puede seleccionar la variable que recoge las etiquetas de los casos indicándola en Etiquetas de caso.
  • El botón MCP hace referencia a la estimación por mínimos cuadrados ponderados.

 

Este cuadro de diálogo además permite ampliar el análisis de regresión activando las opciones incluidas en Estadísticos, Gráficos y Opciones.

 

ESTADíSTICOS

El botón Estadísticos abre el cuadro de diálogo Regresión lineal: Estadísticos que por defecto tiene activadas las opciones Estimaciones y Ajuste del modelo.

- La opción Estimaciones proporciona las estimaciones de los coeficientes de la recta ajustada por el método de los mínimos cuadrados ordinarios y sus correspondientes errores típicos, así como los coeficientes estandarizados (beta), los valores del estadístico t y el nivel de significación crítico.

- La opción Ajuste del modelo muestra en el resumen delmodelo la bondad del ajuste o coefiente de determinación y en elcuadro ANOVA la descomposición de la suma total de cuadrados oinformación total observada.

Otras opciones que presenta este cuadro de diálogo son:

- Intervalos de confianza de los coeficientes de regresión que por defecto se calculan al 95\%.

- Matriz de covarianzas y de varianzas, y la matriz de correlaciones de los coeficientes del modelo que se analiza en el contexto de la regresión múltiple.

- Cambio en R cuadrado. Cuantifica la variación del coeficiente de determinación que se produce al añadir o eliminar alguna variable independiente en un modelo de regresión múltiple.

- Descriptivos incluye las medias y las desviaciones típicas de las variables seleccionadas y la matriz de correlaciones.

- Diagnósticos por caso. Esta opción presenta dos alternativas para el análisis de los residuos:

- la obtención de Valores atípicos a más de (por defecto 3) desviaciones típicas. Identifica aquellos casos para los cuales el valor estandarizado de los residuos difiere en (por defecto 3) o más desviaciones típicas de su media. Para estos casos también presenta el valor observado, el valor pronosticado y el residuo sin estandarizar. Incluye un cuadro de estadísticos de los residuos con la media y desviación típica de los valores pronosticados y de los residuos, tipificados y no tipificados, diferenciando entre los casos incluidos y los excluidos del análisis. La identificación de casos atípicos es importante porque su presencia en la muestra puede distorsionar los resultados de la regresión.

- la obtención de predicciones de Y para Todos los casos. Genera las predicciones de Y y sus correspondientes residuos para todos los casos.

El resto de opciones hacen referencia al modelo de regresión lineal múltiple.

 

GRÁFICOS

El botón Gráficos abre el cuadro de diálogo Regresión Lineal: Gráficos.

Este cuadro de diálogo permite seleccionar los gráficos a incluir en los resultados.

El recuadro superior presenta una serie de nuevas variables relacionadas con las predicciones y los residuos. éstas pueden ser seleccionadas para definir los ejes X e Y de los diagramas de dispersión que se quieren elaborar. Pulsando el botón Siguiente el programa va numerando los diagramas que incluirá en los resultados.

El recuadro Gráficos de residuos tipificados presenta dos opciones: Histograma que muestra un histograma de los residuos tipificados superponiéndole la distribución normal y Gráfico de prob. normal que crea un gráfico P-P útil para comprobar la hipótesis de normalidad a partir de los residuos tipificados. La comprobación de esta hipótesis es fundamental para la correcta interpretación de las estimaciones por intervalo, tanto de los coeficientes de la recta como de las predicciones.

 

OPCIONES

El botón Opciones abre el cuadro de diálogo Regresión Lineal: Opciones.

Permite desactivar Incluir constante en la ecuación que elimina el término independiente y proporciona la recta de regresión que pasa por el origen de coordenadas. Por lo que se refiere a los Valores perdidos, además de las dos posibilidades Excluir casos según lista, activada por defecto, y Excluir casos según pareja, comentadas en el epígrafe 3.6, hay la posibilidad de Reemplazar por la media, opción que sustituye los valores missing por la media de la variable correspondiente.

Página anteriorPágina siguiente