|
|
OBTENCIÓN DE PREDICCIONES Y ANÁLISIS DE RESIDUOS
El modelo permite generar predicciones para el valor esperado o para un valor individual de la variable dependiente (Y) asociado a un valor dado de la variable independiente (X). En ambos casos la predicción puntual es la misma y se obtiene sustituyendo en el modelo estimado el valor X0 para el cual se desea realizar la predicción. Para obtener el intervalo de confianza de los pronósticos y/o contrastar si puede aceptarse un determinado valor de Y condicionado a un valor X0 es necesario calcular el error estándar de la predicción, el cual dependerá del valor pronosticado:
Para obtener las predicciones se debe acceder al cuadro de diálogo Regresión Lineal: Guardar nuevas variables con el botón Guardar:
EJEMPLOS Ejemplo 1.
Con la secuencia Analizar > Regresión > Lineal aparece el correspondiente cuadro de diálogo en el que se seleccionan la variable Peso como Dependiente y la variable Est como Independiente. En el recuadro Variable de selección se introduce la variable Enc (número de encuesta) y con el botón Regla se abre el cuadro de diálogo Regresión Lineal: Establecer regla donde se introduce la condición 'menor o igual que 100'. Los resultados que se obtienen son:
En el cuadro resumen del modelo se observa que: r=0,883, R2=0,78 (obsérvese que R2 es igual a r al cuadrado) y Su=6,0638. El coeficiente de determinación indica que el 78% de la variación total del peso en la muestra queda explicada por el modelo estimado y, por lo tanto, el modelo proporciona un buen ajuste. El cuadro Coeficientes presenta los siguientes resultados:
Ejemplo 2.
Con la secuencia Analizar > Regresión > Lineal aparece el correspondiente cuadro de diálogo en el que se mantienen seleccionadas la variable Peso como Dependiente y la variable Est como Independiente. Con el botón Estadísticos se accede al cuadro de diálogo que presenta las opciones correspondientes al diagnóstico de residuos. Se activa Diagnóstico por caso y Valores atípicos a más de 2 desviaciones típicas.
Con el botón Gráficos se abre el cuadro de diálogo donde se deben activar las opciones correspondientes a los Gráficos de residuos tipificados.
El histograma de los residuos permite comprobar gráficamente la hipótesis de normalidad; aspecto que deberá tenerse en cuenta para la interpretación de los resultados de la inferencia estadística. En este caso vemos que la distribución es campaniforme pero presenta una laguna en el centro que puede ser, en parte, consecuencia de los intervalos definidos.
El diagrama P-P compara la frecuencia acumulada por los residuos tipificados con la probabilidad esperada bajo la hipótesis de normalidad. Se observa que estas diferencias podrían ser significativas en alguna zona del gráfico; lo cual, de ser cierto, pondría en duda la validez de la hipótesis de normalidad de los residuos. No obstante, el criterio para decidir si se puede rechazar la hipótesis de normalidad será el que proporcione alguno de los contrastes de normalidad. Además, en el mismo cuadro de diálogo se puede pedir que elabore los diagramas de dispersión de, por ejemplo, los residuos estandarizados en función de la variable dependiente (ZRESID y DEPENDNT).
En el gráfico vemos que no existe ningún patrón de comportamiento de los residuos respecto a Y. Por lo tanto, podemos mantener que estas variables aleatorias están incorrelacionadas. Ejemplo 3.
Con la secuencia Analizar > Regresión > Lineal aparece el correspondiente cuadro de diálogo en el que se mantienen seleccionadas la variable Peso como Dependiente y la variable Est como Independiente. Con el botón Guardar se abre el cuadro de diálogo donde se deben activar las opciones:
Los resultados de estas opciones quedan almacenados en el archivo de datos activo, y están disponibles para análisis posteriores. Por defecto los nombres de las variables que crea son: Pre_1 (predicciones no estandarizadas), Res_1 (residuos no estandarizados), Zpr_1, Zre_1(predicciones y residuos estandarizados, respectivamente), Sep_1 (error estándar de las predicciones), Imci_1, Unci_1 (Límite inferior y superior del intervalo de confianza para la predicción del valor esperado de Y), Lici_1, Uici_1 (Límite inferior y superior del intervalo de confianza para la predicción individual de Y). Por ejemplo, para el caso 101, que presenta una estatura de 168 y un pesoigual a 56, los resultados son:
Idénticamente, la predicción para el caso 102, que presenta una estatura de 180, es de 73,82255 kg., con un residuo igual a -3,82255 y un error estándar 0,77055. Los correspondientes intervalos de confianza para el valor esperado y para el valor individual son (72,29343 ; 75,35167) y (61,69239; 85,95271), respectivamente. |
|
|