Oviedo, España
En la evaluación diagnóstica de sistemas educativos se utilizan habitualmente autoinformes para recoger datos de carácter tanto cognitivo como oréctico. Es muy frecuente que por distintas razones en estos autoinformes falten algunos de los datos del alumnado. El objetivo del presente trabajo es comparar el funcionamiento de diferentes métodos de imputación de datos perdidos en el contexto de la evaluación de sistemas educativos. Sobre una base de datos de 5.000 sujetos se simularon 72 condiciones: tres tamaños de pérdida de datos, tres mecanismos de pérdida y ocho métodos de imputación de los datos perdidos. La cuantía de las pérdidas se establecieron en un 5, 10 y 20%. Los mecanismos de pérdida fijados fueron: aleatoria, moderadamente condicionada y fuertemente condicionada. Los ocho métodos de imputación utilizados fueron: eliminación, reemplazo por la media de la escala, por la media del ítem, por la media del sujeto, por la media del sujeto corregida, regresión múltiple e imputación por el algoritmo Esperanza-Maximización (EM) con y sin variables auxiliares. Los resultados indican que la recuperación de los datos es más precisa cuando se emplea una combinación adecuada de diferentes métodos de recuperación de los datos perdidos. Cuando se trata de un caso incompleto funciona muy bien la media del sujeto, mientras que para datos completamente perdidos es recomendable la imputación múltiple con el algoritmo EM. El uso de esta combinación resulta especialmente recomendable cuando la pérdida de datos es mayor y su mecanismo de pérdida está más condicionado. Finalmente, se discuten los resultados y se comentan algunas líneas futuras de investigación que se abren a partir de los resultados obtenidos.