Antecedentes: las evaluaciones educativas a gran escala en los Estados Unidos son utilizadas como herramientas políticas para mejorar la instrucción, evaluar los programas educativos y la efectividad de los educadores. Debido al elevado impacto de sus usos, es imperativo obtener evidencias de validez basadas en las consecuencias del uso del test para sus múltiples objetivos. Método: se ha llevado a cabo una revisión comprehensiva de la literatura relacionada con la evidencia de validez basada en las consecuencias del uso del test. Resultados: debe elaborarse una teoría de la acción para un programa de evaluación mediante tests. Una teoría de la acción refleja un argumento interpretativo, un argumento de uso y un argumento de validez para los programas de evaluación, y define los objetivos y usos del sistema así como los resultados. La articulación de un argumento de validez permite la acumulación de evidencias no solo a favor, sino también en contra, de las interpretaciones y usos previstos de las puntuaciones. Conclusiones: como se describe en el artículo, para los sistemas de evaluación y rendición de cuentas que son diseñados para tener un efecto sobre la instrucción y el aprendizaje del estudiante, las consecuencias, tanto positivas como negativas, necesitan ser evaluadas.
Background: Large-scale educational assessments in the U.S. are used as policy tools for improving instruction and evaluating educational programs and the effectiveness of educators. Because of the high-stakes nature of their use, it is imperative that validity evidence based on testing consequences is obtained to support their multiple purposes. Method: A comprehensive review of the literature related to validity evidence for test use was conducted. Results: A theory of action for a testing program should be delineated. A theory of action reflects an interpretative and use argument and a validity argument for assessment programs and delineates the purposes and uses of the system as well as the outcomes of the system. The articulation of a validity argument allows for the accumulation of evidence not only for, but also against, intended score interpretations and uses. Conclusions: As described in the paper, for assessment and accountability systems that are intended to have an effect on both instruction and student learning, the consequences, both positive and negative, of the systems need to be evaluated.