Federico Giovannetti, Mariana C. Smulski, Jazmín Cevasco
En la Argentina, aún son pocos/as los/as psicólogos/as que se dedican a la investigación en comparación con aquellos que se dedican a la Clínica. A su vez, no existe información pública y accesible respecto de la inserción de estos profesionales en el ámbito científico. Una forma de acceder a esta información involucra examinar los ingresos de recursos humanos dentro del CONICET. Este organismo tiene un rol central como formador de científicos/as en Argentina. Evidencia previa muestra que la inserción laboral de psicólogos/as en el CONICET fue en aumento desde 2010 hasta 2015, pero sufrió importantes recortes y vaivenes de 2016 en adelante. Aquí se propone explorar la utilidad de distintos métodos de aprendizaje automático no supervisado para identificar los temas más estudiados dentro del organismo, y su evolución entre los años 2011 y 2021. Con este fin, se recabó información sobre todos los proyectos aprobados en la comisión de Psicología y Ciencias de la Educación en las categorías doctoral, posdoctoral y CIC. Considerando la información de texto contenida en los títulos, resúmenes y palabras clave, se implementaron modelos de aprendizaje automático (machine learning) no supervisado para el modelado de tópicos. Específicamente, se implementaron los modelos Latent Dirichlet Allocation (LDA) y Correlated Topic Models (CTM). Ambos modelos permitieron agrupar los proyectos en siete unidades temáticas. Los resultados sugieren que el modelo CTM podría ser más adecuado para extraer recurrencias y dar cuenta de las temáticas centrales dentro del área. Por otra parte, se analizó la prevalencia de cada uno de esos temas a lo largo de los años, identificando distintas trayectorias. Este trabajo contribuye a explorar la utilidad del aprendizaje automático para el estudio de las agendas de investigación dentro de CONICET, y el avance hacia la utilización de métodos supervisados para evaluar nuevas hipótesis de investigación guiadas teóricamente.