Modelo de predicción de los resultados de la prueba icfes saber 11 en el área de matemáticas a partir de variables socioeconómicas

Modelo de previsão de resultados de testes icfes saber 11 na área de matemática baseado em variáveis socioeconómicas

Authors

  • Yamile Peña Lozano
  • José John Fredy González Veloza

DOI:

https://doi.org/10.54021/seesv3n1-006

Keywords:

ICFES, socio-economic variables, Machine Learning, LightGBM, mathematics., / ICFES, variables socioeconómicas, Machine Learning, LightGBM, matemáticas.

Abstract

Con base en la encuesta realizada al momento de la inscripción de los estudiantes para la prueba ICFES Saber 11 y los resultados obtenidos en la prueba de matemáticas, se busca generar un modelo de predicción de los resultados a partir de las condiciones socioeconómicas de los estudiantes que presentarán este examen. Históricamente, en Colombia, El Instituto Colombiano para la Evaluación de la Educación, anteriormente “Instituto Colombiano para el Fomento de la Educación Superior” lleva a cabo la aplicación de pruebas de desempeño académico a nivel nacional, por medio de la cuál es posible realizar mediciones de las capacidades de los estudiantes, en algunas competencias académicas, buscando establecer el nivel educativo de cada estudiante.  Desarrollar un modelo predictivo para esta prueba, se utiliza la base de datos de los estudiantes que presentaron la prueba en 2020 analizando las variables género, estrato, número de personas que conforman el hogar, educación de la madre, acceso a Internet, disponibilidad de computadora en el hogar, horas de trabajo semanal del estudiante, naturaleza de la Institución Educativa, área de ubicación geográfica de la Institución Educativa y el puntaje de la prueba en matemáticas.  Se realiza la predicción mediante las técnicas de Machine Learning y el modelo LightGBM con la ayuda del paquete PyCaret de Python, obteniendo como variable más significativa el acceso a internet con un MAPE de 0.1741, un MAE de 8.0244 y un R2 de 0.2049 entre sus principales métricas. 

 

Based on the survey carried out at the time of enrollment of the students for the ICFES Saber 11 test and the results obtained in the mathematics test, the aim is to generate a prediction model of the results based on the socioeconomic conditions of the students who they will take this exam. Historically, in Colombia, the Colombian Institute for the Evaluation of Education, formerly "Colombian Institute for the Promotion of Higher Education", carries out the application of academic performance tests at the national lev