Modelo de clasificación para predecir el desempeño de estudiantes en las Pruebas Saber Pro en Colombia. Incluye análisis exploratorio de datos, preprocesamiento y modelos de machine learning.
OTHER License
¡Bienvenido al repositorio del curso de Modelos 1 de la Universidad de Antioquia! 🎓 Aquí encontrarás todo lo relacionado con nuestro proyecto sobre las Pruebas Saber Pro en Colombia.
Nombre: Ricardo Contreras
Nombre: Estiven Ospina González
Nombre: Daniel León
Las Pruebas Saber Pro son exámenes estandarizados que se realizan en Colombia para evaluar la calidad y el nivel de conocimiento de los estudiantes de educación superior. Estas pruebas son una iniciativa del Gobierno de Colombia para monitorear y mejorar la calidad de la educación superior en el país.
Las pruebas abarcan cinco componentes genéricos:
Nuestro objetivo es crear un modelo de clasificación que prediga el desempeño de cada estudiante en estas pruebas, categorizándolos en: bajo, medio-bajo, medio-alto o alto.
El conjunto de datos incluye varias columnas que describen diferentes aspectos de cada estudiante, tales como:
En total, contamos con registros de casi 700,000 estudiantes.
Esta es una tarea de clasificación multi-clase con 4 categorías. La métrica de desempeño que utilizaremos será el accuracy, es decir, el porcentaje de predicciones correctas que realiza nuestro modelo.
Para cada ID en el archivo test.csv
, debemos predecir el desempeño en la variable RENDIMIENTO_GLOBAL
. El archivo de envío debe tener un encabezado y seguir el siguiente formato:
ID,RENDIMIENTO_GLOBAL
550236,bajo
98545,alto
499179,medio-bajo
Es crucial que el archivo de envío contenga los mismos IDs que están en el test.csv, ya que estos son los estudiantes con los que se evaluará el rendimiento de nuestro modelo.
Modelos1/
├── .devcontainer/
│ ├── devcontainer.json
├── data/
│ ├── train.csv
│ ├── test.csv
├── .gitignore
├── 01 - exploración.ipynb
├── 02 - preprocesado.ipynb
├── 03 - modelo con preprocesado de tal forma y SVM.ipynb
├── 04 - modelo con preprocesado de otra forma y Random Forest.ipynb
├── 99 - modelo solución.ipynb
├── requirements.txt
├── README.md