Sumario: | En el sector educativo, la predicción de la deserción de estudiantes es un tema abierto y que implica el uso de múltiples características relativas al desempeño de los estudiantes. Las técnicas de aprendizaje automático se han utilizado para realizar tareas en este sentido, y en este campo se ha determinado la importancia de hacer selección de características para mejorar la calidad de la predicción, así como re-muestreo cuando el conjunto de datos cuenta con clases desbalanceadas. Se presenta un algoritmo genético por bloques para selección y construcción de características, el cual permita mejorar la calidad de predicción en conjuntos de datos donde las características están conformadas por grupos de forma anticipada. En el algoritmo genético por bloques, cada cromosoma se subdivide en grupos de características (bloques), que a su vez están divididos en cuatro secciones de genes (donde cada gen representa una característica): genes individuales apagados, genes individuales prendidos, genes compuestos apagados y genes compuestos prendidos. Los genes compuestos representan el proceso de construcción y se manejan a través de árboles de operaciones con notación postfija. En cuanto al algoritmo genético en sí, la población inicial, la evaluación, la cruza y la mutación también son adaptadas para hacerse bajo el esquema de bloques.
|