Revista Electrónica Educare (Educare Electronic Journal) EISSN: 1409-4258 Vol. 27(1) ENERO-ABRIL, 2023
doi: https://doi.org/10.15359/ree.27-1.14516
https://www.revistas.una.ac.cr/index.php/educare
educare@una.ac.cr
[Cierre de edición el 01 de Enero del 2023]
Fernando Alain Incio-Flores
Universidad Nacional Intercultural Fabiola Salazar Leguía de Bagua
Bagua, Perú
https://orcid.org/0000-0003-3286-7787
Dulce Lucero Capuñay-Sanchez
Universidad César Vallejo
Chiclayo, Perú
https://orcid.org/0000-0001-8678-5766
Ronald Omar Estela-Urbina
Universidad Nacional Intercultural Fabiola Salazar Leguía de Bagua
Bagua, Perú
https://orcid.org/0000-0001-5240-1242
Recibido • Received • Recebido: 21 / 09/ 2020
Corregido • Revised • Revisado: 09 / 11 / 2022
Aceptado • Accepted • Aprovado: 13 / 12 / 2022
Resumen:
Objetivo. Este artículo muestra el diseño y entrenamiento de una red neuronal artificial (RNA) para predecir resultados académicos de estudiantes de Ingeniería Civil de la Universidad Nacional Intercultural Fabiola Salazar Leguía de Bagua-Perú en la asignatura de Matemática II. Método. Se utilizó la metodología CRISP-DM, para recolectar los datos se emplearon encuestas, el modelo de RNA se implementó en el software Matlab utilizando el comando nnstart y dos algoritmos de aprendizaje: Scaled Conjugate Gradient (SCG) y Levenberg-Marquardt (LM), el rendimiento del modelo se evaluó mediante el error cuadrático medio y el coeficiente de correlación. Conclusiones. El algoritmo LM logró mejor efectividad en la predicción.
Palabras claves: Red neuronal artificial; rendimiento académico; predicción.
Abstract:
Objective. This article shows the design and training of an artificial neural network (ANN) to predict academic results of Civil Engineering students of the Fabiola Salazar Leguía National Intercultural University, from Bagua-Peru, in the subject of Mathematics II. Method. The CRISP-DM methodology was used, surveys were conducted to collect the data, and the RNA model was implemented in the Matlab software using the nnstart command and two learning algorithms: Scaled Conjugate Gradient (SCG) and Levenberg-Marquardt (LM). The performance of the model was evaluated through the mean square error and the correlation coefficient. Conclusions. The LM algorithm achieved better prediction effectiveness.
Keywords: Artificial neural network; academic performance; prediction.
Resumo:
Objetivo. Este artigo mostra o projeto e o treinamento de uma rede neural artificial (RNA) para predizer resultados acadêmicos de alunos de Engenharia Civil da Universidade Nacional Intercultural Fabiola Salazar Leguía de Bagua-Peru na disciplina de Matemática II. Método. A metodologia CRISP-DM foi utilizada, levantamentos foram utilizados para coletar os dados, o modelo de RNA foi implementado no software Matlab usando o comando nnstart e dois algoritmos de aprendizagem: Scaled Conjugate Gradient (SCG) e Levenberg-Marquardt (LM). O desempenho do modelo foi avaliado por meio do erro quadrático médio e do coeficiente de correlação. Conclusão. O algoritmo LM alcançou melhor eficácia de previsão.
Palavras-chave: Rede neural artificial; desempenho acadêmico; previsão.
En la Universidad Nacional Intercultural Fabiola Salazar Leguía de Bagua (UNIFSLB) durante los semestres académicos 2019-I y 2019-II en que se dictó el curso de Matemática II al estudiantado de la carrera profesional de Ingeniería Civil se han evidenciado resultados desalentadores en los promedios finales; de acuerdo con la base de datos obtenida de la unidad de registro y archivos académicos de la UNIFSLB, del total del alumnado que aparece con promedio final en este curso en los semestres referidos, el 55% tiene un promedio menor o igual a 12, lo cual es muy preocupante considerando que la carrera de Ingeniería Civil tiene su sustento en la Física y la Matemática. Dentro de los múltiples métodos de predicción tenemos a los modelos estadísticos de regresión, pero, para que sean aplicados deben cumplirse ciertas condiciones de independencia, linealidad, normalidad de los residuos, normalidad e igualdad de varianza y tamaño maestral suficiente (Cohen et al., 2013; Maxwell et al., 2017), en esta investigación hemos acudido a las redes neuronales artificiales para efectos de predicción, las cuales han sido conceptualizadas como técnicas estadísticas no paramétricas al estar libres del cumplimiento de los parámetros estadísticos anteriormente mencionados (Sarle, 1994). Tener la posibilidad de poder predecir los resultados académicos del estudiantado brinda al personal docente la oportunidad de buscar nuevas estrategias y técnicas pedagógicas en el tiempo indicado para lograr mejores resultados en su estudiantado. La pregunta que guía esta investigación es: ¿Cómo podemos construir una red neuronal artificial que pueda predecir el rendimiento académico?, teniendo en cuenta que este depende de factores endógenos y exógenos relacionados al estudiantado (Garbanzo Vargas, 2007). El objetivo de esta investigación es diseñar e implementar un modelo de red neuronal artificial para predecir los resultados académicos en la asignatura de Matemática II del estudiantado de Ingeniería Civil de la UNIFSLB.
Diversos autores y autoras han realizado valiosos aportes en educación utilizando redes neuronales artificiales. Así, Álvarez Blanco et al. (2016), por medio de redes neuronales artificiales, diseñaron e implementaron un modelo neuronal para predecir los resultados que alcanzará el estudiantado en la asignatura de Estructuras de Datos I y Estructura de Datos II, el modelo implementado logró una efectividad de predicción del 78% y 75% respectivamente. En Turquía, Çetinkaya y Baykan (2020) implementaron un modelo de red neuronal artificial para predecir aptitudes de profesionales de la programación con base en la información demográfica, problemas de plegado de papel, dibujo de mapas, pensamiento analítico y calificaciones del estudiantado obtenidas de un curso en Code.org, el mejor ajuste al modelo lo lograron con el algoritmo de Regularización Bayesiana. Diversas investigaciones destacan la importancia de las redes neuronales artificiales en la predicción como una posibilidad de dar solución a problemas de deserción estudiantil y rendimiento académico (Cukurova, Kent et al., 2019; Cukurova, Luckin et al., 2019; Cukurova et al., 2020; Luckin y Cukurova, 2019).
El cerebro humano se ha caracterizado por adquirir conocimiento a través de su experiencia diaria en diferentes situaciones de la vida; puede, con base en conocimientos adquiridos, inferir posibles resultados con cierta incertidumbre. “Una red neuronal es un modelo de computación cuya estructura de capas se asemeja a la estructura interconectada de las neuronas en el cerebro, con capas de nodos conectados” (MathWorks, s. f., párr. 1), cuya función es aprender mediante el entrenamiento y procesamiento de datos de tal manera que puedan reconocer patrones de voz, imágenes, aproximar funciones, predecir eventos, entre otros, tal como lo afirman Kaviani y Sohn (2020); Lobo et al. (2018) y Piotrowski et al. (2020).
Una red neuronal artificial es un modelo matemático computacional que trata de emular el comportamiento de las neuronas del cerebro humano desarrollando un aprendizaje mediante experiencias. Está compuesta de unidades procesadoras interconectas unas con otras, capaz de reconocer patrones, clasificar datos y pronosticar eventos futuros con precisión y exactitud (Caianiello, 1968; Dreyfus, 2005; Eckmiller y Malsburg, 1989). En la Figura 1 se puede ver la arquitectura de una red neuronal con una capa de entrada, dos capas ocultas y una capa de salida.
Figura 1: Arquitectura típica de una red neuronal
Nota: Elaboración propia.
La estructura de una red neuronal, vista de una manera compleja, consta de cuatro elementos fundamentales. Poznyak et al. (2001) refieren que la estructura interna de la red está determinada por los pesos o sinapsis, estas conexiones pueden ser excitadoras o inhibidoras; un sumador, encargado de ponderar la suma de todas las entradas multiplicadas por las sinapsis; una función de activación no lineal y un umbral de exterior.
Para comprender el modelo de una neurona artificial es necesario comprender la estructura de las neuronas biológicas, las cuales se interconectan entre sí de forma paralela. Las neuronas biológicas son pequeñas células que habitan en nuestro sistema nervioso encargado de activar o inhibir la actividad eléctrica en el cerebro, la estructura de la neurona está constituida por las dendritas, el axón y el soma que cumplen la función de canal de entrada, canal de salida y el procesador respectivamente (van Essen y Glasser, 2018).
Partiendo de la estructura de una neurona biológica, podemos comprender la estructura de una neurona artificial, Rumelhart y McClelland (1986, como se citó en Elman, 1991) definen una neurona artificial como un dispositivo que a partir de un conjunto de datos de entrada puede generar una salida, cada neurona artificial consta de un conjunto de entradas (X1, X2,…..,Xt) y de pesos sinápticos ( ), una función de propagación (Uk) que realiza la suma ponderada del producto escalar del vector de entrada y el vector de pesos sinápticos, una función de activación y de salida, las cuales se implementan de acuerdo con las características del problema. La Figura 2 muestra el modelo no lineal de una neurona, las señales de entrada ingresan a la neurona, de esta manera se realiza la suma ponderada del producto escalar del vector de entrada y el vector de pesos sinápticos afectados por la función de activación.
Figura 2: Modelo no lineal de una neurona
Nota: Elaboración propia.
Tipos de redes neuronales
Conocer los distintos tipos de RNA permite al ente investigador obtener mejores resultados en su investigación dependiendo del número de capas y de neuronas con las que se elija trabajar, de tal manera que la red ayude a resolver problemas de alta complejidad con gran precisión. Tal como lo afirman Beer et al. (2020) y Serrano (2020), las redes neuronales artificiales, de acuerdo con su estructura, en el número de capas más comunes son: perceptrón de una capa o red neuronal de alimentación directa de una capa; perceptrón multicapa o red neuronal de alimentación directa de varias capas, redes de base radial, redes neuronales diferenciales, redes de Elman, redes de Hopfield.
En la actualidad, uno de los desafíos que afronta la universidad es brindar una educación basada en competencias, de tal manera que el estudiantado tenga la facultad de combinar conocimientos, habilidades y actitudes para dar solución a una situación problemática en un tiempo determinado. Diversos estudios (Acevedo Pierart y Rocha Pavés, 2011; Edel Navarro, 2003a, señalan que el logro de estas competencias se mide mediante los estándares de aprendizajes; en este sentido, el rendimiento académico es el sistema que mide, mediante la intervención de métodos cuantitativos y cualitativos, el logro de las competencias en el estudiantado. En este contexto, entiéndase como rendimiento académico la evaluación de las competencias expresada en notas mediante la escala vigesimal, las cuales se tomaron de la unidad de registros y archivos académicos de la UNIFSLB.
Diversos estudios han mostrado preocupación por conocer cuáles son los factores determinantes que intervienen en el logro de competencias del estudiantado en todos los niveles de educación. Así, “existen diferentes aspectos que se asocian al rendimiento académico, entre los que intervienen componentes tanto internos como externos al individuo. Pueden ser de orden social, cognitivo y emocional [clasificados] en tres categorías: determinantes personales, determinantes sociales y determinantes institucionales” (Garbanzo Vargas, 2007, p. 47). Dentro de los determinantes personales Salanova et al. (2005) sustentan que estos son capaces de influenciar en el logro y no logro de las competencias; podemos encontrar la motivación, la competencia cognitiva, el auto concepto académico, la autoeficacia percibida en el bienestar psicológico, el grado de satisfacción que se tiene al realizar las tareas académicas, la modalidad de ingreso a la universidad, la inteligencia, el sexo y la nota previa con la que se llega a la universidad, todos estos mencionados anteriormente tienen una influencia directa con el rendimiento académico del estudiantado. En su investigación, Alhadabi y Karpinski (2020) consideran como determinantes sociales las desigualdades socioculturales, el entorno familiar, el nivel educativo de la madre y del padre, las variables demográficas y el acceso que se tiene a internet y a distintos medios de comunicación dentro de la localidad. Finalmente, los determinantes institucionales engloban a la gestión académica y administrativa, tal como lo afirman Busebaia y John (2020) quienes consideran, en su investigación, como factores intervinientes a los servivios institucionales de apoyo: la infraestructura, el ambiente estudiantil, la asistencia a clases, la complejidad de los planes de estudio, el examen de admisión, el internet y otros; estos últimos conjuntamente con los determinantes personales y sociales influyen de manera positiva o negativa en el logro de competencias del estudiantado.
Esta investigación es de tipo cuantitativa, se utilizó la metodología CRIS-DM, la cual consta de seis fases. En la primera fase hemos realizado el plan del proyecto en el cual hemos identificado los objetivos de la investigación, en la segunda y tercera fase hemos recolectado, seleccionado y preparado los datos obtenidos de las encuestas utilizando el formulario de Google, los datos fueron normalizados en su totalidad. En la cuarta fase hemos construido la arquitectura de la red neuronal, cada modelo de RNA consistió de una capa oculta la cual fue implementada con un número de neuronas que variaba desde 2 hasta 50, las variables de entrada son 18 en su totalidad y corresponden a los determinantes personales (nueve), determinantes institucionales (seis) y determinantes sociales (tres); finalmente, un objetivo a predecir fue el promedio final del curso de Matemática II, el cual se obtuvo de la unidad de registros y archivos académicos de la UNIFSLB. En la quinta fase validamos el modelo, cada modelo se ejecutó 10 veces para cada número de neuronas de la capa oculta, finalmente en la sexta fase implementamos el modelo de red neuronal. Cabe precisar que, en general, estos modelos matemáticos computacionales evolucionan teniendo en cuenta las condiciones espacio-tiempo.
La UNIFSLB en la carrera profesional de Ingeniería Civil actualmente cuenta con tres promociones de ingresantes, de acuerdo con la base de datos de la unidad de registros y archivos académicos de la UNIFSLB en el ciclo 2019-I se registra el promedio final de 33 estudiantes en el curso de Matemática II, igualmente en el ciclo 2019-II se registra el promedio final de 33 estudiantes, de esta manera se contabiliza una población de 66 estudiantes con promedio final en el curso de Matemática II durante los semestres referidos. En esta investigación la encuesta aplicada al estudiantado de manera virtual se hizo llegar por correo institucional, grupos académicos de Wasap y, en su defecto, mediante llamadas telefónicas. Se obtuvo respuesta de 50 estudiantes que hacen un total del 76% de la población.
Para elaborar las preguntas de la encuesta, hemos realizado una búsqueda exhaustiva de artículos científicos en Scopus, diversos estudios (Garbanzo Vargas, 2007; Guzmán-Zamora y Gutiérrez-García, 2020; Pardo-Cueva et al., 2020; coinciden en que las variables independientes que intervienen en el rendimiento académico son componentes endógenos y exógenos que pueden ser de orden social, cognitivo y emocional clasificados en tres categorías: determinantes personales, determinantes socioculturales y determinantes institucionales. Teniendo en consideración estos aportes científicos, se elaboraron un total de 18 preguntas que fueron planteadas en la encuesta, luego se acudió a la unidad de registro y archivos académicos de la UNIFSLB para obtener la data de los promedios finales del estudiantado, quedando, de esta manera, una matriz de dimensiones 50x18 para la variable independiente y otra matriz de dimensiones 50x1 para la variable dependiente. Las 18 preguntas correspondientes a las variables de entrada están agrupadas de la siguiente manera:
a) Determinantes personales (nueve): ¿Cantidad de veces que necesitó matricularse en el curso de Matemática I, Física I y Dibujo de Ingeniería I para poder aprobarlo?, se eligieron estos cursos ya que son del primer ciclo y guardan una relación directa con el curso de matemática II, los dos primeros pertenecientes a las ciencias básicas y el tercero es un curso relacionado a la carrera de Ingeniería Civil. El estudiantado que necesita matricularse varias veces en el curso para poder aprobarlo puede significar que muestra ausencia de capacidades o falta de dedicación con estás asignaturas, lo cual podría repetirse en el curso de Matemática II. El rango de valores para estas variables va de desde el 1 hasta el 4. ¿Cuál es el promedio final que obtuvo al aprobar el curso de Matemática I, Física I y Dibujo de Ingeniería I?, estos cursos brindan al estudiantado los conocimientos necesarios para afrontar los cursos que continúan en el plan de estudios, el estudiantado que muestra tener altas calificaciones en estos cursos posiblemente cuenten con suficientes capacidades para afrontar con éxito el curso de Matemática II, análogamente sucede algo parecido con aquel estudiantado que obtiene calificaciones bajas en estos cursos. El rango de valores para estas variables varía desde 0 a 2, el cual comprende promedios finales desde 10,5 hasta 20, de esta manera los promedios finales comprendidos en el intervalo [10,5;13] se le asigna el valor de 0, los promedios finales comprendidos en el intervalo <13,16] se le asigna el valor de 1 y los promedios finales comprendidos en el intervalo <16,20] se le asigna el valor de 2. ¿Cuál es el promedio final con que culminó sus estudios secundarios en el área de Matemática?, el estudiantado con calificaciones altas en matemática durante la secundaria posiblemente cuenten con las capacidades necesarias para afrontar las carreras de ingeniería (Jones, 2004). ¿Mediante qué modalidad ingresó a la universidad?, cabe resaltar que en la UNIFSLB las modalidades de ingreso a la universidad son distintas, tenemos las vacantes ofertadas en el examen ordinario, el examen extraordinario y finalmente las vacantes ofertadas por el centro preuniversitario de la universidad. Los valores asignados para esta variable varían de 0 a 2, siendo 0 si el estudiantado ingresó mediante el examen ordinario, 1 si el estudiantado ingresó mediante el examen extraordinario y 2 si el estudiantado ingresó por medio del centro preuniversitario. ¿Cuál es su sexo?, todas las investigaciones relacionadas con el rendimiento académico consideran el sexo como una variable determinante, mediante esta variable sociodemográfica podemos evidenciar la inclinación del estudiantado a las letras o los números, su fascinación y dedicación por la teoría o la práctica (Álvarez Blanco et al., 2016; Cerda et al., 2019; Edel Navarro, 2003a, 2003b; Suardiaz-Muro et al., 2020; Torres Velázquez y Rodríguez Soriano, 2006). El rango de valores asignados para esta variable son 0 y 1, siendo 0 si el estudiantado pertenece al sexo masculino y 1 si el estudiantado pertenece al sexo femenino.
b) Determinantes institucionales (seis): ¿Ingeniería Civil fue la carrera que usted deseó estudiar?, ¿Cuándo usted aprobó el curso de Matemática II contaba con libros del curso ya sean físicos o virtuales?, ¿contaba con internet como medio de ayuda en proceso enseñanza aprendizaje?, ¿tenía en su domicilio un ambiente dedicado para sus labores universitarias?, estas variables son consideradas puesto que en la universidad se puede evidenciar estudiantado que tiene inclinación a las carreras de ingeniería, pero no necesariamente a la carrera de Ingeniería Civil (una de las limitaciones que presenta la universidad es la existencia de esta única carrera de ingeniería), de igual forma las herramientas que ofrece el internet hoy en un día le aportan un valor significativo al proceso de enseñanza-aprendizaje. Por otro lado, el estudiantado que cuenta en su domicilio con un ambiente dedicado exclusivamente para sus labores universitarias es posible que tenga mayor concentración y, por ende, un mejor aprovechamiento del tiempo dedicado a sus estudios (Criollo et al., 2017; Olascoaga, 2020). El valor asignado para estas variables son 0 y 1, 0 si su respuesta es afirmativa y 1 si su respuesta es negativa. Otra de las preguntas es: ¿Con qué frecuencia asistía a clases?, este factor es muy importante ya que se tiene estudiantado que posee carga familiar, y tienen la obligación de trabajar y estudiar a la vez, esto hace que aquel alumnado falte con frecuencia a recibir clases en las aulas de la universidad y dedique menos tiempo a sus estudios en relación con el estudiantado que no posee carga familiar. El rango de valores para esta variable varía de 0 a 2, es 0 si su respuesta es frecuentemente no asistía, 1 si su respuesta es algunas veces no asistía y 2 si su respuesta es siempre asistía a clases. ¿Cómo calificaba las estrategias didácticas del personal docente cuando usted aprobó el curso de Matemática II? Diversas investigaciones dan a conocer la relación directa que existe entre las estrategias didácticas que el personal docente emplea en el curso y el logro de competencias que su estudiantado alcanza al culminar la materia (González-García et al., 2019; Hernández, 2018; Mansilla Sepúlveda y Beltrán Véliz, 2013; El rango de valores para esta variable varía de 0 a 3, 0 si el estudiantado considera que las estrategias fueron deficientes, 1 si considera que las estrategias fueron regulares, 2 si considera que las estrategias fueron buenas y 3 si el estudiantado considera que las estrategias fueron muy buenas.
c) Determinantes sociales (tres): ¿Cuál es el nivel académico de la madre?, distintas investigaciones concluyen que el nivel académico de los padres y las madres tiene una influencia directa en el rendimiento académico del estudiantado en los distintos niveles de la educación, sin embargo, esta influencia es mayor cuando se toma en cuenta solamente a la madre (Murillo y Hernández-Castilla, 2020; Plasencia Vilchis et al., 2016). El rango de valores para esta variable varía de 0 a 3, es 0 si la madre posee solo primaria, 1 si posee solo secundaria, 2 si posee estudios de superior no universitario y 3 si posee estudios de superior universitario. ¿Etnia del estudiantado?, esta variable fue considerada puesto que la UNIFSLB alberga estudiantado originario y mestizo; existe una diferencia notable de la calidad de la educación brindada en la ciudad en comparación con la educación brindada en las comunidades nativas. El valor asignado para esta variable son 0 y 1, 0 si la educación que recibió el estudiantado proviene de la ciudad y 1 si la educación que recibió el estudiantado proviene de las comunidades nativas. ¿Frecuencia en el consumo de alcohol?, diversas investigaciones concluyen que el consumo frecuente de alcohol influye directamente en el rendimiento académico del estudiatnado (Leal-López et al., 2021; Marín Mayor et al., 2019; Martín-Montañez et al., 2011). El rango de valores para esta variable varía de 0 a 3, es 0 si el estudiantado no consume alcohol, 1 si consume en ocasiones lejanas, 2 si consume alcohol todos los fines de semana y 3 si el consumo de alcohol es diario.
Entrenamos la red neuronal artificial utilizando dos algoritmos de aprendizaje supervisado para comparar los resultados, el primer algoritmo fue Scaled Conjugate Gradient (SCG), diversas investigaciones muestran que el SCG es más rápido que el algoritmo de retropropagación estándar, el algoritmo de gradiente conjugado con búsqueda lineal y el algoritmo cuasi-Newton de Broyden-Fletcher-Goldfarb-Shanno (Møller, 1993), el segundo algoritmo fue Levenberg-Marquardt (LM), este algoritmo de retropropagación es a menudo el más rápido de toda la caja de herramientas de Matlab y se recomienda como un algoritmo de aprendizaje supervisado de primera elección (Hagan y Menhaj, 1994). Mediante el comando nnstart y la aplicación Fitting de Matlab se escogieron aleatoriamente los datos por los subconjuntos de entrenamiento, validación y prueba, del 100% de los datos en un primer momento asignamos el 65% de los datos para el entrenamiento, el 20% para la validación y el 15% para la prueba, de igual forma en un segundo momento asignamos el 70% de los datos para el entrenamiento, el 15% para la validación y el 15% para la prueba, en un tercer momento asignamos el 80% de los datos para el entrenamiento, el 10% para la validación y el 10% para la prueba, finalmente asignamos el 85% de los datos para el entrenamiento, el 10% para la validación y el 5% para la prueba, en cada momento se ejecutó 10 corridas para cada una de la capas utilizando los dos algoritmos de aprendizaje anteriormente mencionados. Se utilizó el error cuadrático medio (por sus siglas en inglés, MSE) y el coeficiente de correlación (R) para evaluar el ajuste de los modelos, siempre buscando que el MSE sea los más cercano a cero y el R sea los más cercano a uno, teniendo en cuenta que cuanto mayor es el R cuadrado mejor se ajusta el modelo a los datos. Las Ecuaciones (1 y 2) para calcular el MSE y el R cuadrado son las siguientes:
Donde n es el número de observaciones, yic es el i-ésimo valor calculado, yim es el i ésimo valor medido, finalmente ym es el valor medio de los valores calculados.
Los mejores resultados en la implementación de la red neuronal se obtuvieron al emplear el 85% de los datos para el entrenamiento (training), el 10% para la validación (validation) y el 5% para la prueba (test), se efectúo 10 corridas para cada algoritmo de aprendizaje, con 14 neuronas en la capa oculta para el Levenberg-Marquardt y 50 neuronas en la capa oculta para el Scaled Conjugate Gradient. La Tabla 1 detalla los valores obtenidos en el MSE y en el R de las redes neuronales con respecto a cada algoritmo de aprendizaje y al número de neuronas en la capa oculta (N° nco), la Figura 3 y la Figura 4 muestran los diagramas de las redes neuronales implementadas para cada algoritmo, la Figura 5 y la Figura 6 muestran el R-Training, R-Validation y el R-Test de ambos algoritmos.
Tabla 1: Análisis de los resultados
Nota: Elaboración propia.
Figura 3: Diagrama de la red neuronal- Levenberg-Marquardt
Nota: Elaboración propia.
Figura 4: Diagrama de la red neuronal- Scaled Conjugate Gradient
Nota: Elaboración propia.
Figura 5: R del Levenberg-Marquardt.
Nota: Elaboración propia.
Figura 6: R del Scaled Conjugate Gradient
Nota: Elaboración propia.
En la Tabla 1 se puede observar que, de los dos algoritmos, el Levenberg-Marquardt con 14 neuronas da mejores resultados en la predicción en menor tiempo tal como lo afirma Hagan y Menhaj (1994). Se puede observar: Training-R= 0.99994, Validation-R=0.87178, Test-R=0.95254, All-R=0.96723, Training-MSE= 0.00000389003, Validation-MSE=0.00264181, Test-MSE=0.0138162.
En el histograma de error se simboliza el entrenamiento de los datos, las barras verdes representan la validación de estos mismos y las barras rojas la prueba de los datos, en el caso del algoritmo Levenberg-Marquardt la mayoría de los errores se encuentra entre -0.1012 y 0.05506, se pueden observar un valor atípico en -0.1663 y en 0.0811, en el caso del algoritmo Scaled Conjugate Gradient la mayoría de los errores se encuentran ubicados entre -0.3857 y 0.05969, se puede observar un valor atípico en 0.5546. La Tabla 2 muestra que la red entrenada por medio del algoritmo Levenberg-Marquardt (LM) tiene una capacidad de predicción del 86%, y la red entrenada por medio del algoritmo Scaled Conjugate Gradient (SCG) tiene una capacidad de predicción del 70%.
Tabla 2: Pronóstico de promedios finales
Nota: Elaboración propia.
En el campo de la inteligencia artificial, las redes neuronales aplicadas en el ámbito educativo constituyen una herramienta muy poderosa en problemas de pronóstico; tal como se evidencia en esta investigación, predecir el rendimiento académico del estudiantado permite al personal docente tomar acciones adecuadas en la implementación de técnicas y estratégicas pedagógicas para lograr la excelencia académica de su estudiantado.
Los resultados obtenidos en esta investigación no deben ser tomados como válidos para universidades que presenten una similitud en su malla curricular, puesto que los determinantes personales, institucionales y sociales de la población no necesariamente son los mismo y deben ser considerados dentro del triángulo espacio, tiempo y sociedad; sin embargo, la metodología y las estrategias para la construcción del modelo son aplicables en cualquier contexto local, regional, nacional e internacional.
Para obtener un alto porcentaje de predicción es necesario construir una adecuada arquitectura de la red neuronal teniendo en cuenta el algoritmo de aprendizaje por utilizar y realizar una correcta selección de las variables con su respectiva codificación, una limitación en esta investigación es el tamaño de la muestra dado que la UNIFSLB cuenta solamente con dos promociones de estudiantado de la carrera de Ingeniería Civil que ya cursaron Matemática II; sin embargo, ha quedado demostrado que en un conjunto pequeño de datos utilizando el algoritmo Levenberg-Marquardt podemos obtener un alto porcentaje de aciertos en la predicción.
Declaración de contribuciones
Las personas autoras declaran que han contribuido en los siguientes roles: F. A. I. F. contribuyó con la escritura del artículo; la gestión del proceso investigativo; la obtención de fondos, recursos y apoyo tecnológico y el desarrollo de la investigación. D. L. C. S. contribuyó con la escritura del artículo; la gestión del proceso investigativo y el desarrollo de la investigación. R. O. E. U. contribuyó con la escritura del artículo; la obtención de fondos, recursos y apoyo tecnológico y el desarrollo de la investigación.
Acevedo Pierart, C. G. y Rocha Pavés, F. (2011). Estilos de aprendizaje, género y rendimiento académico. Revista de Estilos de Aprendizaje, 4(8), 71-84. https://doi.org/10.55777/rea.v4i8.937
Alhadabi, A. y Karpinski, A. C. (2020). Grit, self-efficacy, achievement orientation goals, and academic performance in University students. International Journal of Adolescence and Youth, 25(1), 519-535. https://doi.org/10.1080/02673843.2019.1679202
Álvarez Blanco, J., Lau Fernández, R., Pérez Lovelle, S. y Leyva Pérez, E. C. (2016). Predicción de resultados académicos de estudiantes de informática mediante el uso de redes neuronales. Ingeniare. Revista chilena de ingeniería, 24(4), 715-727. https://doi.org/10.4067/S0718-33052016000400015
Beer, M., Urenda, J., Kosheleva, O. y Kreinovich, V. (2020). Why spiking neural networks are efficient: A theorem. En M.-J. Lesot, S. Vieira, M. Z. Reformat, J. P. Carvalho, A. Wilbik, B. Bouchon-Meunier, y R. R. Yager (Eds.), Information processing and management of uncertainty in knowledge-based systems (pp. 59-69). Springer. https://doi.org/10.1007/978-3-030-50146-4_5
Busebaia, T. J. A. y John, B. (2020). Can flipped classroom enhance class engagement and academic performance among undergraduate pediatric nursing students? A mixed-methods study. Research and Practice in Technology Enhanced Learning, 15, 1-16. https://doi.org/10.1186/s41039-020-0124-1
Caianiello, E. R. (Ed.). (1968). Neural Networks. Springer-Verlag. https://doi.org/10.1007/978-3-642-87596-0
Cerda, G., Pérez, C., Elipe, P., Casas, J. A. y del Rey, R. (2019). Convivencia escolar y su relación con el rendimiento académico en alumnado de Educación Primaria. Revista de Psicodidáctica, 24(1), 46-52. https://doi.org/10.1016/j.psicod.2018.05.001
Çetinkaya, A. y Baykan, Ö. K. (2020). Prediction of middle school students’ programming talent using artificial neural networks. Engineering Science and Technology, an International Journal, 23(6), 1301-1307. https://doi.org/10.1016/j.jestch.2020.07.005
Cohen, J., Cohen, P., West, S. G. y Aiken, L. S. (2013). Applied multiple regression/correlation analysis for the behavioral sciences. Routledge.
Criollo, M., Romero, M. y Fontaines-Ruiz, T. (2017). Autoeficacia para el aprendizaje de la investigación en estudiantes universitarios. Psicología Educativa, 23(1), 63-72. https://doi.org/10.1016/j.pse.2016.09.002
Cukurova, M., Kent, C. y Luckin, R. (2019). Artificial intelligence and multimodal data in the service of human decision-making: A case study in debate tutoring. British Journal of Educational Technology, 50(6), 3032-3046. https://doi.org/10.1111/bjet.12829
Cukurova, M., Luckin, R. y Clark-Wilson, A. (2019). Creating the golden triangle of evidence-informed education technology with EDUCATE. British Journal of Educational Technology, 50(2), 490-504. Scopus. https://doi.org/10.1111/bjet.12727
Cukurova, M., Luckin, R. y Kent, C. (2020). Impact of an Artificial Intelligence Research Frame on the Perceived Credibility of Educational Research Evidence. International Journal of Artificial Intelligence in Education, 30(2), 205-235. https://doi.org/10.1007/s40593-019-00188-w
Dreyfus, G. (2005). Neural networks. Methodology and applications. Springer. https://doi.org/10.1007/3-540-28847-3
Eckmiller, R. y Malsburg, C. v d (Eds.). (1989). Neural computers. Springer-Verlag. https://doi.org/10.1007/978-3-642-83740-1
Edel Navarro, R. (2003a). El rendimiento académico: Concepto, investigación y desarrollo. Revista Iberoamericana sobre Calidad, Eficacia y Cambio en Educación, 1(2), 1-16. https://www.redalyc.org/articulo.oa?id=55110208
Edel Navarro, R. (2003b). Factores asociados al rendimiento académico. Revista Iberoamericana de Educación, 33(1), 1-20. https://doi.org/10.35362/rie3312872
Elman, J. L. (1991). Distributed representations, simple recurrent networks, and grammatical structure. Machine Learning, 7(2), 195-225. https://doi.org/10.1007/BF00114844
Garbanzo Vargas, G. M. (2007). Factores asociados al rendimiento académico en estudiantes universitarios, una reflexión desde la calidad de la educación superior pública. Revista Educación, 31(1), 43-63. https://doi.org/10.15517/revedu.v31i1.1252
González-García, N., Sánchez-García, A. B., Nieto-Librero, A. B. y Galindo-Villardón, M. P. (2019). Actitud y enfoques de aprendizaje en el estudio de la didáctica general. Una visión multivariante. Revista de Psicodidáctica, 24(2), 154-162. https://doi.org/10.1016/j.psicod.2019.02.002
Guzmán-Zamora, N. y Gutiérrez-García, R. A. (2020). School motivation: Academic goals, attributional styles and academic performance in middle education students. Archivos Venezolanos de Farmacologia y Terapeutica, 39(3), 290-295. Scopus. https://www.scopus.com/inward/record.uri?eid=2-s2.0-85088405992&partnerID=40&md5=da9d70fe3fb01c7e3f5922f24a13fba7
Hagan, M. T. y Menhaj, M. B. (1994). Training feedforward networks with the Marquardt algorithm. IEEE Transactions on Neural Networks, 5(6), 989-993. https://doi.org/10.1109/72.329697
Hernández, R. M. (2018). La estrategia didáctica frente a los estilos de aprendizaje en la educación superior. Educación Médica, 19(Suppl. 2), 227. https://doi.org/10.1016/j.edumed.2017.10.034
Jones, M. H. (2004). Information driven optimization search filter: Predicting tabu egions. En M. H. Jones, B. E. Tawney y S. D. Patek (Eds.), Proceedings of the 2004 IEEE Systems and Information Engineering Design Symposium (pp. 41-47). University of Virginia. http://ieeexplore.ieee.org/servlet/opac?punumber=9192
Kaviani, S. y Sohn, I. (2020). Influence of random topology in artificial neural networks: A survey. ICT Express, 6(2), 145-150. https://doi.org/10.1016/j.icte.2020.01.002
Leal-López, E., Sánchez-Queija, I., Rivera, F. y Moreno, C. (2021). Tendencias en el consumo de alcohol en adolescentes escolarizados en España (2010-2018). Gaceta Sanitaria, 35(1), 35-41. https://doi.org/10.1016/j.gaceta.2019.07.011
Lobo, J. L., Laña, I., del Ser, J., Bilbao, M. N. y Kasabov, N. (2018). Evolving Spiking Neural Networks for online learning over drifting data streams. Neural Networks, 108, 1-19. https://doi.org/10.1016/j.neunet.2018.07.014
Luckin, R. y Cukurova, M. (2019). Designing educational technologies in the age of AI: A learning sciences-driven approach. British Journal of Educational Technology, 50(6), 2824-2838. https://doi.org/10.1111/bjet.12861
Mansilla Sepúlveda, J. y Beltrán Véliz, J. B. (2013). Coherencia entre las estrategias didácticas y las creencias curriculares de los docentes de segundo ciclo, a partir de las actividades didácticas. Perfiles Educativos, 35(139), 25-39. https://doi.org/10.1016/S0185-2698(13)71807-5
Marín Mayor, M., Arias Horcajadas, F., López Trabada, J. R. y Rubio Valladolid, G. (2019). Trastornos por consumo de alcohol. Enfermedades psiquiátricas (II)Trastornos de la personalidad. Trastornos por uso de sustancias, 12(85), 4993-5003. https://doi.org/10.1016/j.med.2019.09.004
Martín-Montañez, E., Barón-López, F. J., Rubio Lamia, L. O., Pavía Molina, J., Miranda Páez, J. y Santos Amaya, I. M. (2011). Consumo de alcohol, tabaco, cannabis y otras sustancias psicoactivas en estudiantes de la Universidad de Málaga. Trastornos Adictivos, 13(4), 160-166. https://doi.org/10.1016/S1575-0973(11)70032-0
MathWorks. (s. f.). ¿Qué es una red neuronal? Tres cosas que es necesario saber. https://es.mathworks.com/discovery/neural-network.html
Maxwell, S. E., Delaney, H. D. y Kelley, K. (2017). Designing Experiments and Analyzing Data: A Model Comparison Perspective (3.a ed.). Routledge. https://doi.org/10.4324/9781315642956
Møller, M. F. (1993). A scaled conjugate gradient algorithm for fast supervised learning. Neural Networks, 6(4), 525-533. https://doi.org/10.1016/S0893-6080(05)80056-5
Murillo, F. J. y Hernández-Castilla, R. (2020). ¿La implicación de las familias influye en el rendimiento? Un estudio en educación primaria en América Latina. Revista de Psicodidáctica, 25(1), 13-22. https://doi.org/10.1016/j.psicod.2019.10.002
Olascoaga, A. C. (2020). Curso de docencia para residentes: Evaluación de un programa. Educación Médica, 21(3), 187-192. https://doi.org/10.1016/j.edumed.2018.07.010
Pardo-Cueva, M., Chamba-Rueda, L. M., Gómez, Á. H. y Jaramillo-Campoverde, B. G. (2020). Ict and academic performance in higher education: A relationship enhanced by the use of the padlet. RISTI - Revista Iberica de Sistemas e Tecnologias de Informacao, 2020(E28), 934-944. https://www.scopus.com/inward/record.uri?eid=2-s2.0-85081007798&partnerID=40&md5=110df3aaf4db20c75bff3c423bd52323
Pinto, P. M., Fernández, Y. O. y Cabezas, N. G. (2020). Intercultural education in the process of educational humanization of college students: Influences on academic achievement. Interciencia, 45(4), 201-208. https://www.scopus.com/inward/record.uri?eid=2-s2.0-85085116052&partnerID=40&md5=d5452e892f20e1b42dfe7f487dd4ba51
Piotrowski, A. P., Napiorkowski, J. J. y Piotrowska, A. E. (2020). Impact of deep learning-based dropout on shallow neural networks applied to stream temperature modelling. Earth-Science Reviews, 201, 1-24. https://doi.org/10.1016/j.earscirev.2019.103076
Plasencia Vilchis, M. L., Eguiluz Romo, L. de L., y Osorio Guzmán, M. (2016). Relación entre la dinámica familiar y las fortalezas humanas. Journal of Behavior, Health & Social Issues, 8(2), 1-8. https://www.sciencedirect.com/science/article/pii/S200707801730010X#:~:text=Los%20resultados%20se%C3%B1alan%20que%20las,el%20conocimiento%2C%20optimismo%2Fesperanza%2C
Poznyak, A., Sanchez, E. N. y Yu, W. (2001). Differential neural networks for robust nonlinear contro. Identification, state estimation and trajectory trackingl. World Scientific. https://doi.org/10.1142/4703
Salanova, M., Cifre, E., Grau, R. M., Llorens, S. y Martínez, I. M. (2005). Antecedentes de la autoeficacia en profesores y estudiantes universitarios: Un modelo causal. Revista de Psicología del Trabajo y de las Organizaciones, 21(1-2), 159-176. https://www.redalyc.org/pdf/2313/231317039010.pdf
Sarle, W. S. (1994). Neural networks and statistical models. Actas de la Nineteenth Annual SAS Users Group International Conference. https://people.orie.cornell.edu/davidr/or474/nn_sas.pdf
Serrano, W. (2020). The random neural network in price predictions. En I. Maglogiannis, L. Iliadis y E. Pimenidis (Eds.), Artificial intelligence applications and innovations (pp. 303-314). Springer. https://doi.org/10.1007/978-3-030-49161-1_26
Suardiaz-Muro, M., Morante-Ruiz, M., Ortega-Moreno, M., Ruiz, M. A., Martín-Plasencia, P. y Vela-Bueno, A. (2020). Sueño y rendimiento académico en estudiantes universitarios: Revisión sistemática. Revista de neurologia, 71(2), 43-53. Scopus. https://doi.org/10.33588/rn.7102.2020015
Torres Velázquez, L. E., y Rodríguez Soriano, N. Y. (2006). Rendimiento académico y contexto familiar en estudiantes universitarios. Enseñanza e Investigación en Psicología, 11(2), 255-270. https://www.redalyc.org/articulo.oa?id=29211204
Urrutia-Aguilar, M. E. y Guevara-Guzmán, R. (2013). Estrategias docentes en el primer año de la carrera de Médico Cirujano y nivel de aprovechamiento académico. Investigación en Educación Médica, 2(6), 77-81. https://doi.org/10.1016/S2007-5057(13)72690-5
Van Essen, D. C., y Glasser, M. F. (2018). Parcellating cerebral cortex: How invasive animal studies inform noninvasive mapmaking in humans. Neuron, 99(4), 640-663. https://doi.org/10.1016/j.neuron.2018.07.002