Revista Universidad en Diálogo • Vol. 10, N.° 1, Enero-Junio, 2020, 41-56 • ISSN 2215-2849 • EISSN: 2215-4752
Url: http://www.revistas.una.ac.cr/index.php/dialogo/index
Correo electrónico: universidadendialogo@una.cr
DOI: https://doi.org/10.15359/udre.10-1.3
Un análisis en R del grupo de Facebook del Proyecto Formación de Formadores en Robótica para zonas vulnerables en Costa Rica
An analysis in R of the Facebook group of the Training of Trainers in robotics for vulnerable areas project in Costa Rica
Richard Arce Vargas
Universidad Nacional
Costa Rica
richard.arce.vargas@gmail.com
Irene Hernández Ruiz
Universidad Nacional
Costa Rica
irene.hernandez.ruiz@una.cr
Pedro Fonseca Solano
Universidad Nacional
Costa Rica
pedro.fonseca.solano@una.cr
Recibido: 24/05/2019 Aceptado: 20/09/2019
Resumen. El presente documento da a conocer un análisis de datos haciendo uso del lenguaje R respecto a la información publicada en el grupo cerrado de un proyecto de extensión universitaria de la Universidad Nacional. En este grupo se presentan las actividades que realizan los docentes capacitados en el proyecto con sus estudiantes y las actividades organizadas por los encargados del proyecto. Para el análisis correspondiente se presenta la metodología utilizada, así como los principales resultados que se han obtenido en el periodo del 2016 al 2018. En el estudio se seleccionaron las variables género y tipo de publicación.
Palabras clave: R, grupo cerrado, redes sociales, algoritmo, estadística, parámetro, librería o package.
Abstract. This paper discloses an analysis of data making use of the R language about the information published in a closed group of a university extension project at the National University of Costa Rica. This group presents the activities carried out by the teachers trained in the project and their students, and the activities organized by the project managers. For the corresponding analysis, the methodology used is described, as well as the major results obtained from 2016 to 2018. The study selected the variables of gender and type of publication.
Keywords: R, closed groups, social networks, algorithms, statistics, parameters, libraries, or packages.
Introducción
Las redes sociales son sitios de Internet formados por comunidades de individuos con intereses o actividades en común (como amistad, parentesco, trabajo) y que permiten el contacto entre estos, de manera que se puedan comunicar e intercambiar información (Concepto.de, 2018).
El uso de redes sociales muestra que se pueden utilizar diferentes recursos para la creación de blogs, videos y páginas web, además de desarrollar sentimientos de competencia; por otro lado, también sirve para reforzar temas como la educación sexual, la promoción y la prevención de la salud, el apoyo en logros académicos (Arab y Díaz, 2015).
Otro punto importante es cómo las redes se han convertido en un canal de comunicación en la vida de todos.
Al referirnos a estas plataformas tecnológicas como redes sociales, ponemos el acento en su dimensión relacional, que permite a los usuarios mantener el contacto directo. Es normal que todas las redes sociales se presenten como canales de comunicación, cuya finalidad básica es contribuir a ampliar las comunidades entre ciudadanos y proporcionarles canales para la expresión y la comunicación (Enguix, 2017).
Las nuevas plataformas como las redes sociales han servido como herramienta de difusión del conocimiento, además de ser campos de investigación que constantemente crecen (Rovira, 2016).
Además, con el avance de los tiempos, la tecnología ha hecho que los vínculos interpersonales evolucionen y, a su vez, su dinámica. La expansión de las redes sociales ha ido cambiando el paradigma de la comunicación fundamental de los jóvenes (Lourdes, 2016). Tanto así que inclusive ahora muchos jóvenes solo conocen personas por redes sociales y la parte del contacto físico llega a ser una etapa posterior, luego de la interacción en una red.
Facebook es un ejemplo de tecnología Web 2.0 que tiene un enorme potencial en el campo de la educación, aunque no fue creado para construir o manejar experiencias de aprendizaje (Cain y Policastri, 2011).
Panckhurst y Marsh (2011) señalan que, si se comparan algunas redes sociales con la de mayor demanda en la actualidad, Facebook es la única que cumple con los requisitos para crear grupos que son aceptados por la comunidad de usuarios, además de que se adapta a las necesidades de un sector específico, por ejemplo, el educativo.
Componentes teóricos de la experiencia
• Concepto de R
R es un ambiente de programación formado por un conjunto de herramientas muy flexibles que pueden ampliarse fácilmente mediante paquetes, librerías o definiendo nuestras propias funciones. Además, es gratuito y de código abierto, un Open Source, parte del proyecto GNU, como Linux o Mozilla Firefox (Ferrero, 2018).
• La importancia del análisis de datos
La revolución de los datos actual no es impulsada exclusivamente por la enorme y creciente cantidad de datos; es alimentada por tecnologías fundamentales que cambian la forma en que reunimos, almacenamos, analizamos y transformamos los datos. Juntos estos factores de impulso nos permiten lograr percepciones claras y poderosas desde la profundidad de los datos y así extraer nuevos conocimientos, descubrir nuevas conexiones y realizar nuevas predicciones (The Software Alliance, 2018).
• Descripción del proyecto
El Proyecto Formación de Formadores en Robótica para Colegios en Áreas Vulnerables en Costa Rica inició en el año 2015 y busca la capacitación de profesores de secundaria en el área de Robótica Educativa para que ellos capaciten a sus estudiantes en esta área. El mismo se desarrolla de forma conjunta entre el Instituto Costarricense sobre Drogas y el Ministerio de Educación de Costa Rica, el cual ha logrado capacitar desde el 2016 a setenta y dos docentes del Gran Área Metropolitana, realizando hasta el momento un seguimiento a esta población, para lo cual se trabajó con tres grupos focales con los docentes, donde ellos presentaron los trabajos realizados con sus estudiantes, entre los cuales se destacan los talleres en las bibliotecas, los trabajos en ferias científicas y las visitas/giras a la Escuela de Informática de la Universidad Nacional (Fonseca y Hernández, 2017a).
Uno de los elementos más importantes que ha permitido dar seguimiento a este proyecto ha sido la creación de un grupo cerrado en Facebook llamado: Formación de Formadores, en el cual participan los docentes capacitados por el proyecto, los encargados de los proyectos y estudiantes asistentes.
Metodología
El presente trabajo presenta el análisis realizado con R sobre el comportamiento de las variables género y tipo de publicación (fotos, videos, links), con el fin de conocer el comportamiento de los docentes en la red social de Facebook. Para ello se procede a explicar el grupo a analizar, las herramientas utilizadas y el proceso realizado para el análisis de los datos.
A. Descripción del grupo:
En este grupo los docentes publican las actividades que han realizado con sus estudiantes, entre las cuales se destacan ferias educativas, talleres en los colegios con la construcción de modelos de robots (FiveMinute, seguidor de líneas, justas medievales) (Fonseca y Hernández, 2017a). Hasta este momento cuenta con 288 publicaciones en total.
Durante las lecciones del curso de formación a docentes se utilizaron diferentes modelos de robots, haciendo uso de equipo LEGO EV3.1 Este kit de piezas LEGO permite la construcción de diferentes modelos de robots. Además, ofrece un lenguaje gráfico para programar modelos de robots construidos. Esto mediante un conjunto de recursos gráficos (bloques) que permiten incorporar los conceptos y las estructuras de programación de una manera muy intuitiva (Fonseca y Hernández, 2017b).
Lego Digital Designer (LDD) es una herramienta de Lego Group que, debido a la flexibilidad, permite el acceso a todas las piezas de LEGO. Esta herramienta es sugerida por LEGO para que las personas que no tienen acceso al kit físico puedan crear cualquier modelo LEGO (Fonseca y Hernández, 2017b).
A continuación, en la figura 1 se presenta la ilustración de un modelo de robot construido en el proyecto.
En la figura 2 se encuentra una ilustración del grupo cerrado de Facebook en el que se ha trabajado.
Para participar en el grupo cerrado se decidió aplicar pautas para poder interactuar correctamente en la red social, entre las cuales se pueden mencionar las siguientes:
1. Aunque no es una obligación participar en el grupo de Facebook, es muy importante que todos los participantes puedan crear su cuenta en Facebook, porque la riqueza del grupo radica en compartir los logros alcanzados y los problemas.
2. El lenguaje a utilizar será formal y se tratará de explicar de la mejor forma posible las ideas.
3. El grupo se utilizará para publicar: fotografías, videos, dudas y aportes para la mejora del curso.
4. Existirá un único administrador del grupo, quién será el facilitador del curso.
5. El grupo únicamente permitirá la incorporación de docentes del proyecto o funcionarios de las instituciones anteriores que forman parte del proyecto.
6. No se permitirá el ataque a ningún miembro del grupo, y en caso de presentarse, el administrador tomará las medidas correspondientes.
7. El grupo será uno de los medios por los cuales los facilitadores del curso se comunicarán con sus participantes (de aquí la importancia de que todos tengan cuenta en la red).
De esta manera se construyó el grupo de la red social Formación de Formadores, logrando entonces obtener volúmenes de datos sobre los resultados obtenidos por los docentes.
Para dar seguimiento a la información recolectada, se llevó un registro manual en una hoja electrónica, donde se registró cada publicación. En este registro se anotó la persona que realizó la publicación, el tipo de publicación y la fecha de publicación. Este registro se inició desde el año 2016 y fue creado como una hoja de cálculo en la plataforma de Google Drive. Este registro manual fue estrictamente necesario, ya que para el éxito del proyecto es necesario contar con el seguimiento de los docentes. Y por las diversas ubicaciones geográficas, desplazarse a todas las zonas se vuelve complejo por las dinámicas de las instituciones.
B. Herramientas utilizadas:
A continuación, se presentan las herramientas utilizadas para el desarrollo de este trabajo:
1. R: Es un entorno de software libre para computación estadística y gráficos. (R Foundation, 2018)
2. RTools: Es una colección de recursos que nos permite tener actualizadas nuestras herramientas de R, ya que es posible que con las actualizaciones de R algunas funciones queden obsoletas (R Foundation, 2018).
3. Rstudio: Es un IDE para el manejo de R, este software es open source (RStudio, 2019).
4. Packages:
a. dplyr: Es una gramática de manipulación de datos que proporciona un conjunto coherente de verbos que ayudan a resolver los problemas de conjuntos de datos más comunes (Tidyverse, 2019).
b. factoextra: Facilita la extracción y visualización de la salida del análisis exploratorio de datos multivariados (Datanovia, 2017).
c. factoMineR: Análisis de exploración de datos con multivariable (Lê, Josse y Husson, 2008)
C. Análisis de datos y resultados:
1. Para este apartado, se contó con la documentación de las entradas de publicaciones de los usuarios del grupo cerrado del proyecto. Para un total de 288; los datos ingresados fueron: colegio o encargado, fecha, video, fotos, link, hombre y mujer.
2. La recolección de los datos se realizó de manera manual y se trabajó en una hoja de cálculo, registrando con una x los campos de tipo de publicación (videos, foto, link) y género.
3. Posteriormente, la hoja de cálculo se pasó a una tabla en R, haciendo uso de la siguiente instrucción:
4. Luego se dividió la tabla en dos separadas por género, conservando las mismas variables de la hoja de cálculo, para ello se utilizaron los siguientes comandos en R.
5. Debido a que se buscaba un análisis de los datos de los participantes, se decidió eliminar los registros de publicaciones de los dos administradores del grupo. Para ellos hacemos un filtro, quitando sus nombres.
6. Los resultados de las instrucciones anteriores permitieron obtener los siguientes resultados:
Hombres= setenta y seis publicaciones
Mujeres = noventa publicaciones
7. Generación de arrays haciendo uso de la instrucción “table” para obtener la frecuencia del tipo de publicación realizada por cada uno de los géneros.
A continuación, se presenta la instrucción utilizada para generar la tabla de hombres.
La misma instrucción se utilizó para generar la información de las mujeres.
En las tablas anteriores se puede observar que, sin importar el tipo de publicación, la cantidad de publicaciones que realizaron las mujeres fue mayor que la de los hombres.
8. Uso de una estructura para graficar
Para el análisis de los datos, se utilizó la instrucción “data frame” para graficar la información anterior.
La figura 3 nos muestra de una forma más clara las relaciones que tienen los tipos de publicación realizados con el género con base en la cantidad de publicaciones. Encontrando de esta manera que las que publican más son las mujeres.
9. Uso de PCA (Análisis de los componentes principales)
PCA es una técnica utilizada para describir un conjunto de datos en términos de nuevas variables (“componentes”) no correlacionadas. Los componentes se ordenan por la cantidad de varianza original que describen, por lo que la técnica es útil para reducir la dimensionalidad de un conjunto de datos (Smith, 2002). Para aplicar este tipo de análisis se trabajó con las librerías: dplyr, factoextra, factoMineR.
• Creación de un filtro en los datos para obtener cuáles fueron las publicaciones por género y el tipo de la publicación.
• Para obtener cada uno de los datos, se utilizaron todos los tipos de publicación.
• Generando entonces tres tablas “f”, “v”, “l”, que corresponden a publicaciones de fotos por género, videos por género y links por género. Las mismas se renombraron y se formó una sola tabla.
• Debido al tipo de variables fue necesaria una transformación del tipo de variables a valores numéricos, para poder utilizar el algoritmo de PCA, además para realizar una transformación se debe hacer en un contexto de grupo, para ello se trabajó de la siguiente forma:
Como resultado de las instrucciones anteriores, se obtuvo una matriz binaria para ser analizada con el algoritmo.
• Con la información anterior, se procede a aplicar el algoritmo PCA en R, el algoritmo utilizado recibe tres parámetros (la matriz binaria, condición si se desea escalar los datos y si queremos que nos genere un grafo). Nosotros decidimos escalar los datos y que no nos genere el grafo (ya que no nos aportaba información relevante).
• El resultado de realizar el algoritmo PCA se guardará en una variable llama “res”, para luego ser utilizada.
• Posteriormente, para visualizar mejor los datos, se utiliza la instrucción “theme”, para darle un estilo personalizado, por ejemplo theme_grey crea un tema gris, sin embargo, queremos combinarlo con otro más personalizado, por eso se suma con otro tema, el otro tema con el atributo panel.border = element_rect(fill = NA,color = “black”) crea un elemento rectangular vacío y con un borde negro, y al título le colocamos un ajuste con la instrucción plot.title = element_text(hjust = 0.5), con la suma de estos dos temas tenemos que será un tema gris con borde negro, con el título ajustado al centro.
• Para graficar los datos obtenidos por la función PCA y que fueron guardados en la variable res se utiliza la función fviz_pca_biplot, la cual recibe como parámetros res que son nuestros datos un color para las variables representado por col.var = “#2E9FDF”, que es color azulado, un color para los individuos representado por col.ind = “#696969”, que es color griseado, también un tema donde se utiliza ggtheme = mi.tema., además los parámetros select.var y select.ind se refieren a las variables e individuos, por lo cual list(cos2 = 0.1) indica que se graficarán las variables y los individuos que tienen un valor mayor a 0.1 (se refiere a los valores que se almacenan en la variable res).
Con la instrucción anterior, nos permite generar el siguiente gráfico.
Con este gráfico se puede analizar las relaciones que existen entre las variables. La acumulación de puntos representa las publicaciones, hombres-fotos, hombres-videos, hombres-links, mujeres-fotos, mujeres-videos, mujeres-links.
La distancia entre dos variables representa qué tan relacionadas están, por ejemplo, la variable fotos sí está más cerca de hombre.si que de mujere.si, por lo cual nos indica que las fotos son el punto fuerte de los hombres. Si queremos observar el punto fuerte de las mujeres vemos cómo la variable links.si está más cerca, por lo cual se considera que los links son el punto fuerte de las mujeres.
A pesar de que ya teníamos un gráfico que nos decía que las mujeres publicaban más en general, con este gráfico se pueden sacar conclusiones si se analizan las relaciones entre todas las variables.
Con el gráfico anterior se puede concluir que en el grupo Facebook se tiene como preferencia realizar publicaciones de fotos y videos, pero se deja de lado la publicación de links, por lo cual podemos decir que los docentes participantes del mismo prefieren dar a conocer sus resultados por medio de estos dos tipos de publicaciones.
Al realizar el análisis de publicación por género, podemos concluir que a nivel general las mujeres tienen más iniciativa de participación en su trabajo que los hombres. Porque los links nos ayudan a compartir información importante de páginas, artículos y revistas, por lo cual hubo un esfuerzo propio del formador de mejorar su trabajo mediante la búsqueda de información.
Los hombres realizan más publicaciones del tipo de fotografía que de videos y links. Esto lo podemos comprobar porque la distancia entre las fotos y la variable hombre es menor que la distancia entre la variable hombre y los videos y los links.
Conclusiones
• En el grupo cerrado de Facebook del proyecto, las mujeres tienen mayor participación que los hombres en todos los tipos de publicación realizados.
• El dar un seguimiento a las actividades en un proyecto de extensión universitaria es primordial contar con los últimos datos necesarios para conocer el comportamiento del grupo y de seguir motivando a los profesores a participar activamente dentro de los equipos de trabajo.
• Por otra parte, contar con datos de este tipo permite comprender cuál es la preferencia de publicación de los docentes y generar con ello una mayor motivación dentro de los grupos de trabajo. Y más bien trabajar acorde a lo que a ellos les gusta más.
• Una de las ventajas del lenguaje R es que se pueden utilizar diferentes instrucciones, ya sean de programación o estadística para obtener resultados específicos. Y las pocas instrucciones para llevar acabo estos datos son muy útiles para el análisis rápido de la información.
• El uso de las herramientas de código abierto y software libre ayudan a realizar análisis estadísticos de una manera sencilla y rápida.
• A pesar de que actualmente el lenguaje R es mundialmente conocido y aprobado por la comunidad científica, cabe destacar que puede ser usado para investigaciones pequeñas como esta y no necesariamente investigaciones complejas.
• Realizar análisis estadísticos nos da la posibilidad de conocer debilidades y fortalezas para que, posteriormente, se pueda trabajar en los puntos débiles y mantener los puntos fuertes.
• Finalmente, el poder hacer uso de datos reales sobre información de un proyecto de extensión y poder enlazarlo con PCA genera una gran motivación a los investigadores, ya que se permite analizar información de resultados de los docentes en el área de la robótica educativa y haciendo uso de paquetes computacionales lograr el análisis de los datos.
Referencias bibliográficas
Arab, E. y Díaz, A. (2015). Impacto de las redes sociales e Internet en la adolescencia: aspectos positivos y negativos. Revista Clínica Las Condes, 26(1), 7-13. https://analisi.cat/article/view/3090
Cain, J. y Policastri, A. (2011). Using Facebook as an Informal Learning Environment. American Journal of Pharmaceutical Education, 75(10), Article 207
Concepto.de. (2018). ¿Qué es red social? https://concepto.de/redes-sociales.
Datanovia. (2017). Factoextra: Extract and Visualize the Results of Multivariate Data Analyses. https://rpkgs.datanovia.com/factoextra/index.html
Enguix, O. (2017). Impacto político e informativo de las redes sociales, esferas de actuación y comparación con los medios. Alabe 13(71-86). http://revistaalabe.com/index/alabe/article/view/344/230
Ferrero, R. (2018). ¿Qué es R Software? https://www.maximaformacion.es/blog-dat/que-es-r-software/
Fonseca, P. y Hernández, I. (2017a). Formación de Formadores en Robótica para Colegios en Áreas Vulnerables de Costa Rica. Uso de las TIC para Ayudar a los Jóvenes Costarricenses a Evitar el Consumo de Drogas. XLIII Conferencia Latinoamericana de Computación.
Fonseca, P. y Hernández, I. (2017b). Modelo de robot educativo en dos ambientes de construcción. Congreso Colombiano de Computación 12CCC, celebrado del 19 al 22 de setiembre del 2017, en la Universidad Autónoma de Occidente, en la ciudad de Cali, Colombia.
Lê, S., Josse, J. y Husson, F. (2008). FactoMineR: An R Package for Multivariate Analysis. Journal of Statistical Software, 25(1), 1-18.
Lourdes, M. (2016). Los vínculos interpersonales en las redes sociales. Nuevos modos de comunicación en el marco de la Universidad Nacional de San Luis (UNSL), Argentina. Espacio Abierto, 25(4,)193-201. https://www.redalyc.org/jatsRepo/122/12249087015/html/index.html
Panckhurst, R. y Marsh, D. (2011). Utilización de redes sociales para la práctica pedagógica en la enseñanza superior impartida en Francia: perspectivas del educador y del estudiante. Revista de Universidad y Sociedad del Conocimiento, 233-252.
R Foundation. (2018a). Building R for Windows. https://cran.r-project.org/bin/windows/Rtools/
R Foundation. (2018b). R: The R Project for Statistical Computing. https://www.r-project.org
Rovira, J. (2016). Redes sociales en la universidad: profesionales, académicas y de lectura. Álabe, 13, 1-18. revistaalabe.com/index/alabe/article/download/344/230
Rstudio.com. (2019). RStudio. https://www.rstudio.com/
Smith, L. (2002). A tutorial on Principal Components Analysis. http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf
The LEGO Group. (s. f.). 7190 Billund: LEGO.com. Dinamarca. http://www.lego.com/
The Software Alliance. (2018) ¿Por qué son tan importantes los datos? https://data.bsa.org/wp-content/uploads/2015/10/BSADataStudy_es.pdf
Tidyverse. (2019). A Grammar of Data Manipulation. https://dplyr.tidyverse.org/
1 Página web de LEGO: https://www.lego.com/