Variación del índice de niebla usando un corpus obtenido a partir de los libros digitalizados por google
Resumen
En lingüística, principalmente en el idioma inglés, se usa el Índice de Niebla de Gunning para determinar la legibilidad de un texto. El índice estima los años de educación formal necesarios para comprenderel texto en una primera lectura. Un Índice de 11 años apunta a una persona con el colegio finalizado, (Gunning, 1973). Analizamos en esta investigación la variación del Índice al cambiar la forma de obtener uno de los parámetros. En la fórmula original se consideran “palabras complejas” las que tienen tres o más sílabas. En su lugar utilizamos “palabras desconocidas” que son aquellas cuyo uso es poco familiar, según un corpus construido durante la investigación, partiendo de millones de libros digitalizados por Google y la Universidad de Harvard. Aunque la variación de los resultados dependerá del valor asignado para determinar
si una palabra es desconocida la investigación es pionera en el uso de un corpus para calcular el Índice de Niebla.
Descargas
Publicado
Número
Sección
Licencia
Los autores que publican en esta revista están de acuerdo con los siguientes términos:
1. Los autores garantizan a la revista el derecho de ser la primera publicación del trabajo al igual que licenciado bajo una Creative Commons Attribution License que permite a otros compartir el trabajo con un reconocimiento de la autoría del trabajo y la publicación inicial en esta revista.
2. Los autores pueden establecer por separado acuerdos adicionales para la distribución no exclusiva de la versión de la obra publicada en la revista (por ejemplo, situarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en esta revista.
3. Los autores han afirmado poseer todos los permisos para usar los recursos que utilizaron en el artículo (imágenes, tablas, entre otros) y asumen la responsabilidad total por daños a terceros.
4. Las opiniones expresadas en el artículo son responsabilidad de los autores y no necesariamente representan la opinión de los editores ni de la Universidad Nacional.
Revista Uniciencia y todas sus producciones se encuentran bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivadas 4.0 Unported.
No existe costo por acceso, revisión de propuestas ni publicación para autores y lectores.