Los números de las letras

30 octubre 2007 11:11


Amazon ha iniciado otra explotación de la digitalización de los libros que han entrado en su programa Look Inside: las estadísticas del texto. Como vemos en el libro de ejemplo del enlace anterior, Amazon compara la legibilidad, complejidad y número de caracteres de esta obra o bien con la generalidad de los libros de los que tiene estadísticas, o bien con los de un determinado género. En el ejemplo he escogido libros de la misma temática.

Los algoritmos que miden la legibilidad y la complejidad existen para el inglés desde hace años: miden la longitud de palabras en caracteres, de las frases y párrafos en palabras, detectan y miden la subordinación, y cosas por el estilo. No estoy tan seguro de que haya un consenso sobre estos parámetros para el español…

Además, Amazon proporciona otras estadísticas, autocatalogadas como de diversión (fun), como “palabras por dólar” y “palabras por onza” (unidad de peso). Por ejemplo, el libro en cuestión sale a 6.500 palabras por dólar. No está mal… ¿no?

Otro útil servicio son las concordancias (relación de los contextos en los que aparece una determinada palabra) para los términos más frecuentes, a las que se accede en forma de “nube de tags” (relación alfabética de conceptos en la que el tamaño de la letra es proporcional a su abundancia). En el ejemplo, de un libro sobre una epidemia en Londres, no extrañará ver que predomina la palabra cholera. Normalmente las “palabras vacías” (como artículos), que son muy abundantes, no se reflejan en estas estadísticas.

Vía Literary Style by the Numbers (gracias, Berta).

Etiquetas: , , , ,

Un comentario

Silvia Senz dijo...

Existen varias adaptaciones de los índices de comprensibilidad de Flesh, especialmente reseñable (y disponible en bibliotecas universitarias) el de Pazos. Aquí se detallan:http://legibilidad.com/home/acercade.html

30 octubre 2007 23:10