Lenguas en Internet

29 junio 2008 18:18

Periódicamente recibo preguntas sobre la situación de las lenguas en la Red. La respuesta no es muy sencilla, porque nadie, ni siquiera los buscadores más usados, controla todas las páginas estáticas que hay, por no hablar de las páginas dinámicas (que se generan en ciertas condiciones), ni de la llamada Internet Oculta…

Pero bueno: en lo que respecta a las lenguas hijas del latín (romaces o neolatinas) su relación con el inglés, están los datos del estudio que lleva a caboFunredes desde hace años.

Con metodología ignota, pero datos más abarcadores está Internet World Stats.

Una forma indirecta de ver la presencia de lenguas es saber las herramientas lingüisticas (correctores, diccionarios de sinónimos…) de que dispone Microsoft Office: son una cincuentena.

Y por último, Google dispone de interfaces en unas 220 lenguas y variantes de escritura (lo que suelen representar capacidades de búsqueda con refinamientos lingüísticos en las mismas).

Etiquetas:

2 comentarios

José Antonio Millán dijo...

Añado: el escaneo de libros de Google Libros y posterior OCR tiene en cuenta las peculiaridades de 430 lenguas diferentes (History of Google Book Search, véase el año 2003).

10 noviembre 2008 11:19
José Antonio Millán dijo...

Aunque por el momento tenga libros en más de cien lenguas

10 noviembre 2008 13:03