29 junio 2008

Lenguas en Internet

Periódicamente recibo preguntas sobre la situación de las lenguas en la Red. La respuesta no es muy sencilla, porque nadie, ni siquiera los buscadores más usados, controla todas las páginas estáticas que hay, por no hablar de las páginas dinámicas (que se generan en ciertas condiciones), ni de la llamada Internet Oculta...

Pero bueno: en lo que respecta a las lenguas hijas del latín (romaces o neolatinas) su relación con el inglés, están los datos del estudio que lleva a caboFunredes desde hace años.

Con metodología ignota, pero datos más abarcadores está Internet World Stats.

Una forma indirecta de ver la presencia de lenguas es saber las herramientas lingüisticas (correctores, diccionarios de sinónimos...) de que dispone Microsoft Office: son una cincuentena.

Y por último, Google dispone de interfaces en unas 220 lenguas y variantes de escritura (lo que suelen representar capacidades de búsqueda con refinamientos lingüísticos en las mismas).

Etiquetas:

2 Comments:

Blogger José Antonio Millán ha dicho...

Añado: el escaneo de libros de Google Libros y posterior OCR tiene en cuenta las peculiaridades de 430 lenguas diferentes (History of Google Book Search, véase el año 2003).

10 noviembre, 2008  
Blogger José Antonio Millán ha dicho...

Aunque por el momento tenga libros en más de cien lenguas

10 noviembre, 2008  

Publicar un comentario en la entrada

<< Home

salida