eñeroj.gif (3770 bytes)
El español y los buscadores

(o el 92% de las páginas en español que Google no indexa)

José Antonio Millán

 

1x1c3.gif (41 bytes)

26 de mayo del 2006

No ha habido ninguna explicación. Mientras no se demuestre lo contrario, el Ministerio de Industria ha dado un dato de importancia estratégica no basado en ningún estudio.

Coda: 10 de mayo del 2006

"Fuentes del Ministerio de Industria" me dicen que el 23 de mayo, en un acto público (que divulgaré en la medida en que me entere de él) se contará la fuente de estos datos. Esperamos, entonces...

3 de mayo del 2006

Discusión de la cuestión en:

Barrapunto: http://barrapunto.com/article.pl?sid=06/04/30/1123209

Dirson: http://foros.dirson.com/viewtopic.php?t=16232

Menéame: http://meneame.net/story.php?id=15150

 

 

Leemos en Terra, tecnología-información, a fecha de ayer (29-04-2006), bajo el encabezamiento Montilla destaca Plan Avanza como apuesta contra brecha digital:

Además, [el Ministro español de Industria, Montilla] avanzó que el Gobierno favorecerá una mayor difusión del idioma español en Internet, ya que, a su juicio, no refleja el peso demográfico de los hispanohablantes en el mundo.

'En este sentido, constatamos que en el índice de los buscadores ahora presentes en el mercado los contenidos en español son muy minoritarios, por ejemplo, en el conjunto del índice del motor de búsqueda más utilizado en España tan sólo el 2 por ciento de los contenidos está en español', dijo.

Montilla consideró que 'este porcentaje está muy lejos del 6,3 por ciento que representan los hispanohablantes y del 4,5 por ciento que representan los contenidos en español en el conjunto de Internet'.

'En realidad, en dicho motor de búsqueda sólo hay indexadas un 8 por ciento del total de las páginas existentes en español, es decir, el 92 por ciento restante esta invisible', explicó.

La noticia es la transcripción de algo que el ministro dijo "en la sesión plenaria del IV Foro Ministerial entre la Unión Europea (UE) y la Asociación de Estados Latinoamericanos y Caribe (ALC)", y por tanto puede tener alguna inexactitud. Por ejemplo: no se entiende (o al menos yo no entiendo) qué pueda ser "el conjunto del índice del motor de búsqueda". "El motor de búsqueda más utilizado en España" sí que sabemos que es Google.

Pero la última parte de la noticia hay un párrafo entrecomillado que se entiende perfectamente. Lo repito:

'En realidad, en dicho motor de búsqueda [Google] sólo hay indexadas un 8 por ciento del total de las páginas existentes en español, es decir, el 92 por ciento restante esta invisible'.

Pues bien: se me hace muy difícil creer esta información; no por defender a Google (cuyos servicios utilizo constantemente, igual que una amplia mayoría de los ciudadanos con acceso a la red, pero de quien no soy accionista), sino porque semejante y flagrante desequilibrio no habría pasado inadvertido ni a buscadores rivales ni a los usuarios. En mi experiencia personal de rastreo de datos de todo tipo (incluyendo pequeñas páginas creadas por centros escolares, estudiantes, poetas minoritarios, etc.), no sólo de España sin también de Latinoamérica, siempre he encontrado una cobertura buena. Los estudios cibermétricos del español nunca han hablado de semejante desequilibrio. Y en foros y lugares de discusión jamás he oído a nadie quejarse de que Google no indizara su página (del ranking sí, pero esa es otra cuestión). A la empresa que es Google, por último, tampoco le interesa descuidar de esa manera su tercer mercado... Pero bueno: si alguien ha estudiado el tema, con metodología y medidas contrastables, y sus resultados son esos, lo aceptaré de buen grado.

Por el momento, he pedido a distintos niveles del Ministerio de Industria, Turismo y Comercio que me proporcionen el texto de la alocución del Ministro, y también las fuentes de los datos que contiene.

La intervención del ministro tiene dos elementos destacados: "favorecer una mayor difusión del idioma español en Internet" (por medios que habrán de ser explicados) y algo que se debe forzosamente deducir de la segunda parte: "no nos indexan las páginas españolas", luego...

Las iremos analizando a medida que vayamos disponiendo de más datos.

 

 

 

Creado el 30 de abril del 2006
Ilustración añadida el 1 de mayo del 2006

salida