1x1c3.gif (41 bytes)

El libro de medio billón de páginas (2)

José Antonio Millán

 

El buscador se convierte así en el intermediario, en el filtro por el que los contenidos de las webs llegan al público. Imaginemos que la única vía de acceso a todas las publicaciones mundiales fueran los ficheros de una decena de bibliotecas. En la Web estamos así, con la diferencia de que en los buscadores no ha habido bibliotecarios que apliquen sus saberes clasificadores: sus programas actúan ciegamente, analizando el código de la página, y clasificando los sitios según criterios formales. Este último aspecto es básico: cuando puede haber cientos o miles de sitios que responden a una determinada búsqueda, figurar en los primeros puestos de la lista de respuestas de un buscador puede ser la diferencia entre existir o no. No extrañará, por tanto, que haya quien lo intente por todos los medios.

¿Cómo extraen los buscadores la información sobre qué contienen las páginas? Los sitios web tienen zonas reservadas a la comunicación con los robots: hay anotaciones internas (llamadas metatags) que pueden resumir el contenido del sitio. Normalmente los buscadores dan más peso a una palabra clave con la que el gestor del sitio ha descrito su contenido, que a una palabra que han cogido del cuerpo del texto. También valoran las palabras que aparecen en un título, o que están más veces en un documento. Para figurar en los primeros puestos de un buscador caben distintas estrategias legítimas, pero la importancia económica de la clasificación ha generado también el spamdexing.

 

*  *  *

 

Spamdexing del bien

Un ejemplo curioso de lo que podríamos llamar spamdexindg del bien es este sitio web dedicado a tratar a los adictos a la pornografía y camuflado de sitio porno:
http://www.porn-free.org/

El camuflaje opera aquí a dos niveles:  por una parte en el nombre del dominio (existen pronfree.com y freeporn.com, dedicados, ellos sí, a lo que dicen). Y por otra las metatags, o etiquetas ocultas en el código, para información de buscadores. Estas son la que presenta el sitio:

pornography porn free sexual immorality teen sex Jesus Christ God Holy Spirit lust love pure fornication deliverance sex girl boy family dirty lesbian incest naughty leather secret hidden truth bad gay masturbation sin hardcore orgy demon spiritual warfare addiction carnal purity renewal pictures perversion sadism satan lucifer fallen angel forgiveness Jehovah Christian faith good sin sinful fire passion

Quien busque sexual perversion sadism satan llegará a este sitio, y tendrá una oportunidad de curarse. También llegarán quienes quieran Jesus Christ God. Y todos contentos

Adición del 12 de noviembre del 2001

Si spamming era la práctica de enviar correos electrónicos no solicitados, aquí el término se alía con indexing ("indización", que es lo que hacen los buscadores). Se considera spamdexing los procedimientos para provocar artificialmente que un sitio web aparezca en una posición destacada en un buscador (o se liste varias veces), cuando el consultante pregunta por determinadas palabras clave. Se consigue metiendo en los metatags repeticiones ("sex sex sex fuck fuck fuck...", como hacen los sitios porno), pero también colocando en el cuerpo principal de la página semejantes acumulaciones. Para que no perturben al lector, se incluyen frecuentemente en el mismo color que el fondo de la página, con lo que resultan invisibles... aunque no para el robot. Si prolongamos la imagen de la Web como biblioteca, esta práctica sería equivalente a someter un libro llamado Galdós Galdós Galdós, con un índice que fuera: "Con Galdós / Sobre Galdós / Por Galdós...", y comenzara: "Esta obra trata sobre Galdós y la obra de Galdós". Si cayera en manos de un catalogador poco profesional lo clasificaría en... "Galdós", y si tuviera que ordenar los libros por su importancia para el tema lo colocaría muy arriba...

Esta estrategia podríamos llamarla "de repetición" o "del niño de cinco años" (en honor a su sistema de obtención de cosas: "¡Quiero un pokemon, un pokemon, lo que quiero es un pokemon, un pokemon!"). Pero existen otras. Está, por ejemplo, la estrategia "del rape", en honor a este pez (y a los de otras especies) que fingen formas de pececillos en sus protuberancias, para atraer a depredadores... y devorarlos. En esta estrategia un sitio se mimetiza parcialmente con otro, cuyo tráfico quiere conseguir. Esto se realiza incluyendo el eslogan o la marca del competidor (de forma patente o en metatags): cuando los usuarios preguntan por la competencia, el buscador devuelve el sitio sin escrúpulos (incluso por encima del legítimo, si las estrategias que éste tiene para el diálogo con los buscadores son peores...). Ya está habiendo (en Estados Unidos) un conjunto numeroso de demandas legales relacionadas con estos temas [1]. Continuando con la imagen de la biblioteca, el equivalente sería que el libro sobreabundante en Galdós que hemos entregado, en realidad contuviera en su interior una novela de... Clarín.

Y hay un caso extremo, que llamaremos "de la hormiga esclavizadora", por ciertas especies que roban huevos a las vecinas y cuando nacen las crías las ponen a trabajar a su servicio. Este es el caso de quienes copian una página de un sitio y la meten en su propio servidor. El buscador indiza la página ajena con todas sus claves legítimas, y cuando el usuario pregunta por ellas el buscador le devuelve tanto la dirección de la página verdadera como la de la falsa. El usuario que hace clic en esta ultima llega a la página requerida... en un servidor extraño, donde rápidamente se le reenvía a un nuevo, y no buscado, contenido. En un caso reciente, si uno buscaba "libros medievales para niños" el buscador devolvía, entre otros, dos enlaces a Gloriana's Book Store con la siguiente descripción, "libros medievales para jóvenes lectores". Uno de ellos era legítimo, pero el otro conducía al sitio porno http://www.taboosisters.com. Hubo demanda legal, y la excelente construcción del caso se puede leer en [2]. En la metáfora libresca, sería equivalente a arrancar una portada de El pequeño príncipe, y pegarla en un ejemplar del Decamerón, para colocarlo en el mostrador de la librería... Todo parece indicar que van a aumentar en los tribunales del mundo entero las demandas contra todo tipo de rapes y hormigas.

 

*  *  *

 

Hemos mencionado antes las marcas y los eslóganes. Estos fragmentos de lengua (nombres propios, y frases) se están convirtiendo en un patrimonio aún más valioso en un medio, como la Web, en que la textualidad y la literalidad son claves en la localización. El grupo activista Irational [3] de Net-Art (o arte basado en la Red) ha satirizado la tendencia a la hiperprotección en su página web, que lleva el siguiente texto:

Por favor, tenga cuidado con su lenguaje. Las siguientes frases son marcas registradas, y son propiedad de sus propietarios registrados.

 

Recuerde: el lenguaje no es libreTM:

 

Todo está conectadoTM

Mire, oiga y sienta la diferenciaTM

Soluciones para un planeta pequeñoTM

...

Y así a lo largo de unas decenas de frases (normalmente banales) que tienen propietario. Naturalmente, la vuelta de tuerca es el (¿pseudo?)registro de la frase "Recuerde: el lenguaje no es libreTM".

 

*  *  *

 

[1] Aparecen referencias en: http://www.searchenginewatch.com/
resources/metasuits.html
venusup.gif (901 bytes)

[2] http://www.ftc.gov/os/1999/
9909/atarizfcomplaint.htm
venusup.gif (901 bytes)

[3] http://www.irational.org venusup.gif (901 bytes)

 

 

[Parte dos de cuatro]

uno, dos, tres y cuatro  siguiente

 

 

salida