la lengua en las redes

El español,
recurso en la Red

José Antonio Millán

 

Aparecido originalmente en:
Perspectivas exteriores 2004. Los intereses de España en el mundo
.
Editores: Política Exterior/FRIDE/Real Instituto Elcano/Biblioteca Nueva Política Exterior
calle Padilla 6, 28006 Madrid.
tel: 91.431.26.28 fax: 91.577.72.52. e-mail: suscripciones@
politicaexterior.com

1x1c3.gif (41 bytes)  

El castellano o español, nuestra rica lengua, ha pasado en los últimos años de ser algo inexistente, de lo que no se hablaba, algo que se daba por hecho, como el aire que respiramos, a ocupar un papel de importancia política y mediática. ¿Por qué este vuelco?

Desde el punto de vista político se ha revalorizado un factor no por conocido menos llamativo: que compartimos la lengua con un colectivo que podría llegar a los cuatrocientos millones de personas, muchas de ellas en el mismo corazón del Imperio, EE.UU. Si bien no hemos contribuido mucho a este estado de cosas (sino que han sido las ciegas fuerzas de la demografía las que lo han conseguido), se puede percibir en muy diversas instancias un sentimiento de orgullo al respecto. Y dado que la lengua es un vehículo de transmision, esto significaría que nuestra influencia cultural, política... se puede irradiar a una veintena de países... (La recíproca, que ellos pueden irradiar influencia hacia nosotros parece estar menos contemplada).

El segundo factor ha sido la conceptualización del español como “recurso económico”[1]. El impulso partió de la sociedad civil[2], y los primeros pasos se dieron hacia la cuantificación de los sectores más directamente relacionados con la lengua, como el de la enseñanza del español, para pasar luego a zonas más evanescentes. Si en la actualidad se puede calibrar incluso el valor de un entorno ecológico como recurso (a través de turismo, calidad de vida, etc.), no extrañará que pudieran avanzar los estudios sobre la lengua. Los estudios de econometría lingüística aparecieron ligados a las lenguas minoritarias (las publicaciones de François Grin o François Vaillancourt desde principio de los años 90 del pasado siglo), y es curioso que de ellas se saltara al polo opuesto: una lengua tan extendida como el español.

En el 2003 se ha publicado el libro El valor económico de la lengua española[3]. Si alguien no ha mirado nunca un estudio de estas características, puede sorprenderse al ver que se analiza la “relevancia económica de la lengua” en el “valor añadido bruto” de la industria química, por ejemplo. Bien: sea como fuere, se llega a la conclusión de que la lengua es responsable de un 15% del producto interior bruto español. De este porcentaje, el 10% es atribuible a las tecnologías de información y documentación[4].

El tercer factor de importancia es la aparición de las nuevas tecnologías, y concretamente de Internet. El mundo de los contenidos de la Internet (la World Wide Web) y de la comunicación en ella (email, foros, grupos de discusión, ...) representa un terreno con una fuerte carga lingüística. Como además la Internet lleva unos años estando muy de moda, y es el espacio en el que se dirimen hoy en día las grandes apuestas tecnológicas, el resultado es que la situación de nuestra lengua en la Red es una cuestión que ha saltado hace tiempo al primer plano... y se ha mantenido en él.

Si vamos a abordar de nuevo este tema no es por entrar en un discurso triunfalista (o, por el contrario, victimista) sobre la posición del español, sino porque las medidas de presencia en la Red pueden ser indicadoras de brechas digitales, y aportar datos preciosos sobre la colonización cultural y científica.

 

Los problemas para la medida de la presencia de una lengua en la Red siempre han sido muchos[5]. De entrada, una parte significativa de la Web no es accesible saltando de enlace en enlace (que es la forma típica en que operan los usuarios y los buscadores), sino que está en forma de páginas dinámicas, o de bases de datos, que generan las páginas sólo tras una petición: es lo que se llama la “web profunda” (deep web)[6]. No hay consenso sobre la extensión de esta web, pero se supone que es muchas veces mas grande que la web “normal”. Y dentro de ésta a su vez hay que distinguir la parte de la web que está directamente accesible a la consulta (sin petición de contraseñas, por ejemplo), y la que está restringida. La primera es la que se llama “web pública” (en oposición a la “web oculta”); la web pública es sólo el 35% de la web total, es decir, unos 3 millones de sitios web o 1.400 millones de páginas web[7].

En la actualidad todos: medios de comunicación y estudios académicos, siguen divulgando periódicamente cifras sobre presencia lingüística en la red que provienen de un reducido número de emisores, básicamente Global Reach[8] y Jupiter Research[9] (con intereses como consultoras en el sector), y que raramente desvelan la metodología utilizada.

Mientras tanto, una ONG del sur viene llevando a cabo, con la colaboración de la Unión Latina[10], estudios de presencia del español en la Red. Se trata de la Fundación Redes y Desarrollo (Funredes[11]), que desde hace ocho años ha estado haciendo calas sobre presencia de lenguas neolatinas en la red, y su comparación con la situación del inglés.

Los datos de Funredes son los más fiables que conozco, porque parten de una metodología transparente, se han ido llevando a cabo y refinando a través de una serie de años,  y mantienen una buena cohesión estadística[12]. Veamos el método utilizado, expuesto en el último estudio[13]:

consiste, en primer lugar, en establecer una selección de términos por lengua, cada uno con sus respectivas variantes ortográficas, con y sin el uso de los signos diacríticos, así como las variantes sinonímicas, dialectales y morfosintácticas, y respetando un significado y alcance equivalentes en todas las lenguas estudiadas. A continuación, para cada término, se mide el número de páginas web que lo contiene, utilizando uno de los motores de búsqueda que responda a los criterios del método. Seguidamente, se analizan y comparan los resultados para deducir estadísticamente porcentajes de presencia de cada idioma.

De acuerdo con la misma fuente, el resultado (lógicamente, sólo para la web pública) son los porcentajes que aparecen en la primera columna del cuadro inmediato, en que el español obtiene un 5,62%. Pero hay otro factor para poder apreciar estos datos en su justo valor: compararlos con la población mundial que habla cada una de estas lenguas (para el español, por ejemplo, se calculan 375 millones, mientras que para el francés son 130).

 

% de páginas web

Presencia ponderada 8/1998

Presencia ponderada 8/2001

Evolución
3 años

INGLÉS

50,00

7,14

4,76

- 33,31%

ESPAÑOL

5,62

0,40

0,90

+ 124,80%

FRANCÉS

4,57

1,30

2,10

+ 61,82%

ITALIANO

3,08

1,50

3,08

+ 105,00%

PORTUGUÉS

2,79

0,26

0,88

+ 237,90%

RUMANO

0,18

0,30

0,35

+ 16,67%

 

La segunda columna ofrece la ponderación en agosto de 1998, y la tercera en el 2001. Fijémonos en los datos más recientes (sombreados). ¿Qué significan?: que aunque el español tiene más cantidad de páginas web que el francés (5,62% frente a 4,67%), como el francés tiene casi la mitad de hablantes, su presencia ponderada es mayor que la del español.

Los datos son claros: para la cantidad de hablantes que poseen, el francés y el italiano tienen mucho mejor presencia en la Red que el español (el doble y el triple, respectivamente). Otro fruto sorprendente del estudio es que a pesar de que el inglés tenía la mitad de las páginas web mundiales, su peso en relación a la población de anglohablantes es muy bajo: el 4,76.

Si se compara ahora la situación de 1998 y la del 2001 (tercera columna), se ve que el portugués y el español han encabezado el crecimiento en la Red, mientras que el inglés ha perdido terreno. La Red ya no es ese espacio anglófono que en su día se pensó que era, sino que además, el inglés no deja de perder terreno, mientras que el español (y otras lenguas hijas del latín), lo ganan...[14] [Una actualización del estudio de Funredes para el 2003 (http://www.funredes.org/LC/L5/evol.html) otorga al inglés el 45% de páginas web y al español el 4,87%: el inglés sigue descendiendo desde el 2001, y el español también tiene un pequeño descenso].

¿Quiénes aportan páginas en español a la Red? ¿De qué países proviene ese 5,62% de páginas en el 2001? Funredes hizo la estadística por dominios nacionales, y los primeros puestos fueron para .es (España), 13,48%; .ar (Argentina), 9,06%; .mx (México), 8,14% y .cl (Chile) 3,29%. Pero más de la mitad de los sitios web en español no están en dominios geográficos (.com tiene el 35,23%; .org, el 11,73%, .net, el 4,23%, etc.) . Si queremos saber cuánto aporta cada país a la Internet en español, tendríamos que saber qué porcentaje de sus sitios web están bajo el dominio nacional, y sobre eso no hay datos ciertos, sólo conjeturas. Los dos polos extremos de esta estimación son que España tiene sólo el 25% de páginas bajo dominio .es, mientras que Argentina tendría el 95% bajo .ar.

Aun con las cautelas sobre estos datos, tendríamos que España produce más de la mitad de las páginas en español de la Web, seguida por Argentina (9,5%), México (8,6%) y Estados Unidos (5%). Si se relacionan estos datos con el porcentaje de hablantes con acceso a Internet se obtiene la productividad de cada espacio, y en cabeza estaría Cuba (aunque esto a lo mejor se debe a que su número de usuarios se ha subestimado), seguido, por ese orden, de España, Colombia y Chile.

Resulta toda una lección de sociolingüística de la Red el hecho de que esos estudios de Funredes hayan permanecido desconocidos para la academia anglohablante:

A mediados de la década de 1990 se informó de que el 80% de los sitios internacionales estaban en inglés (Cyberspeech, 1997). Aunque no se han hecho recientemente estudios sobre el número de sitios web en cada lengua [...][15]

Y aún más culpable es la ignorancia por parte de las fuentes españolas, dado que los datos que hemos comentado han aparecido en prensa de gran difusión y se presentaron en el Congreso de la Lengua de Valladolid en octubre del 2001. Sin embargo, se vienen arrastrando cantidades más antiguas y menos justificadas, como la cifra del 2,4% de páginas en español[16].

Otras cifras recientes para el español han sido las siguientes. Un informe de este año de Softcatalá elaborado exclusivamente a partir de Alltheweb, le asigna el 3,11%[17]. Una investigación hecha sobre un muestreo de sitios web a través de generación aleatoria de números IP (las direcciones numéricas que están detrás de los nombres de dominio) le otorgó un 3%[18].

Para concluir, podemos atender a otro parámetro: el número de personas con acceso a Internet. Según Global Reach[19], el español, con 54,8 millones de internautas, tendría el 8,1 por ciento de la población mundial en línea. Estos son los datos de las primeras lenguas por presencia de hablantes en la red (encabezan la columna los que tienen porcentajes más altos, y a continuación están las lenguas romances cuyos datos aparecen desglosados en la fuente):

 



lengua

% población mundial on line

inglés

35,2

chino

11,9

japonés

10,3

español

8,1

alemán

6,5

 

italiano

3,6

francés

3,3

portugués

2,8

 

España ha venido teniendo un desarrollo en nuevas tecnologías muy atrasado en relación con otros países de nuestro entorno. Según un amplio conjunto de indicadores de la sociedad de la Información manejados en España 2002[20]., España se encuentra en el tercer grupo de países europeos (los países del primer grupo se encuentran al nivel de EEUU, Canadá y países del este asiático). España se encuentra en el grupo inferior, alineada con Italia, Portugal y Grecia en prácticamente todos los indicadores, entre ellos, y muy especialmente, en hogares con acceso y en usuarios de Internet.

Podría pensarse que tiene que haber alguna relación entre el número de personas hablantes de una determinada lengua con acceso a la Red, y el número de páginas web en que está presente esta lengua. Esto, que no pasaría de ser una hipótesis, ha tenido una comprobación estadística: según el estudio de Funredes[21] la cantidad de páginas de la Red producidas en un idioma es hoy directamente proporcional a la cantidad de internautas hablantes de ese idioma. Una primera conclusión que se desprende de este dato es que para fomentar la presencia de una lengua en la Red, lo primero sería facilitar el acceso a ella de sus hablantes.

Hay un parámetro en el que España ocupa una posición destacada: el porcentaje de accesos de banda ancha (ADSL):

España contaba a finales de 2002 con el mayor porcentaje de hogares con acceso a Internet a través de banda ancha (37 por ciento) en Europa Occidental, "a pesar de tener una de las tarifas básicas mensuales por conexión más caras de la región", según los últimos resultados publicados por Jupiter Research[22].

Pero, ¿éste es un factor especialmente productivo, que permita augurar un desarrollo de la Web en español?. Parece que no, puesto que según el mismo estudio citado en la fuente: “[hay] consumidores que usan Internet para descargar ficheros de música o video, una de las principales razones por las que el consumidor ha adoptado el acceso a Internet de alta velocidad en el hogar”.

 

Pero aparte de las calas puramente cuantitativas, se impone una reflexión cualitativa. Sería deseable que el espacio web en español (y, por cierto, en las otras lenguas oficiales: catalán[23], gallego y vasco) no sólo contuviera muchas páginas, sino que además éstas fueran de calidad y útiles para sus ciudadanos. El problema que plantea el análisis cualitativo de la Web es aún más grande que el cuantitativo.

Podemos ver una muestra en el trabajo de Aguillo sobre las universidades iberoamericanas[24]. De nuevo, esta es una tarea que se realiza a partir de diversos motores de búsqueda (basicamente, Google[25] y FAST[26]), así como los datos de popularidad relativa de Alexa[27].

Sobre una muestra escogida de universidades americanas se procedió primero a seleccionar las 50 con mayor número de páginas según Google y FAST (entre las que, por cierto, destacan poderosamente las brasileñas), para luego ordenarlas según el número de visitas que reciben (de acuerdo con Alexa). Pero este factor tampoco es determinante del todo, con lo que hay que acudir a los índices de visibilidad, es decir: ver qué paginas reciben más enlaces de terceros, a su vez ponderadas según la importancia de las páginas enlazantes. Esto se logra a través del Page Rank de Google[28]. Este criterio se complementa con el de navegabilidad, definido como número de enlaces internos respecto al total de páginas. Por último, se puede ver la proporción de los llamados “formatos ricos” sobre el total de las páginas. Los formatos ricos, de los que se supone que tienen mayor valor añadido[29], son los de MS Office (doc y rtf de Word, ppt de PowerPoint y xls de Excel), así como Poscript y Adobe Acrobat. En las mayores universidades estos formatos llegan a constituir el 10, el 20 y en una ocasión hasta más del 40% de la web.

Un estudio complementario que se puede hacer es analizar la procedencia de los enlaces a un determinado sitio: ¿estas universidades están predominantemente enlazadas desde su propio país, o desde los circundantes? La respuesta, para las veinte mayores universidades, es que están enlazadas básicamente desde su entorno local, con lo que los datos reflejan un espacio web ensimismado.

Queda mucho trabajo por hacer, tanto en el refinamiento de estos procedimientos como en su aplicación a distintas tipologías de sitios web en nuestra lengua, si es que queremos conocer no sólo cuánto español hay en la red, sino cómo son y cómo se usan nuestros sitios web. Por otra parte, además de las páginas web recordemos que el email[30], las listas de distribución[31] y los grupos de discusión (newsgroups)[32], los chats y la mensajería instantánea tienen también un amplio uso, y merecen igualmente ser estudiados.

 

Si, en general, el conocimiento de una situación es el mejor camino para mejorarla, podríamos pensar que habría que destinar esfuerzos a analizar nuestro espacio web, por una parte con la colaboración de las instituciones que ya han hecho avances en ese camino, y por otro lado mejorando las herramientas tecnológicas de análisis al servicio del español. Si nos hemos dado cuenta, todos los estudios que hemos citado sobre el español hacen uso de los grandes buscadores comerciales. Pero estos presentan un sesgo muy claro hacia el inglés, y en general hacia los sitios web presentes en países anglohablantes, de modo que probablemente los datos obtenidos sobre nuestro espacio web a partir de ellos sufren de defectos de origen. ¿Sería muy utópico pensar en el desarrollo de un buscador más orientado al español? En ese sentido parece que avanzará el Buscador General Panhispánico que prepara el Centro Virtual Cervantes del Instituto Cervantes[33].

Los grandes buscadores comerciales (sobre todo Google) están tan asentados entre el público hispanohablante que parece difícil que ninguna iniciativa pública o privada pudiera desplazar su uso. Pero en el caso de nuestras otras lenguas oficiales (catalán, gallego y vasco), la cosa podría no ser así. Dado el papel central que ocupan los buscadores en la navegación de las personas, podría pensarse que apoyar motores de búsqueda específicos para la web en esas lenguas sería una buena inversión; sin embargo, ¿es adecuada la opción de financiar a buscadores privados, frente a la de participar en proyectos abiertos? El reciente apoyo del gobierno catalán a un buscador privado ha levantado una crítica justificada[34].

 

De todas formas, el espacio de la World Wide Web no es el único en el que se dirime el futuro tecnológico de nuestra lengua: la red empieza a ser ubicua, a través de comunicaciones inalámbricas, y de la interconexión de infinidad de dispositivos que antes permanecían ajenos a ella: teléfonos móviles, consolas de juego, dispositivos GPS en vehículos, etc. A medida que la Red esté más cerca del consumidor, hará más falta software de conversión habla-texto y viceversa y sistemas automáticos de conversación. A medida que la red sea más usada con fines académicos y empresariales, harán falta más correctores, ayudas a la redacción, traductores, extractores de información multiligüe, creadores automáticos de resúmenes y agentes inteligentes que ayuden en las compras y en la localización de información. España presenta un grave déficit en las tecnologías que pueden conducir a estos productos[35].

Lo que está en juego ahora no es una mayor o menor cantidad de páginas web en castellano en la Red, sino que los hablantes cuenten con herramientas que les permitan sacar partido de la red con fines de investigación, estudio, comercio, o creación, y no con las herramientas que quiera el mercado,adaptadas sólo a lo que quiera el mercado, sino las que necesiten los usuarios. Resulta paradójico que los recursos lingüísticos creados con dinero público (que permitirían el desarrollo de estas herramientas digitales para nuestras lenguas) no contribuyan a la creación de una base de productos que compitan entre sí, y por adaptarse mejor a las necesidades de nuestros usuarios, sino que vayan a reforzar la postura de las empresas (extranjeras) mejor establecidas[36].

 

La mayor parte de los problemas de la red resultan ser problemas del mundo. Por ejemplo: la comunicación científica sigue teniendo el inglés como vehículo provilegiado, y esto se refleja en la red científica. El artículo de Aguillo antes citado[37] analiza los contenidos lingüísticos en veinte sitios universitarios iberoamericanos, para concluir que todos, al lado de sus contenidos básicos en portugués o en español, presentan materiales en inglés que pueden llegar al 20 o al 30% del total del sitio[38].

La reacción política ante una situación de las nuevas tecnologías, y especialmente de la presencia de la lengua en la red ha sido variopinta y a veces pintoresca. El Ministerio de Ciencia y tecnología creó una Comisión de expertos, que emitieron su informe en abril del 2003[39]. En la comisión, como se destacó inmediatamente, no estaban presentes los usuarios (por ejemplo, a través de sus asociaciones), ni los colectivos que trabajan en la creación de software libre, sino solamente el sector empresarial.

De las recomendaciones de la comisión surgieron iniciativas como Patrimonio.es, “un programa de digitalización del Patrimonio Histórico Español que persigue garantizar la conservación, catalogación y difusión de una gran variedad de bienes que representan el acervo cultural, científico y natural del país”:

Patrimonio.es permitirá, además, cumplir con otros objetivos, entre los que destaca impulsar el turismo cultural, facilitar a la comunidad científica, académica y escolar el acceso a estos contenidos y fomentar la presencia en Internet de contenidos de calidad en español.[40]

El fin expreso de Patrimonio.es es “la creación a partir de activos digitales de productos y servicios con valor añadido para un conjunto de usuarios”. Que el sector público, en cuyas manos están gran parte de los activos documentales y culturales de un país, debe aportar elementos para que la empresa y la sociedad desarrollen productos de valor añadido es algo claro desde hace tiempo: lo señaló el finlandés Erkki Liikanen, miembro de la Comisión Europea, responsable para la Empresa y la Sociedad de la Información, en su texto "Exploitation of public sector information"[41].

Pero las inversiones que Patrimonio.es destinará a digitalización, ¿servirán efectivamente para que el sector privado y el mundo académico puedan generar contenidos de calidad a partir de las obras digitalizadas? ¿Con qué criterios se permitirá la reutilización de estas obras? ¿Participará Patrimonio.es en la posible explotación comercial de productos hechos a partir de su programa?, y si es así, ¿como? Estas cuestiones, sobre las que aún no hay una respuesta clara, serán sin duda la clave para saber si la acción va a cumplir con sus objetivos.

Sobre otro aspecto importante relacionado con el patrimonio digital su preservación, en diciembre del 2002 hubo una iniciativa del Partido Popular:

El Grupo Parlamentario del PP en el Senado instará al Gobierno a que promueva la creación de un Departamento de Nuevas Tecnologías de la Información y de las Comunicaciones en el Museo Nacional de Ciencia y Tecnología, a modo de "museo digital" en el que se conserven las páginas webs generadas en España y en cualquier lengua espanola" en aras de "preservar" la "memoria digital" del país[42].

La gestión del dominio .es ha sido repetidamente criticada desde su comienzo, y a través de su última reforma.

En Alemania se crea en un solo día tres veces más dominios [en .de] que España [en .es] en el último mes. La diferencia con los países de nuestro entorno no hace más que aumentar [...]: el número de registros que se realizan por día en España es desde cuatro veces menor (en el caso de Austria) hasta 87 veces menor en el caso de Alemania[43].

El resultado es que la mayoría de las direcciones que se crean en España no estén bajo .es. Esto no tiene consecuencias directas para la cantidad de contenidos en español en la web, pero sí para su visibilidad (por no hablar del perjuicio que supone que el precio del registro vaya al exterior, y que la jurisdicción para resolver posibles conflictos en los .com, .org, etc., que albergan webs españolas no esté en nuestro país). Hoy hay un amplio consenso en que la administración del dominio debe cambiar.

La insatisfacción con la situación actual ha hecho que surjan propuestas, como esta moción del portavoz socialista de la Comisión de la Sociedad de la Información y del Conocimiento[44]:

crear en Internet un dominio hispano, de los países y lugares del mundo en los que se habla el español, denominado (.his) [...] que aglutine a todos los países, culturas y personas de lengua hispana, como forma de aprovechar mejor la inmensa potencialidad de los 400 millones de hispanohablantes, tanto en el aspecto cultural como económico.

Como en la Internet no hay dominios lingüísticos, sería muy difícil que esta propuesta, si se llevara a la ICANN, prosperara. Pero además: ¿por que razón deberían los hispanohablantes de los países latinoamericanos querer poner sus materiales en la red bajo este dominio?

Junto al mal diseño del dominio.es, hay otro factor que para muchos está coartando el desarrollo del espacio web español: se trata de la Ley de Servicios de la Sociedad de la Información (LSSI)[45]. Sus principales críticos señalan que la LSSI hace recaer sobre los usuarios individuales de la Red (creadores de páginas personales, o pequeñas instituciones) requisitos gravosos más propios de grandes empresas[46].

 

Una de las iniciativas más interesantes de los últimos tiempos ha sido el proyecto de unión de esfuerzos de los hablantes de tres grandes lenguas descedientes del latín: francés, portugués y español. En el marco de los llamados “Tres espacios lingüísticos” han confluido los esfuerzos de las siguientes instituciones: Comunidad de Países de Lengua Portuguesa, Organización de Estados Iberoamericanos para la Educación, la Ciencia y la Cultura, Organización Internacional de la Francofonía, Secretaría de Cooperación Iberoamericana y Unión Latina.

A lo largo de casi dos años, grupos de expertos de cada uno de los tres espacios (entre los que se encontraba el firmante de este artículo) elaboraron un conjunto de propuestas, que se presentaron en el verano del 2002[47]. Los expertos provenían no sólo de los países europeos de las áreas lingüísticas, sino también de otras zonas como África y América. Un comité se dedicó específicamente al sector de las nuevas tecnologías. Sería muy conveniente que las organizaciones que durante muchos meses albergaron un debate único sobre la forma de implantar sus lenguas en un horizonte tecnológico no dejaran perder tantos esfuerzos...

 

En julio del 2002 formulé diez puntos como conclusiones del curso “Interñet, la red en español”[48]. Creo que siguen teniendo validez general como programa o listado de los puntos que, un año mas tarde, tiene pendiente nuestro desarrollo lingüístico en la red.

 

Todas las direcciones web citadas se deben entender activas en el mes de septiembre del 2003, fecha de la finalización del artículo.

 

[1] Óscar Berdugo, “El español como recurso económico: anatomía de un nuevo sector”, II Congreso Internacional de la Lengua Española, Valladolid, 16-19 de octubre de 2001. http://cvc.cervantes.es/obref/congresos/valladolid/ponencias/activo_del_espanol/1_la_industria_del_espanol/berdugo_o.htm.

[2] La Asociación Español Recurso Económico se creó en el año 1996, y por esa fecha comenzaron también las intervenciones del ICEX (Instituto Español de Comercio Exterior).

[3] Ángel Martín Municio (dir.), El valor económico de la lengua española, Madrid, Espasa Calpe, 2003, con la colaboración de la Fundación Santander Central Hispano, el Instituto Cervantes, y la Real Academia de Ciencias Exactas, Físicas y Naturales.

[4] No deja de resultar extraño que el libro no mencione (ni siquiera para criticarlo) nuestro estudio, aparecido en estas mismas páginas [Política Exterior], y que constituye la única aportación que sepamos a la cuantificación del español en el medio digital. Hablo de: José A. Millán, “La lengua que era un tesoro. El negocio digital del español y cómo nos quedamos sin él”, extraordinario sobre "La sociedad de la información" de Política Exterior, Madrid, invierno 2000/2001; versión web ligeramente modificada en http://jamillan.com/tesoro.htm.

[5] Aunque ya lejana en el tiempo, puede ser útil la consulta de mi obra: José Antonio Millán, Internet y el español, Madrid, Fundación Retevisión, 2001, especialmente la parte II: “Evaluar una lengua en la Red”.

[6]. Michael K. Bergman, "The Deep Web: Surfacing Hidden Value" Journal of Electronic Publishing, Volume 7, Issue 1, 2001 http://www.press.umich.edu/jep/07-01/bergman.html

[7] Edward O'Neill T, Brian F. Lavoie, and Rick Bennett, “Trends in the Evolution of the Public Web: 1998 - 2002”, D-Lib Magazine, 9.4, 2003: http://www.dlib.org/dlib/april03/lavoie/04lavoie.html .

[12] Puede verse el conjunto de estudios a lo largo del tiempo en el subsitio de Funredes “Lenguas y Culturas. Observatorio de las lenguas y las culturas”: http://funredes.org/LC/espanol/index.html

[13] Daniel Pimienta y Benoit Lamey: “Lengua española y culturas hispánicas en la Internet. Comparación con el inglés y el francés”, II Congreso Internacional de la Lengua Española, Valladolid, 16-19 de octubre de 2001. http://funredes.org/LC/L5/valladolid.html.

[14] Hay que pensar que el crecimiento total de la web pública se ha detenido, y que incluso fue levemente negativo en el periodo 2001-2002 (O'Neill T, Lavoie, Bennett, “Trends in the Evolution..”, citado). Probablemente, los primeros que querían “estar en la red” básicamente anglohablantes, ya están, y su número no crece, mientras que los que llegaron tarde siguen incorporándose.

[15] Mark Warschauer, Ghada R. El Said y Ayman Zohry, “Language Choice Online: Globalization and Identity in Egypt”, Journal of Computer-Mediated Communication (JCMC), 7.4., 2002: http://www.ascusc.org/jcmc/  (la traducción y el subrayado son nuestros). Los dos primeros firmantes constan como pertenecientes, respectivamente, a la University of California, Irvine, US y a la Brunel University, UK.

[16] Proviene de un informe de VilaWeb del año 2000: http://www.vilaweb.com/especials/5anys/enquesta.html . La menciona, entre otros, y a partir de fuentes de segunda mano, el libro del 2003 El valor económico de la lengua española (citado).

[17] Jordi Mas i Hernàndez, “La salut del català a Internet”, 2/09/2003. http://www.softcatala.org/articles/article26.htm

[18] O'Neill, Lavoie, Bennett, “Trends in the Evolution...”, citado.

[19] Con fecha de 31 de marzo del 2003: http://www.global-reach.biz/globstats/index.php3

[20] Fundación Auna, España 2002. Informe anual sobre el desarrollo de la sociedad de la Información en España, Madrid, Fundación Auna, 2002. Véase especialmente el apartado 18.1: “España en el contexto europeo”, de donde provienen los datos inmediatos.

[21] D. Pimienta y B. Lamey: “Lengua española y culturas hispánicas en la Internet”, cit.

[23] Que cuenta con 1,9 millones de personas en línea, según Global Reach: http://global-reach.biz/globstats/refs.php3#2

[24] Isidro F. Aguillo, “Indicadores de contenidos para la Web Académica Iberoamericana”, presentado en el “Segundo Taller de Indicadores de la Sociedad de la Información”, organizado por la Red Iberoamericana de Indicadores de Ciencia y Tecnología (RICYT), Lisboa, 27 y 28 de febrero del 2003.

[28] Una explicación desde dentro en http://www.google.com/technology/

[29] Probablemente en el sector académico estudiado, pero en otros la presencia de estos formatos tal vez sólo refleje la dejadez de los gestores de los sitios web, que publican la documentación tal y como la entrega el autor: es el caso que he comprobado para algunas sedes web oficiales en España (como diputaciones).

[30] Cuya cifra mundial puede ya ser aterradora: en el año 2000 (y por tanto, antes de la explosión del spam) se calculaba en 500 ó 600.000 millones de unidades anuales (How Much Information, 2000: http://www.sims.berkeley.edu/research/projects/how-much-info/internet/emaildetails.html ).

[31] 405 sólo las alojadas en RedIRIS (España): http://www.rediris.es/list/

[32] Casi 100, entre los que usan el español y los que se encuentran en España, según Google: http://groups.google.com/

[33] Intervención de Andrés Elhazaz, director del Centro Virtual Cervantes, en el curso “Búsqueda: del archivo a la Red”, Madrid, Residencia de Estudiantes y Fundación Francisco Giner, 2003, http://www.archivovirtual.org/seminario/busqueda.htm

[34] Jordi Mas i Hernàndez, “El software libre y las lenguas minoritarias: una oportunidad impagable”, en Novática, 163, entrada desde: http://www.ati.es/novatica/2003/163/nv163sum.html .

[35] José A. Millán, “La lengua que era un tesoro”, citado.

[36] José Antonio Millán, “La lengua en el medio digital: un reto político”, en Novática, 163, entrada desde: http://www.ati.es/novatica/2003/163/nv163sum.html . Y lo mismo para el caso del catalán: Jordi Mas i Hernàndez, “Llengua i societat de la informació: construint una capa de recursos lingüístics lliures pel català” http://www.softcatala.org/~jmas/llengua-societat.htm.

[37] Isidro Aguillo, “Indicadores de contenidos...”, citado.

[38] Al fin y al cabo, al menos desde 1999 sabemos que entre los sitios de cualquier lengua aparece siempre un porcentaje multilingüe, y que la segunda lengua que siempre está presente es el inglés. Véase Brian F Lavoie y Edward T. O'Neill, “How "World Wide" is the Web? Trends in the Internationalization of Web Sites”, Annual Review of OCLC Research, 1999: http://digitalarchive.oclc.org/da/ViewObject.jsp?objid=0000003496 .

[39] “Aprovechar la Oportunidad de la Sociedad de la Información en España. Recomendaciones de la Comisión Especial de Estudio para el Desarrollo de la Sociedad de la Información” (1 de abril del 2003) http://www.aui.es/biblio/documentos/estadisticas/informe_final_comisionespecial.pdf

[43] Asociación de Internautas, “Los dominios .es siguen fracasando”, 1 de julio [del 2003] http://www.internautas.org/article.php?sid=1069 .

[44] http://www.elhacho.com/mocion.pdf

[45] Ley 34/2002, de 11 de julio, de Servicios de la Sociedad de la Información y Comercio Electrónico. Aprobada por el Congreso el 27 de junio de 2002 y publicada en el BOE de 12 de julio de 2002. Texto íntegro en http://www.lssice.com/legislacion/lssice.html y en http://www.lssi.es/paginas/normativa.html .

[46] Vale la pena leer este cuento de Javier Maestre, “LSSICE: ¿Cómo nos afecta?”, http://www.lssice.com/textos/cuento.html

[48] “10 retos para la red en español”: http://jamillan.com/conclusio.htm

Proimera version terminada el 30 de septiembre del 2003.
Revisión: 3 de mayo del 2004

Publicación, 3 de mayo del 2004

salida