Lyb logo p2.jpg (18774 bytes)

 

 

En español: del impreso a la Red.
Lengua, tecnología y comercio entre las dos orillas
 

 

José Antonio Millán

1x1c3.gif (41 bytes)

.

Índice

I: Átomos
Libros
Revistas

II: Bitios
En la Web abierta
Cultura digital compartida
Libros digitales
Revistas culturales
Audiovisual
Web 2.0
Lenguas en la Web 2.0
Para hablar con las máquinas
 

 

Puede comentar este artículo en el blog de Libros & Bitios.

Este artículo comenzó como dos encargos diferentes, que tuvieron como pretexto la celebración de la Feria Internacional del Libro de Guadalajara (México) del 2010.

La revista mexicano-española Letras Libres me encargó un artículo amplio sobre el español en el ciberespacio, y El País otro sobre libros y revistas culturales en España y América. Combinando ambos se obtenía un panorama general, que ahora he reelaborado en parte y he completado con referencias.

Ls consultas a las fuentes indicadas en hiperenlace se han cerrado a
5 de enero del 2011.

Agradecimientos: a Miguel Siguán (lamentablemente desaparecido), Antonio María de Ávila, Isidro Aguillo, Martín Caparrós, Margarita García, Gustavo Romano, Julieta Lionetti, Manuel Ortuño, Damià Gallardo, Enric Faura, Victoire Chevalier, Chema García y los lectores que contribuyeron a mis intentos de cuantificación del Blog de Libros y Bitios.

1x1c3.gif (41 bytes)

 

Los hispanohablantes somos unos 450 millones. Podría pensarse que constituimos un espacio abierto a la circulación de todo tipo de obras y servicios que comparten nuestra lengua común, pero la verdad es que hay numerosos compartimentos estancos.

En el mundo de los átomos, de los objetos físicos, hay problemas de infrastructura comercial, y en el mundo digital hay barreras por causa de las licencias, y en uno y otro hay graves carencias en el conocimiento mutuo.

Por otro lado, hay una gigantesca actividad de creación de materiales disponibles para cualquier persona con acceso a la Red. Y también un increíble movimiento de generación de contenidos por parte de los usuarios, dentro de lo que se ha dado en llamar Web 2.0.

Este es el panorama, brillante y complejo y confuso, que vamos a intentar esbozar.

 

 

I: Átomos

 

Libros

España produce al año unos 70.000 títulos. Muchos se venden en Hispanoamérica o en países con población hispanohablante, aunque esta exportación ha disminuido recientemente. Los receptores más importantes son: México, Argentina, EE.UU. y Colombia, según la Federación de Editores de España.

La América hispanohablante (con diez veces la población española) publica grosso modo tantos libros al año como España, sobre todo en Argentina, Colombia y México. La edición americana está muy marcada por nuestro país: en el 2006 una cuarta parte de los libros editados en América eran de autores españoles, según el CERLALC, mientras que a la inversa es posible que no lleguen ni al 3%. Una de las razones es que abundan las filiales americanas de grupos españoles: Océano y Santillana tienen editoriales prácticamente en todos los países americanos. Hay también, con menor peso global, editoriales de la otra orilla actuando en España: el mexicano Fondo de Cultura Económica, la colombiana Norma, o la argentina Katz Editores.

Los intercambios son también desiguales: el 20 % de las importaciones de libros que realizó Latinoamérica durante el año 2008 fueron de origen español, mientras que las exportaciones de estos países a España fueron de apenas un 2%.

Esto en cuanto al papel; en dos apartados inmediatos analizaremos qué ocurre con la versión digital de los libros sin derechos, y de las obras con copyright

 

Revistas culturales de España bajo la forma de tabla periódica
Fuente: Anatomía de la edición

Revistas

El mundo de las revistas culturales es peculiar. Su canal clásico ha sido, por una parte, la suscripción, que se ha visto comprometida por la fiabilidad decreciente de los servicios de correo en distintos países. El otro ha sido la venta en librerías de calidad, desgraciadamente también en disminución.

ARCE, la asociación de revistas culturales de España, reúne 110 cabeceras de todos los temas: arte, literatura, cine, música, política... La inmensa mayoría tienen además versión, sobre todo parcial, en la Web. En América también hay destacadas revistas: las mexicanas Artes de México (un lujo de edición), o Replicante. En Colombia están El Malpensante y Número y en Perú Etiqueta Negra. Argentina tiene Otra parte, La mujer de mi vida, y el veterano Diario de poesía, un tabloide de venta en kioskos. Algunas tienen contenidos parciales en la Web.

La única revista en papel que se edita en ambas orillas de la lengua es Letras Libres, fundada en México en 1999, con edición española desde el 2001. Publica en su web los contenidos de ambas ediciones.

¿Funciona bien el intercambio de autores entre la península y América? Manuel Ortuño, presidente de la asociación ARCE, opina: "no hay estudios, pero tengo la impresión de que hay muchísimos más latinoamericanos publicando en revistas españolas que a la inversa". Los artículos que publicó Letras Libres en sus primeros diez años fueron el 40% de autores mexicanos, y el 25% de otros hispanohablantes.

Normalmente es difícil comprar revistas españolas en América, o americanas en España. Un caso reciente, el de la revista Orsai de Hernán Casciari, ha intentado superar las dificultades de la distribución física contando con la complicidad de los lectores y de los libreros.

Analizaremos la situación digital de las revistas en otro apartado.

 

 

II: Bitios

 

¿Qué ocurre cuando se encuentran la lengua y la tecnología? ¿Qué nuevos papeles adquieren una y otra? ¿Cómo se usan las lenguas en el medio digital y para qué? ¿En qué aspectos influyen? ¿Cuáles están más presentes y cómo? ¿Qué posición ocupan las lenguas que nos son más próximas en este contexto? La respuesta es cada vez más complicada, desde que empezamos a ocuparnos de estas cosas, allá por el lejano 1997. Sabemos (o creemos saber) qué son las lenguas, pero qué comprende el universo tecnológico está cada vez menos claro, en este continuum en el que aparecen ordenadores, teléfonos móviles, televisores y consolas por los que circulan juegos, videos, imágenes, voces y textos, públicos, semipúblicos y privados, gratis y a la venta.

 

En la Web abierta

Comencemos por lo que paradójicamente quizás conozcamos mejor: la Web. Mejor dicho, lo que hoy llamaríamos Web 1.0, compuesta en su mayoría por páginas estáticas y en la que durante años ha predominado el texto.

Hasta aproximadamente 2007 se podía tener una idea de cómo estaban la páginas web accesibles a los buscadores (la llamada Web Profunda quedaba de todas formas al margen de ellos). Utilizando los motores de búsqueda comerciales ¾primero Altavista y luego Yahoo y Google¾ se podía estimar la cantidad de páginas relativa de cada lengua. Esto se hacía siguiendo una metodología que creó Funredes, mediante la detección de palabras que sólo existen en una determinada lengua (este sistema dejaba de lado, entre otros, el chino y el japonés, que no utilizan el alfabeto latino). Así, en 1998 el inglés era el 75% de la Red en caracteres latinos, y desde entonces su proporción no dejó de bajar, básicamente porque se iban incorporando a Internet hablantes de otras lenguas. Hacia el 2007, el inglés había bajado a un 45% y el francés (4,41%) seguía superando al español (3,80%)... y esto es lo máximo que se pudo saber. Los buscadores (básicamente Google) dejaron de proporcionar registros de cualquier rincón de la web, para centrarse en resultados del ámbito local del usuario, de su lengua, y relacionados con su historial de búsquedas... En otras palabras: ya no se podían utilizar para saber qué pasaba "en la Web".

Hay que señalar que sobre este tema con frecuencia se manejan estadísticas impresionistas, realizadas sin una metodología clara, pero que aportan cifras halagüeñas para las políticas triunfalistas sobre el nuestra lengua. Un informe del 2009 atribuye al español en Internet la tercera posición mundial por número de páginas (675 millones)... Hay que insistir: hoy por hoy no parece haber modo de averiguarlo.

La falta de estos datos actualizados impide un interesante ejercicio que practicó Funredes: relacionar el número de páginas Web por idioma con el número de hablantes. Esto nos da una medida del vigor de los hablantes de cada lengua en la creación de páginas: en el 2007 el inglés tenía una presencia ponderada de 4,4, el francés de 2,24 y el español de 0,63. En otras palabras, los anglohablantes producían siete veces, y los franceses tres veces y media más páginas que los hispanohablantes.

Otra interesante comparación es la productividad de los espacios Web: ¿qué países dentro de la hispanofonía producen más páginas? En la última medición realizada, España figuraba en cabeza, a gran distancia de los demás, seguida por Cuba y Nicaragua. Aparte de la acción de la instituciones (de la que pronto veremos algo), parece que los españoles siguen creando páginas web: en la última Encuesta AIMC a Usuarios de Internet (octubre-diciembre 2009, realizada por la misma entidad que lleva a cabo el Estudio General de Medios) el 16,3 % de los entrevistados declara tener página personal.

Hay otros datos objetivos que pueden manejarse. Uno sería estimar qué parte de la poblacion hablante de una lengua usa Internet (para cualquier fin). Internet World Stats, por ejemplo, da al conjunto de los hispanohablantes el tercer puesto en número de usuarios de Internet (153,3 millones de usuarios), tras el chino (444,9 millones) y el inglés (536,6).

Llegados aquí, quizás sea el momento de dar un paso más: hay muchos usuarios, sí, pero ¿qué hacen? España tiene, por ejemplo, una implantación grande de la banda ancha, pero somos el país que, en proporción a sus habitantes, más uso hace de los servidores de The Pirate Bay para buscar archivos, normalmente, no autorizados. Acceso aquí no equivale a acción cultural, sino a consumo. Y esto es sólo un ejemplo...

Otro criterio es el número de servidores (ordenadores que suministran las páginas) por lengua. Un informe reciente señala que en la actualidad existen 339 millones de servidores en los dominios nacionales en los países que se habla español, aunque hay que recordar que no todas las páginas web están en dominios como .es o .mx, sino que muchos pueden estar en .com o en .edu. Además, no todos los dominios registrados en un país albergan sólo contenido lingüístico propio; por ejemplo, las universidades españolas e hispanoamericanas suelen tener una parte nada desdeñable de sus contenidos en la Web en inglés.

Y hablando de universidades, este es un colectivo al que se ha aplicado una interesante medida de la efectividad de su presencia en la Web. Desde hace años el Laboratorio de Cibermetría del centro de investigación de España, CSIC, analiza las webs de las universidades de todo el mundo. Se estudian la visibilidad (el número total de enlaces externos que apuntan a su sitio), el número de ficheros ricos (Adobe Acrobat o .pdf, Adobe PostScript o .ps, Word o .doc y Powerpoint o .ppt), y la presencia en Google Académico de artículos y citas. Es decir: es un estudio cualitativo, que no se limita a contar las páginas presentes.

Estados Unidos, en el primer puesto, tiene 106 universidades entre las primeras 200, 186 entre las primeras 500, y 360 entre las primeras mil. Alemania (en el segundo puesto) presenta, respectivamente, 17, 50 y 67, y estos son los datos para los primeros países hispanohablantes: España: 2, 27 y 43; México: 1, 2 y 5; Chile: 1, 1 y 3, y Argentina 0, 1 y 3.

 

Cultura digital compartida

Para cerrar el panorama de la web 1.0., hay que tener en cuenta una revolución que empezó lentamente, desde los mismos albores de la Internet: la digitalización del mundo de la cultura, comenzando por el de la comunicación escrita. Todo ello está migrando también hacia lo digital, aunque con distintos ritmos.

Desde las bibliotecas, se están digitalizando una parte de los 25 millones de obras que se estima que hay en el dominio público. Google Libros, que es el actor más importante, ha digitalizado trece millones de libros en esa situación, en un centenar de lenguas (incluidas las lenguas muertas: hay mucho latín en las bibliotecas clásicas...). No se sabe a ciencia cierta, sin embargo, qué cantidad de libros en español hay entre ellos. La Biblioteca Complutense de Madrid y la Biblioteca de Cataluña han incorporado fondos en el proyecto de Google, pero parte de ellos no estará ni en castellano ni en catalán. Inversamente, las grandes bibliotecas norteamericanas e inglesas digitalizadas tienen fondos en español y en otras lenguas peninsulares. En un muestreo al azar, la mayor parte de los libros en español de los siglos XVI-XIX que se localizan en Google provienen de bibliotecas de países no hispanohablantes.

Al lado de este gigantesco proyecto hay otros muchos de diferente envergadura, como el Internet Archive (2.500.000 libros) y el  Hathi Trust (1.583.000 volúmenes): ambos comprenden muchos libros de Google. Tampoco sabemos cuántos de esos son en español.

La tecnología básica para digitalizar y publicar libros en la Web está generalizada, pero cada proyecto puede aportar importantes diferencias en la selección de obras, el cuidado en el escaneado, en la transcripción automática (mediante OCR) o manual, en la creacion de metadatos, y en las herramientas de búsqueda sobre el acervo reunido. Hispana tiene más de 2,6 millones de documentos (libros, revistas, legajos, documentos sueltos...). El proyecto Gutenberg fue históricamente el primero, porque se remonta a 1971, y está basado en el trabajo de voluntarios. Contiene unos 300 libros en español, de un total de 33.000.

Entre los proyectos específicamente en español (y otras lenguas peninsulares) destaca la Biblioteca Virtual Miguel de Cervantes, creada en 1999. Ya contiene más de 60.000 libros, y es un buen ejemplo de construcción progresiva de un canon de obras literarias e históricas españolas e hispanoamericanas, de cuidado en la transcripción, y de creación de herramientas de búsqueda y explotación de los textos.

La Biblioteca Digital Hispánica, de la Biblioteca Nacional de España, dentro del proyecto de la Biblioteca Digital Europea, contiene 14.000 libros. Existen proyectos de menor tamaño, pero que cumplen necesidades concretas, como los americanos El Aleph, la Biblioteca Ayacucho Digital, versión en línea de la colección editorial venezolana, o la reciente Biblioteca Digital del Pensamiento Novohispano, centrada en textos publicados durante los siglos XVI, XVII y XVIII en México.

Estos son los libros en español que realmente pueden ser leídos sin fronteras (aparte, claro está, de las copias no autorizadas que circulan por la Red). Y cuando se aúna la calidad, la oferta, y la falta de barreras artificiales, todo el universo hispanohablante es el que disfruta de estas obras. La Biblioteca Virtual Miguel de Cervantes, que cuenta con importantes fondos españoles e hispanoamericanos, puede dar una pista: el 64% de sus visitas proviene de Latinoamérica.

En resumen: en obras en el dominio público, primero gracias a la iniciativa privada (Biblioteca Virtual Miguel de Cervantes y Google) y luego a las instituciones oficiales (Biblioteca Nacional), hay una amplia oferta disponible en español y otras lenguas peninsulares. Sin embargo, es de lamentar que las digitalizaciones que organismos públicos españoles efectuan con financiación pública aparezcan con más trabas para su acceso que las que proporciona una empresa privada: Google permite la descarga íntegra como facsímil o transcripción, lo que no es el caso en las obras de sitios oficiales. También es lamentable que se publiquen en la Web sin una licencia que pemita compartirlas y difundirlas, e incluso a veces aparezcan con un copyright que los saca del dominio público inicial. Esto es tanto más penoso cuanto que el esfuerzo de muchos particulares y de algunas instituciones, sobre todo de investigación, ha hecho que España sea el país con más obras bajo licencia Creative Commons.

 

Libros digitales

Existen, como hemos visto, una cantidad difícil de precisar de obras en español en el dominio público, volcadas en la Web abierta, pero la reciente popularización de los dispositivos dedicados a la lectura ha hecho aparecer un nuevo frente: obras con derechos de autor vivos, accesibles a través de un e-reader (como el Kindle), de un teléfono avanzado (como el iPhone), de un ordenador tipo tablet (como el iPad), o de un navegador Web. Son obras que están disponibles a cambio de una tarifa para descargarlos como archivos en los dispositivos de lectura o en ordenadores, o directamente desde "la nube", o almacenamiento remoto, como en Google Ebookstore, o el proyecto futuro de 24symbols.

De nuevo, este flanco ha comenzado con predominio inicial del inglés. Google Ebookstore tiene disponibles unos 2 millones de libros y los libros que Amazon ha puesto en Kindle andarán por los 670.000 (ambos conjuntos deben compartir numerosos títulos). En iBook (para iPhone o iPad) hay 30.000 libros disponibles. En estos tres conjuntos habrá libros en español, pero no sabemos cuántos.

En E-libro.com (distribuidora sólo para bibliotecas, en español) hay 38.000 libros a la venta. En el mercado abierto, en Bubok (libros autopublicados) hay 30.000, y en Grammata, 23.000 (ambos conjuntos comprenden también libros sin derechos). La distribuidora digital Publidisa declara 20.000 libros y Libranda (la unión de un conjunto de editoriales con acción en España y en Latinoamérica) proporciona acceso a unas 4.000 obras.

En los sistemas para compartir archivos entre particulares (P2P), y en sitios de descarga ilegal hay también una gran cantidad de obras (best-sellers, literatura actual, ...) difícil de determinar, pero hay indicios de que en español son muchos millares.

En obras actuales, con copyright vigente, las cifras de obras disponibles son muy bajas, aunque crecientes: los libros en “edición electrónica” editados en España entre enero del 2005 y septiembre del 2010 son 50.000, lo cual está en torno al 8% del total de los editados en el periodo, pero de ellos la cuarta parte, 12.839, se han publicado en los primeros 9 meses del 2010. Este conjunto no comprende casi obras de narrativa y best-sellers (que son los más leídos en e-readers). Como la cifra de estos dispositivos en el mercado va creciendo poco a poco, la descompensación entre demanda y oferta es muy grande, y los lectores la suplen descargando ediciones no autorizadas.

Hay que recordar que aunque Internet no tiene fronteras, los derechos de autor que adquieren las editoriales, sí. La versión en e-book de una novela sólo podrá venderse en España, o sólo en México, o cualquier otra restricción geográfica. Por ejemplo, los 4.000 libros que comercializa la distribuidora de libros digitales Libranda, que agrupa importantes editoriales españolas, están dirigidos a su mercado local, aunque en el futuro planea distribuir también con licencia americana.

 

Prensa y revistas culturales

Nuestra prensa digital ha ocupado desde hace años un lugar destacado por su presencia en la Web: en 1999 se difundió el dato de que el español era, después del inglés, la lengua que más diarios digitales tenía. En los últimos diez años se ha duplicado, hasta registrar 850 diarios en 2009, siendo México, España y Argentina los países donde se ha producido un mayor incremento de cabeceras digitales.

Antes hemos visto que hay numerosas revistas en papel que están disponibles, total o parcialmente, gratis en la Web. Una trayectoria típica es la revista que empieza en papel, pasa a estar también en la Web y por último, a estar sólo en la Web. Este es el caso de La Factoría, revista catalana de pensamiento social, fundada en 1996. En 1997 empezó a colgar sus contenidos en Internet y desde el 2008 es totalmente digital. En su etapa de papel tenía ligeramente más suscripciones en España que en América, y la proporción se ha mantenido en la Web: 50% de visitas desde España y 40% desde América. Dado que las revistas suelen encargar los artículos que publican, sus derechos digitales (a diferencia de los de los libros) no tienen por qué tener límites geográficos.

Hay excelentes revistas gratuitas puramente digitales, como Revista Digital Universitaria, mexicana mensual, que existe desde el 2002, con temas monográficos: el último, "Filosofía del Renacimiento". Otras son la española Narrativas, trimestral, activa desde 2006, dedicada a la ficción española y latinoamericana, o la argentina mensual Otro cielo, nacida en el 2009. Ambas están editadas en PDF.

Las revistas culturales españolas en papel, agrupadas en ARCE, se han unido para vender sus números en forma digital: la mitad del centenar largo de las revistas de la asociación están a la venta para todo el mundo en Quiosco cultural.

¿Y cuántas revistas puramente digitales habrá? Sí, hay una Asociación de Revistas Digitales de España, pero sólo cuenta con ocho miembros: algunas son nativas digitales, pero otras han nacido en el papel. Itinerario, "directorio cultural de Hispanoamérica", lista unas 300, tanto americanas como españolas, que se podrían considerar como culturales. Muchas no serían revistas desde un punto de vista legal: por ejemplo, carecen de ISSN, el identificador internacional para estas publicaciones. Se trata de webs o blogs con pretensiones de cierta periodicidad, pero puede haber muchas. Si uno introduce en Google la expresión "revista digital" o "revista on-line" se topará en total con 348.000 resultados para España y 310.000 de países hispanohablantes. En un muestreo, más de la mitad son páginas web autodefinidas como “revistas digitales”, o “revistas on line“. Pueden tratar sobre paisajismo, gastronomía, poesía o circo, estar dedicadas a un continente, a una región, al culturismo, a la apicultura, ser medios de difusión de comunidades protestantes, de lesbianas o de aficionados a la lucha libre o a la ciencia ficción. Los países más activos en Web parecen ser España, Argentina, y a mucha distancia México y Chile.

Además, existen sitios web y blogs colectivos en español, que no se autoconsideran revistas (y probablemente ni falta que hace) pero ofrecen periódicamente obras y reflexiones sobre la cultura.

Y una pregunta interesante es: ¿quién lee estos sitios?, ¿público hispanohablante de cualquier país? Lamentablemente, creo que no: están confinados a sus comunidades de origen. A la espera del estudio serio que merecen, se observa que estos blogs argentinos, mexicanos o españoles presentan comentarios (que son, muchas veces, la única pista sobre sus lectores) sólo con los rasgos lingüísticos de su entorno. Google, puerta de acceso a cualquier tema, que antes nos devolvía resultados de todas las esquinas de la Web, cada vez es más local en sus búsquedas, y eso nos priva del placer de la serendipia, del hallazgo casual de una perla escrita en cualquier región de nuestra lengua.

 

Audiovisual

Películas y programas de televisión también están llegando en grandes cantidades a Internet: en forma de fragmentos a YouTube o íntegramente en programas de P2P o en webs de descargas. No: nadie sabe cuántos contenidos en español hay en estos sitios.

Por cierto, la difusión de estas grabaciones ha generado una proliferación de archivos de subtítulos, en muy distintas lenguas. En uno de los mayores sitios que los agrupa, SoloSubtítulos, se pueden encontrar en español 34.000 para películas y 31.000 para series televisivas (cada episodio de una serie cuenta como una unidad). Normalmente estos subtítulos son creados por fans, que se agrupan en sitios como Wikisubtitles, hoy cerrado.

Vale la pena recordar además que una parte importante del patrimonio audiovisual en español está en manos del Estado. Este es el caso del noticiario No-Do, que se emitió semanalmente entre enero de 1943 y mayo de 1981), y que custodia la Filmoteca Española: resulta lamentable que no esté disponible íntegramente en la Red. Quien quiera conocer su contenido deberá visionarlo en sala de proyección (únicamente en Madrid, y pagando), y su reutilización, de pago también, está sujeta al permiso administrativo de la institución, según sus criterios.

La música en español también está presente en todas las grandes plataformas de venta digital (por ejemplo, iTunes), en cantidades ignotas, y asimismo en las redes de intercambio entre particulares (P2P) y webs de descargas.

 



Randall Munroe, Updated Map of Online Communities

Web 2.0

Pero la mayor revolución de los últimos años es la llamada Web 2.0: aquella en la que los usuarios son creadores de contenidos (en blogs, wikis, chats, tweets...) y se agrupan en comunidades virtuales (Facebook, Tuenti, ...). Parte de estos mundos están en rigor fuera de la Web: por ejemplo, las comunidades de redes sociales, y las partes privadas de comunidades mixtas, como Flickr.

Resulta realmente difícil conceptualizar este complejo universo, y por eso hay que agradecer al dibujante Randall Munroe que lo haya cartografiado. Su Mapa de Comunidades en Línea (Updated Map of Online Communities) es ni mas ni menos que una representación del Continente de la Lengua.

La mayor parte de la superficie está cubierta por la Lengua Hablada; aunque nuestra cultura es muy centrada en la palabra escrita, conviene recordar dónde empezó todo, y dónde se manifiesta más la lengua. Pues bien: hacia el sur hay una vasta área rotulada como Teléfonos Móviles, con su península, los SMS. Justo al lado está el territorio de la Internet, en el cual, y en una primera aproximación (el mapa se desarrolla en cuatro zooms) sólo se distingue por su tamaño la zona de los Emails. Los correos electrónicos son uno de los medios de comunicación más antiguos de la Internet, y, la verdad, nunca he visto cifras fiables de su volumen en español.

El espacio que ocupan los móviles o celulares es casi el triple de de los emails. En el ingenioso mapa de Munroe los tamaños representan el "volumen de actividad social diaria (post, chat, etc.)", de modo que nos está diciendo que se producen el triple de llamadas que de correos enviados.

 

 

Si continuamos el zoom, vemos que al sur de los emails está el territorio y la bahía de Facebook. Es más pequeño que el de los correos electrónicos, pero está creciendo: los jóvenes, como mis hijos, sólo se comunican por Facebook (o SMS), hasta tal extremo que tengo que insistirles en que comprueben periódicamente su correo, por el que a veces les mando recordatorios de cosas que tienen que hacer. No me da la gana enviarles SMS, que cuestan poco, pero cuestan, y no todos mis hijos me tienen como friend en Facebook...

Facebook tiene unos 500 millones de usuarios en todo el mundo, de los que unos 10,5 millones están en España. En su territorio están las Llanuras de Interacciones Familiares Extrañamente Públicas o las montañas de la Gente de la que No Puedes No Ser Amigo. Pero también tiene zonas extremas, como el Desierto Septentrional de Updates sin Leer o el Yermo Carbonizado de Redes Sociales Abandonadas, que limita al sur con territorios menores: Orkut, Linkedin, MySpace... Facebook comprende también FarmVille, que con sus 81 millones de usuarios es el juego más utilizado de esa red social. FarmVille se juega en un navegador de web, pero también hay aplicación para iPhone (a la proliferación de espacios de interacción se une la de dispositivos). Los territorios de los juegos están bañados por el Mar de la Dopamina, el neurotransmisor responsable de las adicciones...

 

 

Bajo la zona de las redes se extiende el Mar de Opiniones, poblado por multitud de islas. Está por ejemplo el Archipiélago de los Blogs, con la isla de los Blogs Religiosos y Misceláneos (que linda al SW con el Mar de los Cero Comentarios), y la isla de los Blogs Políticos, Técnicos y Musicales. El Archipiélago de los Blogs es grande, con sus 126 millones de microterritorios. ¿Cuántos habrá en español? Se citan 166.000 sólo en España (la Encuesta AIMC a Usuarios de Internet, octubre-diciembre 2009, declara que el 17% de sus encuestados tienen blog, y lo actualizan frecuente u ocasionalmente), pero además está toda América...

Al Este se encuentra la isla de Youtube, con la gran Bahía del Video Musical. YouTube tiene mundialmente 48,2 millones de usuarios. No tenemos buenos datos de cuántos son hispanohablantes, pero en Encuesta AIMC a Usuarios de Internet, octubre-diciembre 2009 (España), el 8,7 de los entrevistados había subido videos a la Web. Aunque hay que tener en cuenta que muchos hispanohablantes subirán videos en inglés, por ejemplo.

La siguiente isla, de un tamaño casi el doble, es Twitter, con sus 75 millones de usuarios, de los que se estima que 800.000 están en España.

Al lado hay un conjunto de pequeñas islas, como las Páginas de Chat de la Wikipedia o Delicious, que ya se encuentran propiamente en el Mar de los Memes. Este gran mar contiene, por cierto, el Archipiélago de los Foros.

 

 

Al SE de Twitter, y separado por el Mar de Confusión de Protocolos (propiamente un Estrecho) está la gran isla de Skype: es el espacio de la telefonía IP, cuyos componentes siguen el Internet Protocol. No es una tontería: con más de 42 millones de usuarios activos por día, Skype ocupó en el 2010 el 13% de las llamadas telefónicas internacionales. En territorios próximos (pero muy inferiores en tamaño) están Google Talk o Windows Live Messenger.

Para terminar este panorama es forzoso comentar que al SE, y separado del resto por el Gran Cortafuegos, se encuentra China, con su gigantesco QQ, servicio de mensajería instantánea que incluye juegos, tonos de llamada para móviles y un sinfín de cosas: su tamaño excede el de Twitter.

Como se ve, estamos ante un esfuerzo gigantesco de cartografía, aunque siempre se habrán dejado cosas de lado, Por ejemplo: no figuran los comentarios a blogs ajenos o a la prensa digital; una buena parte del 20,5 % de los entrevistados de la Encuesta AIMC a Usuarios de Internet de España que declaraba haber subido textos a la Web corresponderá a ese tipo de intervención. O también las interacciones escritas entre co-jugadores de juegos en línea (tipo Call of Duty). No hay mapa que contenga todo...

Lenguas en la Web 2.0

Y ya es hora de introducir la variable lingüística en la Web 2.0. Despleguemos el mapa de Comunidades de Munroe y ahora hagamos la pirueta mental de saltar a la tridimensionalidad, superponiéndolo sobre sí mismo dos mil veces. Cada plano corresponderá a una lengua, en su presencia digital, empezando por la más hablada, el mandarín, y llegando hasta alguna de las lenguas indígenas de la Amazonia, en la que quizá alguno de sus cientos de hablantes ha dejado su huella en el continuum ciberespacial. (El número total de lenguas utilizadas en el mundo es discutido, pero como estamos hablando de presencia digital nos hemos situado por debajo del umbral inferior).

En cada plano, los mapas y sus territorios se redimensionarían. Por ejemplo, en el espacio del portugués crecería mucho la posición relativa que la red social Orkut ocupa entre sus análogas, gracias a la actividad de Brasil. Asimismo, aparecerían comunidades virtuales nuevas que en la cartografía de Munroe ni existen. Por ejemplo, en español surgiría Tuenti y en el plano del catalán aparecería VilaWeb. Algunos espacios estarían presentes en cualquier lengua: por supuesto el email, pero también Facebook. Habría que estudiar, lengua por lengua el uso que se da por ejemplo a los blogs (¿profesionales, de afición?) y a las redes sociales: muchas editoriales y bibliotecas de países hispanohablantes tienen presencia en Facebook, por ejemplo. Pero esta es una tarea para el futuro...

Un espacio común a muchas lenguas es la Wikipedia: 278 lenguas tienen una (algunas, incipientes, con unas pocas decenas de entradas). Por producción, figura en cabeza el inglés, con 3,4 millones de artículos, y le sigue el alemán (1,1 millones), el francés (1,02), el polaco y el italiano (0,74), el japonés (0,71) y por fin el español (0,66, es decir 660.000 artículos). El catalán tiene 290.000 entradas, el gallego 64.000 y el vasco 59.000.

Wikipedia es un perfecto indicador: como obra en manos de voluntarios, refleja bien la preocupacion de los hablantes de las distintas lenguas por poner a disposición de sus homólogos una fuente tan importante de conocimiento. Como el español se extiende entre América y Europa con unos 440 millones de hablantes, sus 0,66 millones de artículos significan una productividad cuatro veces inferior a la de los alemanes, con sus 200 millones de hablantes y 1,1 millones de artículos.

Atravesando las capas de nuestro mapa tridimensional ideal habría una serie de hilos que unen un plano con otros varios: son los hablantes que se desenvuelven, activa o pasivamente (en este último caso como oyentes o como lectores) en más de una lengua. Mis amigos de Facebook se expresan en castellano, inglés, catalán, francés o alemán, pero yo suelo intervenir en la primera de estas lenguas. Sigo tweets en castellano, inglés, catalán, italiano, francés o portugués, e intervengo sobre todo en español, aunque mis retweets pueden ser en cualquier lengua.

Hay espacios que reciben multitud de hilos de los otros planos: el espacio del inglés, que es el de la cultura dominante, y al que acuden usuarios de multitud de lenguas (adolescentes argentinos que siguen la liga de la NBA o franceses que ven videos en YouTube). Y hay espacios, como el del español, que producen mucha menos informacion de la que van a buscar.

Hay hilos verticales permanentes, pero otros surgen esporádicamente, y apenas duran unos minutos. Representan las traducciones automáticas a las que apelan las personas que no conocen una lengua pero que han localizado en ella algún material (de momento escrito, pero pronto eso cambiará) de interés potencial. El español está presente, como lengua origen o como lengua meta prácticamente en todos los traductores accesibles en línea. El más amplio de ellos, el de Google, comprende entre sus 57 lenguas, las cuatro lenguas cooficiales de España.

 

Para hablar con las máquinas

Hasta aquí estábamos hablando de las lenguas como una propiedad de los contenidos: por eso hablábamos de e-books en inglés, o chats de Facebook en español, pero los traductores nos han introducido en un universo nuevo: los programas que manejan la lengua natural como una herramienta para la comunicación entre las personas.

Aparte de los traductores, hay otras muchas herramientas lingüísticas (y no todas las lenguas de la Tierra, ni mucho menos, disponen de ellas). La pregunta que deberíamos formularnos los hablantes es triple: ¿existen programas lingúísticos que hagan las cosas que necesitamos en nuestra lengua? Si no existen, o no existen para todo lo que querríamos, ¿nuestras instituciones y empresas tienen los medios para desarrollarlos? Y si estos medios existen: ¿en qué manos (propias o ajenas) está su explotación? Los hispanohablantes, por ejemplo, tenemos medios para desarrollar tecnologías lingüísticas, pero infrautilizados, de modo que en la práctica estamos pagando por usar nuestra lengua en el ámbito digital.

¿Qué herramientas lingüísticas utilizamos? Los correctores de ortografía y gramática, los diccionarios de sinónimos, y otras ayudas lingüísticas ligadas a un procesador de textos. Pues bien: Microsoft Office, que incluye el famoso programa Word, tiene herramientas para unas cuarenta lenguas (hace año y medio figuraban 50), entre ellas el español y las lenguas cooficiales de España. Se da el caso curioso de que casi todas estas se llevaron a cabo porque instituciones semipúblicas (como la Real Academia) o públicas (gobiernos autonómicos) han pagado a Microsoft, o han colaborado con esta empresa, para que sus programas (que luego, por supuesto, están a la venta) tengan ayudas en esas lenguas.

También nos pueden ayudar en las búsquedas. Google tiene interfaces en 140 lenguas y variantes de escritura (entre otras, las que nos son más cercanas). Esto significa que un hablante de cualquiera de ellas, por ejemplo de español, puede hacer búsquedas incluso escribiendo mal una palabra, y el buscador sabrá enmendarle. También le propondrá sinónimos de las palabras buscadas, o sus traducciones. La lengua natural escrita se ha convertido aquí en una herramienta para comunicarse con los dispositivos automáticos.

Los softwares lingüísticos nos pueden ayudar a convertir las obras en papel en texto digital buscable y comunicable, ligados a la digitalización de libros y periódicos a través de los programas de reconocimiento óptico de caracteres (OCR). Pues bien: el escaneo de libros de Google Libros y posterior OCR tiene en cuenta las peculiaridades de 430 lenguas diferentes, entre las que sin duda están el castellano y el catalán.

También hay diccionarios en línea que asisten al lector de una web o de un texto en un teléfono móvil, proporcionándole el sentido o la traducción de la palabra que ignora. De nuevo, esto exige una cierta tecnología lingüística, por ejemplo para pasar de una forma conjugada de un verbo al infinitivo (que es como figura en el diccionario).


Pantalla de los créditos del iPhone

 

Por último, hay herramientas que facilitan el uso de la lengua escrita también en los teléfonos móviles: la predicción de palabras a partir de pulsaciones de los pequeños teclados y la corrección de las palabras en los SMS exigen programas específicos, que normalmente, en el caso del español, no han sido creados por empresas de países hispanohablantes: el iPhone los tiene para el español y para el catalán, y leemos en la página de créditos del dispositivo: "IntelliWriter ProofReader Spanish text proofing software © 2002 by Vantage Research. All rights reserved".

¿Esto es todo? Me temo que no: la siguiente frontera, en la que ya hay implicados numerosos dispositivos y algunas lenguas, es usar la voz como entrada para buscadores (por ejemplo en un teléfono móvil), para traductores, y en general para dar órdenes a los dispositivos del hogar que ¾se nos dice¾ acabarán integrándose en ese vasto continuum de aparatos conectados a la Internet...

 

 

     


Publicación en esta web, 6 de enero del 2011
Últimas correcciones, 9 de enero del 2011

 

 

salida