Guardando la WWW

16 noviembre 2007 10:10


Archive-It es un proyecto del bien conocido Internet Archive, que colabora con instituciones para que éstas decidan qué sitios web archivar. Como es sabido, el Internet Archive recolecta webs según ciertas pautas (el azar, o la propuesta de sus gestores), a las que luego se puede acceder mediante la WayBackMachine. Archive-It hace acuerdos con instituciones para que éstas archiven por sí mismas no sólo sus propios materiales, sino también los materiales ajenos que consideren valiosos (en principio, cualquier página web que no tenga una indicación robot.txt para que no sea recolectado por los buscadores se puede archivar).

Las recolecciones de las distintas instituciones pueden constituir colecciones diferenciadas. Por ejemplo, la California Digital Library ha archivado varias decenas de webs (desde oficiales hasta blogs) relacionadas con los recientes fuegos de California.

Las instituciones que colaboran con Archive-It pueden también encargar recolecciones específicas. Por ejemplo, la Library of Congress ha pedido a la Electronic Literature Organization (fundada, entre otros por el novelista Robert Coover, y que se ocupa de expresiones literarias que no serían posibles fuera del medio digital) que reúna una muestra de 300 sitios web que contengan o recopilen este tipo de obras (cuenta if:book).

Libros escolares históricos

11 septiembre 2007 17:17

Una de las muchas cosas que estoy sacando de la asistencia a Litterae X: conocer el proyecto MANES de recopilación y puesta en la red de manuales escolares españoles, portugueses y latinoamericanos de los siglos XIX y XX.

El archivo de A. A. Knopf

09 septiembre 2007 9:09

1526 cajas constituyen el archivo de la editorial norteamericana Alfred A. Knopf entre 1873 y 1996, que custodia el Harry Ransom Humanities Research Center de la Universidad de Texas en Austin.

Entre otras joyas de la historia cultural e intelectual del periodo, están los informes y las cartas de rechazo de originales, sobre las que hace un reportaje David Oshinsky en el New York Times; “No, thanks, Mr. Nabokov“. Por ejemplo, el informe que calificaba de

aburrido registro de típicas minucias familiares, molestias triviales y emociones adolescentes

al Diario de Ana Frank (rechazado por otros 15 editores antes de su publicación en Estados Unidos, todo hay que decirlo). No se libran de juicios de este estilo Jorge Luis Borges (“completamente intraducible”), Isaac Bashevis Singer (“Otra vez Polonia y judíos ricos”), Jack Kerouac (“Su prosa frenética y mezclada expresa perfectamente los viajes enfebrecidos de la Beat Generation. Pero, ¿es eso suficiente? Creo que no”) y la Lolita de Vladimir Nabokov.

Es fácil escandalizarse por estos rechazos, vistos en el pasado, pero el negocio editorial tiene esos riesgos, aunque nuestro rechazo más famoso, el de Cien años de soledad, parece ser sólo un bulo.

Lo que es realmente escadaloso es que esta posteridad de investigación sobre un sello editorial (y por tanto, sobre la cultura de la época en la que tuvo su actividad) está negado, salvo excepciones, a las editoriales españolas e hispanoamericanas, cuyos archivos están condenados (¿irremediablemente?) a ir a parar a un vertedero.

Los “Pasajes populares” de Google Libros

08 septiembre 2007 11:11


Entre las mejoras de Google Libros que reseñé ayer pasé demasiado rápidamente por la herramienta “Pasajes populares”.

Es un rasgo que presentan algunos libros (no todos), y aparece en la columna de la derecha, debajo del Índice. A partir del texto digitalizado de un libro, Google analiza la presencia de terminadas frases en otras obras de su base de datos. Así, podemos ver qué libros citan esta preciosa frase de la Exposición del Libro de Job, de Fray Luis de León:

las escrituras que por los siglos duran nunca las dicta la boca, del alma salen, adonde por muchos años las compone y examina la verdad y el cuidado.

Las obras en las que aparece esta frase pertenecen tanto a la categoría de “Vista completa” (donde se encuentran por lo general libros en el dominio público), como otros en “Vista previa restringida”. El usuario puede escoger ver una u otra categoría de libros. Se encontrará también, como ocurre a veces en Google Libros cuando el propietario lo ha querido así, con casos en que el sistema informa de que la frase está en una determinada página de una determinada publicación, pero no se da acceso a ella. (Hay un pequeño bug: al lado de la página del libro se dice que esta frase está presente en 20 obras, pero al pedir el listado salen sólo 16).

¿Qué aporta esta herramienta? Su utilidad depende muy directamente de a) la cantidad de obras en español que haya en Google Libros (cifra que no se conoce); b) la calidad de estas obras; c) el arco temporal que abarquen (cuanto mayor sea éste, mejor para los resultados) y d) la calidad el OCR, es decir de la digitalización del texto. En general, permitirá discernir por un lado corrientes de pensamiento comunes: personas que citan a las mismas fuentes a lo largo del tiempo; por otro, dará acceso a la literatura erudita que ha tratado de determinado aspecto de un autor.

El blog oficial de Google da un bonito ejemplo sobre la cita de una conocida frase de Newton (en la que se considera como un niño jugando con conchitas, mientras a sus espaldas se abre el gran océano del saber), que recorre cientos de libros a lo largo de dos siglos…

Extraño caso de cuneiforme véneto

30 agosto 2007 20:20


Errando por las calles de la bella población de Feltre, en el Véneto, mis ojos se detuvieron en unas placas de mármol que, a primera vista, daban la impresión de estar grabadas en una escritura desconocida. Era una especie de cuneiforme menudo y rabioso, que no pude identificar, ¿sería una muestra del antiguo lenguaje de la zona, el venético? Calle tras calle, casa tras casa, las lápidas emitían su ininteligible mensaje.

Por fin, la vista de un altorrelieve con el León de San Marcos destruido a martillazos me dio la clave: las tropas de Napoleón, que ocuparon la región en 1797, habían censurado las muestras de adhesión a la República de Venecia en muchos de los lugares por donde pasaron. Igual que la efigie del león alado, las inscripciones que expresaban la fidelidad de Feltre a la República habían caído bajo la piqueta. Al destruir las letras, preservando sin embargo los adornos grabados y las mismas lápidas, los anónimos censores habían manifestado la misma fe que quienes las habían trazado: que las letras esculpìdas en piedra representan la permanencia de las ideas que cobijan.

Historia de la Editorial Joventut/Juventud

30 agosto 2007 19:19

Hace poco más de un año se presentó en la Universidad de Barcelona la tesis doctoral de Mònica Baró Llambias Les edicions infantils i juvenils de l?Editorial Joventut. 1923-1969. Por fortuna, está toda disponible en el sitio de Tesis doctorals en xarxa, donde no sólo hay tesis de universidades catalanas, sino también de otros lugares de España (gracias a Silvia Senz por la noticia).

Los estudios sobre la edición contemporánea española están aún a un nivel muy inicial. El panorama es prácticamente el mismo que señalaba aquí al lado hace pocos años José Antonio Cordón. A los factores intrísecos que señala este mismo autor (falta de interés del sistema de investigación por esta materia) se unen los extrínsecos: los archivos de las editoriales suelen ir a parar al cubo de la basura. Lo comentábamos hace poco a propósito de Iréne Nèmirovsky.

Pues bien, uno de los factores que han contribuido a hacer posible esta tesis es el hecho de que el archivo de la Editorial Joventut/Juventud se ha preservado en el Arxiu Nacional de Catalunya. Todo estaba allí: desde la documentación interna de control de la edición (que en alguna ocasión ha servido para asignar autoría a obras anónimas), hasta materiales publicitarios y promocionales (los catálogos que aparecen en la ilustración superior), pasando por correspondencia con autores, agentes, editores… En fin: toda la compleja actividad que supone la creación y el mantenimiento de una línea editorial.

La tesis contiene datos apasionantes tanto para los estudiosos de la edición en general como para quienes están interesados en la literatura infantil y juvenil. ¿Habrá que repetir una vez más el valor que tiene la difusión digital de estas obras de investigación?

Depósito Legal Digital

28 agosto 2007 10:10

Antes de su (poco llorada) dimisión, la directora de la Biblioteca Nacional de España, Rosa Regás anunció que preparaba una ley de Deposito Legal “para introducir y actualizar todo lo relacionado con la publicación electrónica y asegurar, además de la preservación nacional documental, la preservación digital”.

El Depósito legal es un procedimiento, ligado a la creación de las grandes bibliotecas nacionales, mediante el cual el editor deja cierto número de ejemplares de cada publicación. De ese modo, el Estado puede preservar la producción bibliográfica. Desde hace muchos años se viene hablando de extender este procedimiento también a las obras electrónicas, que en su momento aparecieron bajo la forma de CD-ROMs, entre otras. Las cosas de la legislación van muy despacio, tanto que si ahora se contempla este depósito en la Ley llegará tarde: la inmensa mayoría de la producción electrónica ya está en la Red, y no en soportes locales.

¿Se puede preservar la Red? Probablemente sí, pero el procedimiento, más que de Depósito Legal, parece ser de recolección o harvesting de lo que hay en la Web. Es lo que hace la Biblioteca Nacional de Cataluña, por ejemplo, en su proyecto PADICAT.

Bienvenido sea cualquier procedimiento de preservación de la inmensa masa cultural y documental que se está generando en forma electrónica, pero no caigamos en la tentación de adaptar instrumentos nacidos para otro fin, y cuya pertinencia para los nuevos medios es escasa. ¿Puede jugar la Biblioteca Nacional de España un papel eficaz en la gestión de la memoria electrónica? Sí, siempre y cuando no cometa errores graves en esa tarea, responda con agilidad a las necesidades reales y reciba los medios adecuados.

El blog que se apagó

22 agosto 2007 7:07

¿Donde van los blogs que se apagan? Como género, un blog es por definición infinito, o mejor dicho, indefinido hacia adelante: mientras las ganas y el cuerpo aguanten. No aguantó el de Pedro de Miguel, Peter.

Un post en el blog, que adivino hecho por mano ajena, contó el 12 de agosto que había fallecido en Pamplona. La verdad es que, como género periódico y muchas veces teñido de autobiografía, su blog algo había dejado traslucir: unos meses de silencio, una vuelta lenta a la publicación, y alguna confidencia, como la que contenía el post Animoterapia:

No estás del todo bien: debilidad, cansancio. Estás, vaya, hecho unos zorros. Entonces llega el optimista:

-Te veo bien.

Estás a punto de decirle que se limpie las gafas, que vaya al oculista, que tenga más pesquis, pero optas por poner tu peor cara, para infundir compasión.

-En serio, te veo mucho mejor que la semana pasada.

La semana pasada zampabas alubias, ibas al monte, leías incluso a Philip K. Dick.

-Además, hay que tirar para alante. Luchar.

No sé a qué se refiere el sano con lo de “luchar”. Se imagina que la enfermedad es como un combate de boxeo: te dan pero contestas, te tumban pero al caer le pones la zancadilla al rival. A un pastillazo respondes con un palíndromo.

-Pues mira -le dices al optimista-, estoy bastante jodido, lo que pasa es que me ves con buenos (y miopes) ojos.

Y entonces viene lo que más temes: la palmada en la espalda, el codazo cómplice en los riñones, el puñetazo cariñoso en el hombro:

-Venga, chaval.

La enfermedad es una lucha contra los sanos.

Le vi una sola vez en mi vida: me antologó en un par de ocasiones, nos enviábamos nuestros libros. No hace falta ver mucho a otra persona para sentirse próxima, incluso muy próxima a ella. Cuando descubrí que había hecho un blog me alegré mucho: así tenía ocasión de leer, con la periodicidad incierta propia de esas cosas, sus escritos, mínimos y bilbaínos. Sí, porque a pesar de titularse Letras enredadas y subtitularse Nudos de literatura entre la red y el papel hablaba realmente sobre lo que le apetecía, y sobre Bilbao. Alguna vez puse comentarios en su blog, y él lo hizo en el mío, y, cuando venía a cuento, nos citábamos: en fin, la típica relación entre dos escritores de la red.

Se acabó, pues. ¿Dónde van los blogs que se apagan? ¿Permanecen en ese sitio extraño y accesible mientras alguien (el administrador, un amigo, un pariente) los mantiene? ¿Duermen en algún archivo de sitios web? ¿O incrementan el número de enlaces muertos y páginas no disponibles que hace de la red un inmenso osario?

El escritor bronceado

17 agosto 2007 22:22

Lo vi por primera vez en Lisboa: el Pessoa en efigie sentado en un café. Lo he reencontrado en Triestre: el Joyce en bronce paseando junto al Gran Canal. Los dos, escritores poco leídos en vida, disfrutan una fama póstuma que incluye ahora su exposición a los elementos y a las fotos turísticas…

Preservación de datos antiguos

18 julio 2007 10:10

Leo en Bibioteconomía y Documentación (que sigue a NetYDea) que los National Archives ingleses han hecho un acuerdo con Microsoft para garantizar el acceso a documentos hechos con versiones antiguas de sus programas que corrían en versiones antiguas de sus sistemas operativos (por ejemplo, un Word 97 que corría en Windows 98). El sistema emulará en un PC actual configuraciones de sistemas operativos y programas de Office antiguos.

El problema del acceso a documentación digital del pasado es muy grande. Con la obsolescencia planificada que tienen los programas y sistemas operativos, no hará sino aumentar: constantemente aparecen nuevas versiones de Word o de Windows que muchas veces impedirán acceder a datos elaborados con versiones antiguas.

Para las instituciones que preservan documentación la solución no es pedir ayuda a los causantes del problema, sino más bien almacenar sus datos en formatos abiertos y accesibles, que permitan su recuperación bajo cualquier circunstancia.