La Knowledge Network del New York Times

14 septiembre 2007 12:12


¿Qué es un periódico? Una presencia diaria, pero también un almacén de textos, y sobre todo una plantilla y una red de contactos y colaboradores.

Como vienen tiempos extraños para la prensa tradicional (cercada por la prensa en línea y la gratuita, y por la misma existencia de la Web), los medios más conscientes están buscando alternativas. El New York Times comenzó por reforzar su versión en línea, que hoy en día tiene una alta calidad, y aporta soluciones y materiales que hemos valorado repetidas veces. A diferencia de otros medios, tiene un contenido exclusivo para suscriptores, Times Select, con cuarto de millón de usuarios que pagan menos de cincuenta dólares anuales, y que ha venido sufiendo numerosos rumores de desaparición.

Pues bien, el último movimiento (al que llegamos vía If:Book): su entrada en la enseñanza a distancia, con seis universidades como partners: la New York Times Knowledge Network. Los materiales del NYT servirán para la confección de materiales que sustituirán ciertos aspectos de los libros de texto.

Etiquetas: ,

Libros escolares históricos

11 septiembre 2007 17:17

Una de las muchas cosas que estoy sacando de la asistencia a Litterae X: conocer el proyecto MANES de recopilación y puesta en la red de manuales escolares españoles, portugueses y latinoamericanos de los siglos XIX y XX.

Etiquetas: , ,

El archivo de A. A. Knopf

09 septiembre 2007 9:09

1526 cajas constituyen el archivo de la editorial norteamericana Alfred A. Knopf entre 1873 y 1996, que custodia el Harry Ransom Humanities Research Center de la Universidad de Texas en Austin.

Entre otras joyas de la historia cultural e intelectual del periodo, están los informes y las cartas de rechazo de originales, sobre las que hace un reportaje David Oshinsky en el New York Times; “No, thanks, Mr. Nabokov“. Por ejemplo, el informe que calificaba de

aburrido registro de típicas minucias familiares, molestias triviales y emociones adolescentes

al Diario de Ana Frank (rechazado por otros 15 editores antes de su publicación en Estados Unidos, todo hay que decirlo). No se libran de juicios de este estilo Jorge Luis Borges (“completamente intraducible”), Isaac Bashevis Singer (“Otra vez Polonia y judíos ricos”), Jack Kerouac (“Su prosa frenética y mezclada expresa perfectamente los viajes enfebrecidos de la Beat Generation. Pero, ¿es eso suficiente? Creo que no”) y la Lolita de Vladimir Nabokov.

Es fácil escandalizarse por estos rechazos, vistos en el pasado, pero el negocio editorial tiene esos riesgos, aunque nuestro rechazo más famoso, el de Cien años de soledad, parece ser sólo un bulo.

Lo que es realmente escadaloso es que esta posteridad de investigación sobre un sello editorial (y por tanto, sobre la cultura de la época en la que tuvo su actividad) está negado, salvo excepciones, a las editoriales españolas e hispanoamericanas, cuyos archivos están condenados (¿irremediablemente?) a ir a parar a un vertedero.

Etiquetas: , ,

Los “Pasajes populares” de Google Libros

08 septiembre 2007 11:11


Entre las mejoras de Google Libros que reseñé ayer pasé demasiado rápidamente por la herramienta “Pasajes populares”.

Es un rasgo que presentan algunos libros (no todos), y aparece en la columna de la derecha, debajo del Índice. A partir del texto digitalizado de un libro, Google analiza la presencia de terminadas frases en otras obras de su base de datos. Así, podemos ver qué libros citan esta preciosa frase de la Exposición del Libro de Job, de Fray Luis de León:

las escrituras que por los siglos duran nunca las dicta la boca, del alma salen, adonde por muchos años las compone y examina la verdad y el cuidado.

Las obras en las que aparece esta frase pertenecen tanto a la categoría de “Vista completa” (donde se encuentran por lo general libros en el dominio público), como otros en “Vista previa restringida”. El usuario puede escoger ver una u otra categoría de libros. Se encontrará también, como ocurre a veces en Google Libros cuando el propietario lo ha querido así, con casos en que el sistema informa de que la frase está en una determinada página de una determinada publicación, pero no se da acceso a ella. (Hay un pequeño bug: al lado de la página del libro se dice que esta frase está presente en 20 obras, pero al pedir el listado salen sólo 16).

¿Qué aporta esta herramienta? Su utilidad depende muy directamente de a) la cantidad de obras en español que haya en Google Libros (cifra que no se conoce); b) la calidad de estas obras; c) el arco temporal que abarquen (cuanto mayor sea éste, mejor para los resultados) y d) la calidad el OCR, es decir de la digitalización del texto. En general, permitirá discernir por un lado corrientes de pensamiento comunes: personas que citan a las mismas fuentes a lo largo del tiempo; por otro, dará acceso a la literatura erudita que ha tratado de determinado aspecto de un autor.

El blog oficial de Google da un bonito ejemplo sobre la cita de una conocida frase de Newton (en la que se considera como un niño jugando con conchitas, mientras a sus espaldas se abre el gran océano del saber), que recorre cientos de libros a lo largo de dos siglos…

Etiquetas: ,

Bibliotecas digitales: seminario en Madrid

08 septiembre 2007 10:10

El VII Workshop de la Red de Bibliotecas Universitarias REBIUN sobre proyectos digitales, “La estrategia digital: ¿hacia dónde?” tendrá lugar en Madrid, el 18 y 19 de octubre del 2007, en la Universidad Nacional de Educación a Distancia, UNED.

Etiquetas: ,

Amazon y Google y el libro electrónico

07 septiembre 2007 20:20

El New York Times ha dado cuerpo a algunos rumores que circulaban insistentemente: que Google venderá el acceso completo a ciertos libros digitalizados, y que Amazon comercializará un e-book, dispositivo dedicado para la lectura, el Kindle.

Ambas afirmaciones figuran en el artículo “Envisioning the new chapter for the electronic books“. El Kindle, con tecnología de tinta electrónica y pantalla monocroma, se conectará de forma inalámbrica (todo ello no es una novedad, pues ya lo tiene el Iliad), y Amazon ofrecerá una suscripción a diversos periódicos a través del artefacto, que costará 400 o 500 dólares. La noticia recalca el pasado no muy brillante de toda una serie de libros electrónicos (RocketBook, SoftBook Reader), que nunca realmente llegaron a calar en el mercado.

Por su parte Google planearía servir, con el acuerdo del editor, y a un precio fijado por éste (que sería una fracción del precio del libro en papel), libros digitalizados.

La potencia de ambas compañías promete sin duda un animado futuro para los libros digitales.

Etiquetas: , ,

Incrustar desde Google Libros

07 septiembre 2007 10:10



Poesías de Juan Valera, Rivadeneyra, 1858


Google Libros ofrece interesantes novedades para comunicar su fondo de libros digitalizados con otras esquinas de la Web (llegué vía Dirson). En su barra de herramientas aparece un nuevo comando que sirve para seleccionar texto.


Una vez encuadrado el texto, se puede incrustar en un blog, o página web, ya sea como imagen (ilustración superior), o como texto electrónico (he metido los saltos de línea, pero no he corregido el OCR, que funcionó muy bien):

CON todos estos versos en la mano
Infeliz parto del ingenio mio
Que por ganar un nombre suda en vano
Imploro tu favor querido tío
Y ya que celebrándolos me animas
A tu benevolencia los confio
Ni lo raro y difícil de las rimas
Ni la pompa y estrépito sonoro
Que tú no tanto como el vulgo estimas
Ni de trasposiciones el tesoro
Que á la diccion poética se ajusta
Ni el circunloquio y púdico decoro
Con que la voz prosaica que le asusta
Envuelta en discretísima charada
Un buen poeta de encubrirnos gusta

Antes se podía, por supuesto, copiar una imagen, o seleccionar un texto electrónico de una obra, pero esta herramienta facilita la acción.

Además, se da la posibilidad de escribir reseñas (“Críticas”) de las obras. Como prueba, he creado una nota muy corta sobre el libro.

Y por último se crea la posibilidad de formar una biblioteca personal. Aquí está la que he empezado a allegar de obras del XIX. La biblioteca tiene un RSS, que permite a los interesados suscribirse a los cambios.

Además, sigue presente la sección de “Pasajes populares“, que informa de en qué otras obras (de Google Libros) aparecen determinados fragmentos del libro en cuestión. Por ejemplo, los versos de la página 206:

Mas sólo hallaba doloroso hastío
En festines, perfumes y mujeres

se cita en ocho libros, entre 1858 y el 2007.

Google Libros contiene una gran cantidad de obras. Su utilidad para la comunidad de investigadores, estudiantes o simples lectores puede ser inmensa. Todas estas herramientas que facilitan compartir las obras y reflexionar sobre ellas contribuirán, sin duda, a aprovechar un recurso tan valioso.

Etiquetas: , ,

Recordatorio: Litterae X en Madrid

07 septiembre 2007 10:10

Cultura escrita: nuevas perspectivas, nuevos retos.

Del 10 al 12 de septiembre en el Círculo de Bellas Artes.

Etiquetas:

Ayudando al OCR

07 septiembre 2007 8:08


Captcha es el sistema mediante el cual un sitio web con intervención del público se defiende de los programas que se dedican a meter spam; por ejemplo; muchos blogs proponen a quienes quieren escribir un comentario que escriban el texto de una secuencia de letras deformada o borrosa que se les ofrece. Esta tarea exige (por el momento) un ser humano: los programas no la cumplen.

Pues bien: cuenta Barrapunto que ha nacido reCaptcha, de la mano de los mismos investigadores de la universidad Carnegie Mellon que crearon su antecesor. Su peculiaridad es que el texto que propone para interpretación proviene del escaneado de libros: son palabras que el reconocimiento óptico de caracteres no puede interpretar. El programa de OCR detecta una palabra problemática y reCaptcha la ofrece como clave de acceso, emparejada con otra palabra cuya interpretación se conoce (y que sirve de control). Las palabras dudosas se ofrecen cierto numero de veces, hasta que la lectura se confirma.

ReCaptcha está funcionando por el momento como una ayuda para las digitalizaciones del Open-Access Text Archive, del Internet Archive. Teniendo en cuenta que cada día se resuelven 60 millones de Captchas, que llevan de media 10 segundos, su suma daría 150.000 horas de trabajo al día, que reCaptcha pondría al servicio de la digitalización de libros. No está mal, ¿no?

Etiquetas: , ,

Precio fijo y librerías virtuales

05 septiembre 2007 8:08

Comenta César Coca en El Correo Digital (a donde llego vía CEGAL) que librerías de Internet venden los libros españoles más baratos que en España. Es sabido que en España los libros tienen un precio fijo, sobre el que se pueden aplicar sólo determinados descuentos, pero ¿qué pasa cuando una librería virtual (un Amazon, por ejemplo), compra los libros y luego los vende en España a un precio más barato que el aquí vigente?

La territorialidad de la legislación es uno de los elementos que más está sufriendo con la descentralización que supone Internet. Es imposible poner límites al flujo de obras impresas (y no digamos nada de las obras digitalizadas) entre los distintos países. Y es imposible legislar sobre lo que un librero nortemaericano o alemán puede o no hacer con un libro español.

Como de costumbre, la Red está haciendo que se estiren las costuras de determinadas prácticas nacidas para un universo de movimientos mucho más limitados. De ahí provendrán desgarrones unidos a protestas variadas. Tal vez habría que empezar a cortar un traje nuevo…

Etiquetas: ,