Copiar en un universo transparente

04 marzo 2011 9:09

El ministro alemán de defensa ha sido pillado plagiando en su tesis doctoral. Hasta aquí no hay mucha noticia: los ministros son humanos… Lo realmente notable por infrecuente (en nuestras latitudes) es que haya dimitido por esa razón. Pero ¿cuánto plagió realmente? Una vez más, los sistemas de visualización de datos ayudan a hacerse una idea. El gráfico superior, de Vis4.net, presenta en color oscuro el plagio, directo o camuflado, y en color más claro otros tipos de copia; las barras grandes representan las líneas del texto, y las pequeñas las de notas al pie (Flowing Data, que es por donde llegué a este gráfico, se sorprende de que haya tantas notas como texto: se ve que no han visto muchas tesis…).

¿Como surgió el gráfico? Se creó un wiki para ir localizando y documentando las páginas de la tesis y sus fuentes (quienes no lean alemán pueden usar el traductor de Google parahacerse una idea; véase la imagen inferior). Como el wiki recorre página por página el trabajo original, la posterior conversión a símbolos es más simple.

En estas páginas hemos tocado varias veces la cuestión del plagio. La verdad es que hace años que existen sistemas automáticos que detectan la copia (en este artículo del 2000, El libro de medio billón de páginas, citábamos ya uno de ellos: Plagiarism). Desde entonces los sistemas de detección se han refinado y automatizado. El servicio gratuito FairShare, por ejemplo, localiza páginas web en las que se han reproducido contenidos de un sitio dado, e informa sobre qué porcentaje de texto se ha utilizado, si se ha enlazado a la fuente, si el sitio tiene anuncios y si ha reproducido la licencia que exige el sitio de origen.

Abajo tenemos el  informe que ha emitido sobre el sitio argentino Lectores sin remedio, que reutilizó uno de los post de este blog. El objetivo de FairShare es reclamar a sitios que hacen uso fraudulento de reproducciones, pero a mí me sirve sencillamente para comprobar el eco de mis post. Dada la licencia de este sitio, cualquier reproducción no comercial está permitida, aunque estaría bien que los sitios que los reproducen replicaran su licencia.

Etiquetas: , , , , ,

Estampas parisinas II: Shakespeare, ladrones y sífilis

12 enero 2010 9:09

No vamos a descubrir a estas alturas la famosa librería Shakesperare and Company, sino únicamente reiterar que su visita es un placer completo, y no sólo histórico.

Me gustó mucho el cartel que campeaba sobre la cámara de televisión de circuito cerrado que vigila el local: “La única cosa más baja que un ladrón de libros es el germen de la sífilis”, firmado: Samuel Johnson. ¡Sí, señor!

Y al hilo de esto, me encuentro en el New York Times un bonito artículo de Margo Rabb sobre el robo de libros en las librerías (estadounidenses). Entre otros detalles curiosos, menciona que la Biblia es uno de los libros más robados, junto con los que la librería recomienda, hasta tal extremo que alguno ha llegado a pensar en poner una lista de “Esta librería recomienda robar…”.

Etiquetas: ,

La digitalización como preservativo

04 septiembre 2007 9:09

A través del comentario de un lector de este blog llego a un artículo en El País del domingo (“No toquen el incunable“, subtítulo “La digitalización de fondos podría prevenir los robos en la Biblioteca Nacional”). Al hilo del reciente robo de unos valiosos grabados contenidos en un libro de esa biblioteca, la autora se pregunta algo que, según ella, ronda “por la cabeza de muchos [¿cuántos?] expertos [¿en qué exactamente?]”, aunque tampoco se diga quiénes son:

¿Es sensato prestar estas reliquias a la gente, por muy investigadora que sea, cuando está demostrado que no es posible velar por su seguridad al cien por cien? […] ¿No sería más sensato concentrar las energías en digitalizarlo todo y permitir las consultas sólo en este soporte?

Bueno: por la misma regla de tres habría que desaconsejar el sexo (que nunca tiene “seguridad al cien por cien”), sustituyéndolo por el uso de webcams; etcétera, etcétera…

La alianza de las nuevas tecnologías, la ignorancia y el papanatismo está dando resultados espectaculares, por lo que hay que apresurarse a decir que la consulta de la obra original es con frecuencia insustituible, por muchas razones. La primera es que la digitalización sólo recoge parte de la esencia de la obra: por ejemplo, los elementos materiales, desde el tipo de encuadernación hasta la composición en cuadernillos no los recoge la imagen digital. Luego: las reproducciones tienen con frecuencia errores. Francisco Rico describió en facsímiles impresos del Quijote cambios respecto al ejemplar original, y se han señalado con frecuencia problemas en el control de calidad de facsímiles digitales.

Hay un debate paralelo:

¿cómo gestionar la institución?, ¿con una política de puertas abiertas, ausencia de controles, con todos los riesgos que eso representa, o con una política de rigor, primando la seguridad?

No sé, no sé: se puede tener una política de puertas abiertas (ahora veremos qué significa esto) y aplicar controles: no es contradictorio…

Porque, se nos dice, hay libros que son

joyas que se encuentran a disposición de cualquiera en posesión de un carné de investigador de los que otorga la biblioteca con cierta facilidad

¡Ajá! El problema es que se deja entrar a cualquiera, ¿no? Me gustaría saber, de los robos detectados desde hace décadas en la Biblioteca Nacional y otras instituciones, cuántos son atribuibles a miembros eminentísimos de claustros universitarios (a los que, supongo, y para la periodista, no se debería negar el preciado carnet) y cuántos a esa otra gente que accede “con cierta facilidad”. Me juego una ronda de cervezas en el Café Gijón, sito al lado de la benemérita institución, a que hay más catedráticos chorizos que cualquier otra categoría…

¡Por favor!: no estamos promoviendo la digitalización para que se cierren de nuevo las bibliotecas como en el Medievo, sino para abrirlas. Que cualquiera que demuestre un interés legítimo en la consulta directa de cualquier obra, pueda acceder a ella, aunque no sea profesor de una universidad (cuyos procesos de selección, por cierto, no parecen garantizar automáticamente una gran calidad científica y moral).

Y luego, hay sencillísimos procedimientos de control (como examinar cuidadosamente las obras valiosas prestadas, en el momento de su devolución, y en presencia de quien las acaba de usar). Cinco minutos de trabajo especializado que pueden ahorrar muchos disgustos…

Etiquetas: , ,

Documentos encadenados

04 agosto 2007 11:11

Una parte muy grande de la producción escrita mundial son documentos privados , profesionales y administrativos, que se crean mediante programas de ofimática. El problema es que si uno ha creado un documento usando, digamos, Word, deberá utilizar Word para abrirlo, para editarlo, y en la práctica seguirá encadenado al uso de este programa

Vía Barrapunto accedo a este artículo de Borja Prieto: Los estándares abominables de Microsoft, donde se explica de forma muy accesible qué es lo que nos jugamos con todos esos estándares y especificaciones técnicas.

Etiquetas:

¿Quasi-original?

19 julio 2007 10:10


Una visita a la preciosa catedral de Gerona. Pago por visitar su museo (no me sirve el carnet de prensa ni mi acreditación internacional de crítico de arte). Aparte de maravillas como el Tapiz de la creación, me lleva el deseo de ver uno de los pocos beatos que existen, esos comentarios al Apocalipsis copiados y dibujados en el siglo X.

El libro está encerrado en una vitrina. Mi mirada se recrea en él: estos son los trazos que se dibujaron en el scriptorium de San Salvador de Tábara, las letras que allí se escribieron hace mil años… Aunque, ¿qué es esto? ¿Qué dice la cartela?: “Quasi original”.

Pero vamos a ver: ¿es original o no lo es? ¿Es el libro copiado en el 900 o no? ¿Se puede ser casi-original? ¿No es un oxímoron? ¡Es como decir de alguien que es casi-virgen! ¿Dónde he leído yo semejante eufemismo? ¡Estos aviesos canónigos me han colado un facsímil!

Etiquetas: ,

Tipografía contra la falsificación

18 julio 2007 11:11


Como es bien sabido, cada tipografía construye el conjunto de los números y las letras del abecedario (y otros signos), bajo unos rasgos comunes. Es frecuente, por ejemplo, que la F sea igual que la E sin el trazo horizontal inferior, que la C sea como una O abierta, etc. Esta uniformidad, que en textos para lectura es imprescindible, puede ser un problema en caso de sartas alfanuméricas con fines de identificación, por la facilidad para ser alteradas. Sin ir más lejos: las matrículas de los coches.

El gobierno alemán quiso evitar que las placas pudieran ser transformadas por el sencillo recurso de pegar una tira de esparadrapo, y sustituyó la tipografía DIN por la FE-Mittelschrift, en la que cada signo tiene una forma diferente. FE significa Fälschungs-Erschwert, es decir: difícil de falsificar. La paradoja (comenta Javier Cañada en El Cosmonauta siguiendo a SpiekerBlog) es que un falsificador podría inventarse un signo de forma completamente nueva, pero diferente a los otros, y a la policía le costaría reconocerlo como falso.

Ahora bien: hoy en día las matrículas tienen como principales lectores no a humanos, sino a las máquinas que las leen en los accesos a aparcamientos, fotografías para multas, etc. Y ellas podrán recordar bien la forma única de cada letra (recuerda un comentario a SpiekerBlog).

Etiquetas: , ,

La web de Coelho

03 junio 2007 10:10


¿Necesita una web uno de los escritores más vendidos del mundo? A juzgar por lo que hace Paulo Coelho, sí…

Coelho tiene una página web en dieciséis lenguas (siete de las cuales ni siquiera se escriben en caracteres latinos), donde aparecen fotos, descargas, la agenda del autor e incluso partes de su última novela, de la que publica nueve capítulos (eso sí, sólo en once lenguas): La bruja de Portobello. Los lectores tienen oportunidad de discutirla e incluso intervenir en concursos sobre ella. También hay diversos materiales de su autoría, como discursos, o el texto íntegro de su libro más famoso, El Alquimista.

¿Por qué hace esto un autor reconocido? En parte, porque él (y sus agentes y editores) saben que hoy en día parte de la conexión entre autores y lectores se dirime en la Web. Pero también les consta que en la Red hay una demanda general de materiales de los creadores famosos, y que si no se los dan los propietarios, otros lo harán:

He descubierto el sitio Internet The Pirate Coelho donde existe una colección completa de mis obras en varias lenguas. Mis editores fueron alertados sobre eso y es muy probable que el sitio no quedaré [sic, por “quedará”] mucho tiempo en línea.

Efectivamente: la dirección que da ya no está en línea, pero el mismo sitio del autor ofrece porciones importantes de su obra. Un curioso efecto lateral, ¿no?

Etiquetas: , ,

Nocturna, pero no tanto

28 mayo 2007 9:09

Si uno se sumerge en el sitio web Biblioteca Nocturna descubrirá, listos para descarga gratuita, algunas decenas de libros en PDF zipeado. Lo curioso de esta biblioteca digamos heterodoxa es que no tiene ninguna diferencia con las mesas de novedades de las grandes superficies: Dan Brown y más Dan Brown e Isabel Allende y luego Coelho y García Márquez. Para ese viaje… (Gracias, Gorki).

Etiquetas: ,

El precio de la letra

11 mayo 2007 9:09

Leo en Consumer.es Eroski (un medio de información al consumidor que tiene un área dedicada a nuevas tecnologías, que suele presentar un buen nivel de calidad) que enviar SMS es “600 veces más caro que hablar y miles de veces más caro que conectarse a Internet por el móvil”.

Los SMS son un curioso subproducto de la telefonía móvil: una aplicación textual que se creó por la sencilla razón de que la tecnología de voz la soportaba sin coste añadido, pero que fue rápidamente asumida por los usuarios, sobre todo de menor edad. Para las compañías telefónicas, una vez montada la infraestructura de antenas, etc., estos mensajes no cuestan absolutamente nada, pero a los clientes se les cobra mucho : en Nochevieja los españoles se enviaron mensajes por valor de 15 millones de euros.

Los SMS han levantado oleadas de tinta, sobre todo catastrofista, acusándoles de ser una práctica que atenta contra la pureza de la lengua, y que la nefasta influencia de las abreviaturas con las que los jóvenes intentan disminuir la extensión del mensaje se iba a extender al resto de los medios escritos.

Frnkmnt, n entndo x q.

Etiquetas: ,

Una ojeada al interior

21 abril 2007 11:11


LibreDigital, compañía dedicada a visualización de libros y a digitalización, presta servicios a editoriales como Bloomsbury (que publica la saga de Harry Potter) para que los lectores puedan hojear parte de los libros, bajo el nombre Look Inside (vía Noticiasdot.com). En la imagen la pantalla de visualización de la nueva edición de La piedra filosofal. Los fans también pueden colocar reclamos en sus páginas web al modo en que veíamos que lo hacían Random House y HarperCollins.

LibreDigital (división de NewsStand, compañía dedicada a suministrar prensa en formato digital) tiene como lema “El contenido se encuentra con el control” y el poderoso slogan: “Devolviendo a los editores el control de su contenido”. Personalmente creo que esta forma de presentar las cosas tiene mucho que ver con la histeria de ciertos editores ante la presencia de trocitos de sus libros en la Red. No creo que LibreDigital devuelva a los editores de Harry Potter el control sobre las múltiples ediciones piratas que se hacen de sus libros, por ejemplo.

Etiquetas: , , ,