La Red, II: neutralidad de Internet

12 marzo 2010 09:17


El presidente de Telefónica dice que Google y otros buscadores deberán pagar por hacer uso de sus redes. Al ministro de Industria le parece bien... Y si no pagan, ¿qué van a hacer, excluirles? Es cierto que los buscadores usan las redes para indizar el contenido de los sitios web, pero no es menos verdad que gracias a ellos luego hay un tráfico gigantesco que las compañías cobran religiosamente a nosotros, sus usuarios.

En el fondo, lo que está en juego es un principio general que hasta ahora se ha cumplido estrictamente, y que se suele llamar neutralidad de la red. El alma de Internet es que cualquiera de sus nodos trate igual todo el tráfico que pase por ellos. Pues bien: este principio rector está en peligro, tanto con el pretexto de detener el tráfico delictivo como por meros fines de lucro, como acabamos de ver.

Arriba podemos ver una presentación explicativa que proviene de ADN. Abajo, uno de los logos que se han propuesto para poyar la neutralidad.

Etiquetas: ,

El 4% y Enclave

17 diciembre 2009 09:17


Uno de los obstáculos que se elevaba ante la comercialización del libro electrónico en España acaba de desaparecer. El IVA del 15% que gravaba a los productos electrónicos se reduce al 4% en el caso de los libros digitales (el 4% es el IVA reducido que tienen los libros).

Este importante cambio fue anunciado en la presentación del proyecto Enclave, de la Federación de Gremios de Editores de España y la Biblioteca Nacional. Enclave está formado por las obras con derechos de la Biblioteca Digital Hispánica, donde se integra. Se han incorporado a Enclave 90 editores con un total de 1.300 títulos, de los que por el momento están disponibles 629. DILVE, la base de datos de libros vivos de los editores, suministra a Enclave los datos y otros elementos como páginas de muestra y cubiertas (aunque en DILVE ahora hay información sobre más obras que las que hay en Enclave: en total 220.000). La comercialización de los libros se realiza en el sitio de la editorial (o en la entidad que ésta delegue). He aquí un video de difusión del proyecto:





La plataforma Enclave ha sido creada con fondos públicos del plan Avanza. Aparte del "empujon" que habrá supuesto para que distintos editores digitalicen sus obras, no ha fijado ninguna política ni de precio de venta ni de formato de libro electrónico ni de retribución al autor, temas en los que se pueden percibir notables variaciones.

Tal y como está formulado, Enclave funcionará para el público general como un buscador especializado en e-books. ¿Supondrá alguna ventaja (para editores o para lectores) frente a la búsqueda los propios sitios de los editores, agregadores, distribuidores, librerías digitales y demás?

Etiquetas: , , ,

Buscador + periódico = ?

10 diciembre 2009 09:17


La alianza de Google News con la redacción de periódicos de peso lleva a un nuevo producto Living Stories (prototipo), para el que ha trabajado con las redacciones de The New York Times y The Washington Post, según informa su blog.

El resultado es una interesante agrupación temática (en la imagen inferior, sobre la guerra en Afganistán), que es en parte elaboración de la redacción del medio (en este caso el New York Times) y en parte selección de noticias vía el buscador. A ello se añade una cronología y un video.

Otros temas desarrollados son la reforma de salud de Obama y el calentamiento global. Si bien el seguimiento de una noticia a través de las distintas ediciones del periódico es un paso adelante, también es cierto que no se puede dar esta cobertura a todos los elementos de la actualidad. 



Etiquetas: ,

Pagar para sacar de Google

25 noviembre 2009 09:17


La noticia ha saltado a varios periódicos españoles: Microsoft y Murdoch planean una alianza para hacer frente a Google. Murdoch cobrará por que sus medios no se indicen en Google. La fuente (a la que no linka ni La Vanguardia ni El País: curiosa práctica habitual en estos medios por línea) es el Financial Times.

¿Quién ganará con esta medida. De entrada los medios de Murdoch, que percibirán de Microsoft un pago por salirse de Google e integrarse sólo en su buscador Bing. ¿Quién perderá? Probablemente los medios de Murdoch: ¿qué es un diario al que nadie llega?

La paradoja de la revuelta de la prensa contra Google la resume muy bien Mauro Entrialgo en una entrega genial de su Plétora de piñatas (arriba).

Etiquetas: ,

Guía de Editores de España 2009-10

04 noviembre 2009 10:23


La Federación de Gremios de Editores de España acaba de sacar a la luz la obra de consulta Guía de Editores de España 2009-10, que contiene datos extensos sobre las editoriales agremiadas (casi todas) y más reducidos sobre las que no lo están.

El libro es mucho más útil de lo que pueda pensarse, porque, aunque parezca mentira, conseguir la dirección postal o el teléfono de algunas editoriales, aun de grandes grupos, puede ser una tarea ímproba. Más datos de interés, a veces no accesibles de otra manera, son los de fecha de creación del sello, títulos editados el último año, distribuidores y cargos directivos. Repasando estos últimos se ven cosas curiosas, como editoriales de grandes grupos que tienen Subdirección editorial, pero no Dirección Editorial (debe de ser por ahorrar...).

Una útil función de esta guía es el "Quién es quién", donde se puede buscar por el nombre de las personas, para encontrar el cargo que ocupan y en qué editorial.


No sé si la Federación de Gremios planea hacer accesible este rico conjunto de datos en la Web, pero debería hacerlo, para un mejor servicio de todos sus agremiados y del público en general.

Etiquetas: ,

Forum Atlántida, encuentro en Barcelona

27 octubre 2009 09:17


Los próximos 2 y 3 de noviembre tendrá lugar en el Auditorio de la Pedrera de Barcelona, Paseo de Gracia, 92, el encuentro Forum Atlántida, con el lema "La función social del editor". Lo organiza el Gremi d'Editors de Catalunya.

Lamentablemente la web creada para este evento, Forum Atlántida, no servirá para que la gente (salvo quienes conzcan su dirección) se entere de este bonito evento, porque todos sus textos están como imágenes: los buscadores que lleguen allá no podrán saber ni los nombres de quienes participan. Parece mentira que a estas alturas todavía se sacrifique la visibilidad en la Web a una (presunta) belleza...

Esta es la presentación del Forum:

El Fórum Atlántida es un encuentro para reflexionar sobre el mundo de la edición y el papel social que ha desarrollado el editor, a nivel local e internacional. El Gremi d’Editors de Catalunya  tiene el deseo de mantener Barcelona como uno de los referentes europeos e internacionales del mundo de la edición. Es por ello que toma la iniciativa de desarrollar un foro de debate que sitúa al editor como eje principal. El Fórum nace con el objetivo de convertirse en una cita de referencia para todos los profesionales del sector y para el público especializado.

En esta primera edición el tema de reflexión sobre el que gira el Fórum es el papel de la edición en la configuración de la cultura occidental. ¿Qué papel juega la sistematización de la edición en la evolución de la cultura? ¿Qué cambios se han dado desde que la transmisión oral ha dado paso a la transmisión escrita y sobre todo desde la tecnificación del proceso? ¿Hubiera sido posible el gran avance científico, tecnológico y de pensamiento de los últimos 500 años sin el libro?

Hoy en día el mundo de la edición es una industria importante, marcada por el modelo económico actual, pero ¿Existen otras realidades? ¿Cómo ha evolucionado el papel social del editor? ¿Perdura hoy en día la figura del editor que persigue cumplir con el compromiso de la transmisión y el mantenimiento vivo del conocimiento, poniéndolo al alcance de todos, motivando la reflexión y la crítica dentro de la sociedad?
 
El Fórum Atlántida convertirá Barcelona durante una semana en el centro internacional de reflexión sobre el mundo de la edición.

Las sesiones de ambos días tienen el tema: "La contribución de la edición en la configuración de la cultura occidental":
2 de Noviembre:

• 17.30h. Roger Chartier Con Francisco Rico.

• 19.30h Antoine Compagnon con Jaume Vallcorba.

3 de Noviembre:

• 16.00h Claudio Magris con Pere Gimferrer.

• 18.00h Jorge Edwards con Daniel Fernández.

• 20.00h Conferencia de clausura: Roberto Calasso con Jorge Herralde.

Etiquetas: , , ,

"Aquí" mismo

09 octubre 2009 09:17


Seguramente hemos cometido nosotros mismos este error más de una vez, pero una norma general de los hiperenlaces es que tengan ellos mismos un contenido semántico; es decir, conviene evitar poner enlaces en palabras vacías.

La razón es clara: los buscadores obtienen una información preciosa de las palabras que están enlazadas, a lo que añaden el contenido de la página de destino, y otros parámetros (hemos hablado de ello en La era de las máquinas lectoras). Si uno enlaza una palabra sin sentido, está contibuyendo a hacer un poquito más opaca la Red.

El ejemplo máximo es una palabra como aquí o here. Aparecen, según Google, 380 y 3.040 millones de veces, respectivamente, y la mayor parte de ellas (lo he visto, naturalmente, en un muestreo), constituyen enlaces. Cuando uno ve qué paginas las presentan, son por lo general páginas de descargas que rezan "pulse aquí para descargar", y cosas por el estilo...

Etiquetas: ,

¿Qué funciona mal en Google Libros?

07 septiembre 2009 09:17

The Chronicle of Higher Education acaba de publicar un interesante artículo sobre Google Libros, escrito por Geoffrey Nunberg, de la Escuela de Información de la Universidad de California en Berkeley: "Google's Book Search: un desastre para los investigadores".

Comencemos por el principio: con sus cerca de diez millones de libros digitalizados, y lo avanzado de sus desarrollos, está claro que previsiblemente no habrá otra biblioteca digital similar a la de Google en muchos años. De ahí la importancia de todas las cuestiones que la afectan, ya sean de retribución, privacidad... o de calidad.

¿A quién está orientado el servicio de Google Libros, en su doble vertiente de obras digitalizadas en una treintena de bibliotecas del mundo, y de obras cedidas por sus editores y autores? Buena pregunta, que podemos contestar de soslayo: ¿a quién está dirigido el buscador Google?: a todo el mundo. Pues también la búsqueda de libros intenta prestar servicios a los estudiantes, a los investigadores... y al público en general.

El problema, dice Nunberg, y no es el primero, es que Google no ha tenido en cuenta (o no lo suficiente) la especificidad del objeto-libro, que tiene detrás varios siglos de organización y clasificación que ha dado lugar a un corpus considerable de informaciones sobre las obras, que hoy llamamos metadatos: fecha, editorial, edición, autoría, clasificación temática, ... Y los que hay en Google Libros, en opinión del autor, son pésimos. En una presentación disponible por línea se recogen ejemplos de malos metadatos.

En vez de recoger informaciones preexistentes en el universo bibliotecario, Google ha adoptado una postura mixta; por una parte ha utilizado datos sobre las obras, pero enfocadas a un publico general: así, utiliza clasificaciones temáticas del estilo de las que organizan los libros en una librería... no muy buena. Por otra parte, ha intentado que la información del interior de las obras se autoorganice mediante procedimientos algorítmicos semejantes a los que le han permitido indizar un corpus mucho más complejo: el de la Web. Pero el resultado no es todo lo bueno que podría ser, ni para los investigadores ni para muchos estudiantes.

Cualquiera que haya utilizado un poco Google Libros estára de acuerdo en que hay cosas extrañas y otras que funcionan mal. Los errores podrán irse arreglando (aunque parece que esta no es una tarea prioritaria), pero hay cuestiones de fondo que exigirían un giro en el proyecto. Sí: ya sabemos que el público potencial de este servicio es amplísimo, pero las cientos de miles (por no decir millones) de obras raras, antiguas, especializadas, en lenguas muertas, de siglos pasados que alberga Google Libros, ¿a quién van a servir, si no es a los investigadores?

No habíamos imaginado que pudiera existir una maravilla como esta biblioteca quasiuniversal, pero ahora que está a nuestro alcance, podemos pedir que funcione.

Etiquetas: , , ,

Mientras tanto... ¿qué ha pasado con Google?

01 septiembre 2009 09:17


Con la consiguiente agitación, la Bibliothéque Nationale de France, abanderada durante años de la campaña anti-Google, ha anunciado su intención de hacer un acuerdo parcial con Google, que se convertiría así en la trigésima (30ª) biblioteca mundial en aliarse con el buscador.

Jean-Noël Jeanneney, antiguo director de la BNF, viejo conocido de estas páginas por su oposición a Google, y autor del libro Google desafía a Europa, no ha podido sino reaccionar en un furibundo artículo en Le Figaro: "BNF et Google: l'insupportable tête-à-queue" (juego de palabras: si tête-à-tête —cabeza contra cabeza— implica una oposición en igualdad, tête-à-queue —cabeza contra cola—sugiere la posición privilegiada del buscador). Jeanneney, impulsor de Gallica y de Europeana, no dice nada nuevo en el artículo, pero conviene leerlo para ver de nuevo sus argumentos. El principal es que Google pretende digitalizar todo, mientras que Gallica y Europeana pretendían guiar a la gente: "el hilo de Ariadna" frente al "batiburrillo".

Pero, digo yo: ¡que nos digitalicen todo lo que se pueda, y ya habrá quienes tracen los recorridos, sin monopolios! Y, como señala Cluster 21:"nada prohibe a los responsables de la BNF negociar su participación (más o menos exclusiva) en la eleción de las obras", y "nada les obliga a firmar con Google un acuerdo de exclusividad".

Mientras tanto, el lobby de los editores de prensa trabaja activamente ante la Comisión Europea para controlar la reutilización de sus noticias en los buscadores (o sea, Google).

Y Lawrence Lessig, el creador de Creative Commons, ha dado una conferencia (que resume Exact Editions), en la que, sin entrar en una postura anti-Google, advierte contra la deriva que puede tomar el buscador en el caso de los libros, y lo hace a través de una curiosa metáfora: Google era un gatito, pero puede llegar a convertirse en tigre y, ¿quién quiere juguetear con un tigre?

Imagen: Mums Dirty White Kitten, algunos derechos reservados

Etiquetas: , ,

Glosario de glosarios

14 julio 2009 09:17


Uno de los clásicos de este blog son los mestizajes libro/web. A través del Diari d'un llibre vell he llegado a una iniciativa de la editorial catalana Barcino, especializada en clásicos, y de quien ya hemos reseñado la edición de la obra de Eiximenis.

Los clásicos editados por Barcino tienen numerosas notas de glosario, con explicación de términos. La herramienta digital "Glosario de glosarios" permite buscar en qué obra concreta se explica determinada palabra o expresión, con lo que se configura un auténtico "diccionario del catalán antiguo". La búsqueda remite a la paginación de las obras en papel.

Etiquetas:

Novedades en Google Libros

23 junio 2009 09:17

En el blog de Google Books se han presentado algunas mejoras en el servicio de Google Libros. Por ejemplo: ahora se pueden incrustar libros en blogs o webs, al modo en que se incrustan videos de YouTube (para conseguir el código para insertar hay que hacer clic en "Enlace", arriba a la derecha).





El ejemplo pertenece a Poesía y arte de los árabes en España y Sicilia, escrito por Adolf Friedrich von Schack, traducido por Juan Valera, Madrid, Rivadeneyra, 1867.

Hay también una nueva visión general de las páginas, que puede ser útil para localizar materiales.


La búsqueda ha mejorado también, dando acceso a imágenes de la parte de las páginas en la que están los hallazgos.

Etiquetas: ,

Agregador de sitios de libros

18 junio 2009 09:17


Alltop Books es lo que hoy se llama un agregador: un sitio que agrupa distintas páginas y blogs, para permitir manejarlos de un vistazo... teóricamente. La portada de la versión libros de Alltop (la hay también para otros temas) agrupa más de 100 sitios, cada uno de ellos con sus 5 últimas novedades. Demasiado para digerirlo directamente.

Entre los sitios seleccionados hay lugares de reseñas de libros, como en New York Times, pero para este fin es mucho mejor el agregador de reseñas del que hablábamos hace poco. Tiene también sitios profesionales, como Publisher's Weekly, y una gran cantidad de blogs sobre temas variopintos, incluyendo algunos blogs de autor, como el de Coelho.

Una de las funciones de los blogs es filtrar información de muy diversas fuentes, pero cuando un agregador ofrece quinientos elementos, renovables cada hora, el resultado no es un filtrado, sino un jaleo.

Etiquetas: ,

Hispana, acceso y cultura

08 junio 2009 09:17

Gozález Sinde en ABC

Éste será un post largo, pero el tema lo merece: se trata de una comparecencia de la ministra de Cultura llena de cuestiones que nos afectan.

Hispana

La ministra de Cultura ha anunciado el lanzamiento de Hispana, "una base de datos que permite ya el acceso a más de 900.000 recursos de 94 bancos digitales de las distintas administraciones, así como entidades privadas y fundaciones".

Éste es el sitio de sitio de Hispana. La base de datos está constituida a partir de las colecciones digitales que agrupa, y sigue el protocolo de la Open Archive Iniciative.

La iniciativa parece loable: en España existen numerosas iniciativas de digitalización (algunas duplicadas), y este es un lugar que pretende agrupar a todas. El problema que tiene Hispana es doble. Por una parte, sus resultados a veces conducen sólo a fichas (metadatos) de obras, en vez de al contenido propiamente dicho. Se nos informa, por ejemplo, de que en determinado repositorio existe un pdf con el artículo "Berlín: dos García Lorca", pero no nos da acceso a él.

Por otro lado, hay buscadores generalistas que ya dan acceso a una gran parte de la información que contiene Hispana. Por ejemplo, quien quiera el artículo mencionado antes, y desee algo más que saber que en Salamanca lo tienen en PDF, puede hacer la búsqueda en Yahoo o en Google. Cualquier buscador llevará también al numeroso fondo de Dialnet que está integrado en Hispana.


Además (aunque eso puede deberse a la novedad del sitio), no todas las obras contenidas en las instituciones colaboradoras están indizadas en Hispana: lo he comprobado al azar con algunas de la Biblioteca Virtual Miguel de Cervantes.

¿Qué otras colecciones se van a incorporar a Hispana? ¿Con qué criterio? Y: ¿realmente vale la pena el esfuerzo, tal y como está planteado? Hispana está concebida como una herramienta para uso de profesionales (bibliotecarios, documentalistas...). No me imagino usándolo a los consumidores finales de cultura: profesores, estudiantes, ciudadanos a la búsqueda de un dato, de una obra.

Esta iniciativa de un agrupador de repositorios se inscribe en la estela de la reacción europea frente a Google, que analicé hace años en el artículo "...Y Google raptó a Europa". Sigo pensando lo que dije entonces: en vez de desarrollos a la medida de una hipotética "cultura europea"
es mejor invertir en coordinar prácticas de digitalización (para evitar que se repitan trabajos ya hechos, o que fondos digitalizados con dinero público no estén accesibles); en sus criterios (no queremos fotos de libros en línea, sino textos buscables); en normas de amigabilidad ante los buscadores (para que nuestros contenidos se abran a los indizadores: hoy, Google; tal vez mañana, uno europeo con estándares abiertos).
Contenidos culturales en Internet

Recoge el Cultural:
González Sinde anunció que el Ministerio quiere complementar "las futuras medidas que se adopten en materia de protección de los derechos de propiedad intelectual en la red con un Plan de Fomento de Contenidos Culturales en Internet", cuyos diferentes puntos no desarrolló.

De cara a ese impulso de la cultura como derecho ciudadano, el Ministerio pondrá también en marcha un programa para facilitar el acceso de la infancia y la juventud a la cultura, y lanzará "un gran portal en la red", específicamente orientado a los más jóvenes.
¡Dios mío: cuando no se sabe qué hacer prometen un portal!

¿Y quieren de verdad fomentar
contenidos culturales en Internet? Por favor: queremos saber cómo, y pronto... Por empezar sólo por el principio, ¿fomenta la creación en Internet tener la operadora con el ADSL más caro de Europa? ¿Empujar a los alumnos a que consuman objetos didácticos ya elaborados en vez de a que creen los suyos? Esperamos con atención qué medidas de fomento se propondrán.

Preservación digital

Sobre la preservación digital ya hemos escrito varias veces. Alegra saber que por fin es un tema que ha entrado en la agenda ministerial.

La ministra prometió un Archivo Nacional de Preservación Digital, que actualmente, dice el Cultural, se encuentra en fase de "estudio del programa de necesidades".


También nos gustaría saber detalles. Un Archivo de Preservación Digital tiene que ser un ente autónomo y sin ataduras, porque si no la tendencia de las administraciones es a hacer una recogida de la parte más institucional y establecida (como ocurre en otro proyecto español de preservación), con el riesgo de dejar fuera la parte más viva de la creación cultural en la web. Las webs institucionales son precisamente la que tienen más posibilidades de sobrevivir, de modo que su preservación es redundante y a menudo inútil, mientras que creaciones más libres y espontáneas, como las que se recogen en muchos blogs, tienen pocas posibilidades de ser recogidas.

Además, con la visión estrecha de la propiedad intelectual que se tiene por esas instancias es dudoso que se decidan a recolectar y guardar páginas de titularidad privada. De nuevo, los buscadores y proyectos privados de preservación van a darnos mejor servicio...

Por otra parte, se trata de un Archivo Nacional: suponemos que
se van a preservar también las webs creadas en las lenguas cooficiales, pero ¿van a recoger sólo la parte de la Web en español creada en España? ¿Y cómo la van a determinar?

Los gobiernos están cada vez más anunciando acciones en el universo digital, porque eso les da un aire de modernidad, y realmente pocos van a discutirles sus decisiones: son temas complejos, y la prensa general y los partidos de la oposición (que son los únicos que les importan) no tienen criterio al respecto. Pero quienes estamos cerca de la creación cultural en la Red tememos el surgimiento de planes faraónicos que sirvan de poco, junto a la aparición de iniciativas directamente erradas o contraproducentes.

Etiquetas: , , ,

La huella del pasado

24 marzo 2009 09:17

La intervención de Milagros Pérez Oliva, Defensora del Lector de El País, este domingo toca un tema grave, o mejor dicho: dos. Por una parte las personas que han sido objeto de una noticia de cariz negativo hace tiempo, y cuyo nombre queda en la hemeroteca digital del diario. Por otra parte el rastreo que de esas noticias hace Google, y que tienen consecuencias indeseadas:
La casuística es infinita y, en algunos casos, sangrante. Es el caso de un cirujano cuya única referencia en Google es su imputación por negligencia a causa de un error médico del que más tarde fue absuelto; el de un toxicómano ya rehabilitado, cuyo pasado le persigue por un atraco en el que participó, o el de una mujer cuyo nombre remite a una noticia de cuando ella era menor y tuvo que presenciar cómo su padre mataba a su madre. Cosas nada agradables de recordar y que aparecen en Google con luces de neón.
El diario recibe "unas tres peticiones de retirada de noticias por semana" de modo que la cuestión no es baladí. Para el servicio jurídico del diario:
Es una problemática muy seria, que va en aumento y que en ocasiones provoca situaciones muy dolorosas. Pero EL PAÍS no puede de ningún modo modificar sus archivos. Eso sería falsear la historia. Los archivos son intocables. El problema radica en la facilidad con la que Google o cualquier buscador los hace accesibles, y el modo en el que lo hace. Es Google quien establece la selección de las noticias que aparecen.
El problema en realidad no es exactamente asi: el diario podría decir a Google (en realidad, a cualquier buscador) que no indice determinada noticia, dejándola sin embargo en su archivo y sin "falsear la historia" en absoluto. Eso es lo que ha pedido al parecer la Agencia Española de Protección de Datos.

Porque el problema no es sólo que determinada persona aparezca en una noticia de corte negativo, sino que aunque luego los hechos o un juicio laven su nombre, la prensa no suele recoger este hecho... Lo reconoce la Defensora del LEctor:
deberíamos poner fin a la tolerancia con que permitimos ciertas carencias en nuestro trabajo, como la de no hacer siempre un seguimiento de las noticias que publicamos. ¿Es lícito que publiquemos a cuatro columnas que alguien ha sido imputado y nunca informemos si ha sido condenado o absuelto? Deberíamos establecer normas al respecto. En casos como la Operación Gürtel o las causas por corrupción urbanística, con decenas de presuntos implicados, deberíamos especificar quiénes quedan libres de cargos conforme avanza el proceso, y hacer una recapitulación final cuando, seguramente al cabo de muchos años, se produzca la sentencia.
Si las hemerotecas en papel permitían el rastreo de un nombre sólo a las personas con medios, la unión del almacenamiento digital y los buscadores convierten esa tarea en algo mucho más sencillo. Pero esto convierte la labor de los diarios en una cuestión mucho más delicada, y que además exige que gestionen mejor su relación con los buscadores. La culpa de estas situaciones penosas no es de los mensajeros...

Etiquetas: , ,

Milenario: ¿Cómo?

17 febrero 2009 09:17

En la celebración de los 1.000 post de este blog en Blogger...

Sabemos desde dónde, pero ¿cómo llegan sus lectores hasta aquí? La octava parte llegan directamente (es decir, teclean la dirección, o la sacan de un marcador). Más de un cuarto llegan a través de sitios web que me enlazan (y aprovecho para dar las gracias a sus responsables). Y un poco más de la mitad llegan directamente desde buscadores.
Comparado con el resto de mi sitio web (en el que los motores de búsqueda aportan el 80%), esto significa que el público de este blog en gran medida sabe lo que busca: no cae de un buscador en el que ha metido una palabra, sino que viene directamente, o recomendado desde otro lugar.

Etiquetas: ,

Las rutas del ojo

09 febrero 2009 09:17


Los estudios sobre la forma en que se lee un texto mediante rastreo de los movimientos del ojo (eye tracking) tienen al menos una década: los primeros que se hicieron, por el Poynter Institute investigaron la competencia entre texto e imágenes.

Pero esos estudios han seguido, y ahora hay hardware y software estándares que facilitan su realización. Vía Documenea he llegado a un estudio hecho por un acompañía de márketing sobre el comportamiento ante la página de resultados de Google. La doctrina clásica es que los resultados (y los anuncios) situados arriba y a la izquierda obtienen la mayor atención de quienes consultan.

El ejercicio de seguir los recorridos de los ojos de un usuario siempre sorprende:



Etiquetas: ,

Milenario: ¿desde dónde?

05 febrero 2009 09:17


Pues sí: este blog se acerca su post número 1.000 (!) en Blogger. Comencé a usar esta útil herramienta en junio del 2006 (antes creaba manualmente los post, que un día tengo que contar cuántos son). Para celebrar el número redondo, iré contando cosas de su funcionamiento.

Hace algún tiempo me instalé herramientas Analytics en el blog, para conocer mejor algunas de sus variables. Por ejemplo: ¿de dónde vienen sus lectores?

Los lectores del Blog de Libros y Bitios vienen de todo el mundo, pero especialmente de España y México, seguidos por Venezuela, Argentina y Perú.

Etiquetas: ,

El buscador profesional del libro

23 diciembre 2008 09:17


Quizás el lector se haya fijado en el lateral izquierdo de este blog: debajo de la lista de las categorías de sus entradas hay un formulario para búsqueda. Antes se llamaba de una forma más compleja pero lo he acabado bautizando como "Buscador profesional del libro". Se trata de un buscador parametrizable de Google que he personalizado para que busque en treinta y cinco sitios (sobre todo blogs) relacionados con las temáticas de estas páginas. Este mismo blog está incluido en los resultados.

La selección contiene sitios sobre todo en lengua española, y la he hecho a partir del seguimiento constante de esas páginas, de modo que estoy razonablemente seguro de su calidad. Pero puede que haya alguna ausencia, claro...

Los lectores interesados en lectura, escritura, edición electrónica, bibliotecas y otros de nuestros temas clásicos tendrán una ventaja al usar este buscador frente a una búsqueda general. Trabajarán sobre un conjunto restringido de páginas (en estos momentos hay 16.400 indexadas, entre los 35 sitios), que además están directamente relacionadas con estos temas. Por poner un ejemplo: la búsqueda de cubierta en este buscador arroja 78 resultados, todos los cuales, además, se refieren a los libros. En contraste, la búsqueda general en Google arroja 1.670.000 resultados, y en los primeros lugares aparecen "cubiertas de poliuretano" y "pista cubierta".

Creo que este buscador (cuya estructura de sitios reviso periódicamente) puede resultar de ayuda a los lectores.

NOTA (6 de enero del 2009): Distintas personas me han hecho preguntas muy pertinentes sobre este buscador, tanto en los comentarios como por correo, de modo que voy a responder. Esta es la página de entrada al Buscador de Libros y Bitios. En ella se puede ver qué sitios están incluidos (por supuesto, con mucho gusto incorporaré otros sitios que me propongan y que me parezcan valiosos para las búsquedas). Además, en el enlace Añada este motor de búsqueda a su blog o página web » se puede encontrar el código que permitirá incorporar el formulario del buscador a cualquier página o blog, como pedía Galderich.

Etiquetas: ,

Lenguas en sitios de cultura españoles

05 diciembre 2008 15:13

Anteayer tuvo lugar el seminario sobre Lenguas y culturas hispánicas en Internet, que dirigí en la Residencia de Estudiantes de Madrid (aquí están los videos y materiales complementarios; hay un buen resumen en el blog de la Biblioteca de la Complutense).

Entre las muchas cuestiones de interés que surgieron voy a contar algo de la intervención de Isidro Aguillo del Laboratorio de Cibermetría del CSIC, porque afecta directamente a temas de este blog. Se trata de las lenguas usadas en los sitios web de dos tipos de instituciones culturales: los museos y las universidades situados en Madrid y Barcelona. Como es lógico, las lenguas dan idea del público al que se pretenden dirigir las instituciones.

El caso de los museos se presenta en la imagen de arriba. Los museos nacionales no utilizan ni el inglés ni las lenguas cooficiales en el estado español. En Cataluña predomina el catalán, y "el español y el inglés tienen una presencia minoritaria prácticamente pareja".

En lo que respecta a las universidades (cuadro de abajo), sus contenidos web están divididos entre distintos dominios: en el caso de las catalanas .es, .edu y .cat, y esta dispersión va en detrimento de su visibilidad en los buscadores. Además, el correspondiente reparto de contenidos no corresponde a ningún criterio claro. Es constante en todas la presencia del inglés (lengua de comunicación científica por excelencia): entre un 10 y un 20% de las páginas del sitio, mientras que el francés, excepto en la Universidad Complutense, prácticamente ha desaparecido.

Como resume Isidro Aguillo:
Las instituciones culturales y universitarias españolas no se toman en serio la Web. No tienen políticas de publicación Web ni respecto a los dominios. Descuidan la indización y el posicionamiento en los motores de búsqueda. No reconocen la audiencia global potencial y no desarrollan versiones en otros idiomas .

Etiquetas: ,

"Los fundamentos de nuestra economía son fuertes"

17 noviembre 2008 09:17


¿Le suena esta frase? No me extraña, porque parece que se repite mucho en los últimos tiempos...

Vía Information Aesthetics llego al MemeTracker, que rastrea las frases más presentes en la Web en los últimos tres meses. El nombre viene del meme, que es un fragmento de información que tiene éxito en su transmisión, y pasa de persona a persona.

Aunque en este caso más que un meme yo creo que se trata de un mantra. Repita conmigo: "Los fundamentos de nuestra economía son fuertes". Muy bien. Cierre los ojos. Otra vez: "Los fundamentos de nuestra economía son fuertes"...

Etiquetas: ,

Del código de barras al libro

16 noviembre 2008 21:28


Confieso tener una pequeña obsesión por la interfaz entre el mundo físico y el mundo virtual.

Por eso me ha llamado la atención esta noticia aparecida en el blog de Google Libros: los teléfonos móviles dotados de Android (la plataforma de software abierto para teléfonos creada por Google junto con otros) podrán detectar automáticamente con su cámara el código de barras de un libro y lanzar una búsqueda sobre la base de datos de Google Libros.

De esta manera (y si el libro está digitalizado por Google), se podrán hacer búsquedas desde el móvil en el interior de la obra. Uno podría en una biblioteca o librería rastrear el contenido de un libro con código de barras, buscando una palabra o el nombre de un autor citado en su interior, usando solamente su teléfono.

El código de barras refleja el ISBN, identificador único de un libro. Google considera que es a partir aproximadamente de 1995 cuando se estabiliza el uso de códigos de barra, con lo que los libros buscables por este medio deberían remontarse como máximo a esta fecha.

Etiquetas: , , ,

Google Libros: millones de razones para un acuerdo

10 noviembre 2008 14:56

La noticia me sorprendió de viaje, y sólo pude reseñarla de pasada, de modo que vuelvo sobre el tema con más calma.

Antecedentes: Google arranca públicamente en el 2004 con el programa de digitalización hoy llamado Google búsqueda de libros. Sus obras provienen tanto de bibliotecas como de acuerdos con editores. Entre las primeras hay obras en el dominio público (a las que se da acceso íntegro), otras con copyright vigente, y otras que probablemente tengan copyright, pero cuyos propietarios en la práctica son imposibles de localizar: son las obras huérfanas. (De estas dos últimas categorías se enseña sólo una parte).

En el 2005 el Author's Guild, asociación de escritores para la defensa del copyright, pone una demanda a Google Libros, sobre la base de que escanear las obras y hacer factibles búsquedas sobre ellas vulnera el copyright. Esto ocurre en el contexto de una eclosión de proyectos de digitalización (aquí se puede seguir la historia legal del enfrentamiento). A ello siguieron otras demandas como la de la Association of American Publishers.

Pues bien: el 28 de octubre se ha anunciado que se ha alcanzado un acuerdo entre Google y las diversas instancias litigantes. El acuerdo es válido sólo para Estados Unidos y además está pendiente de ratificación por los tribunales. En el resto del mundo las cosas seguirán como hasta ahora.

Con la noticia del acuerdo se han hecho públicas por primera vez las cifras de Google Libros: unos siete millones de libros digitalizados, acuerdos con 20.000 editores y escritores y con veinte biliotecas. De esos siete millones de libros, entre cuatro y cinco millones estarían en situación de obras huérfanas, según John Naughton en The Guardian.

Google pagará por el acuerdo 125 millones de dólares, que servirá para crear el Registro de Derechos de Libros (Book Rights Registry: ya informábamos hace tiempo que tanto Google como las bibliotecas europeas habían emprendido acciones para determinar la situación de las obras huérfanas), pagar las reclamaciones existentes, y costear los gastos legales.

El acuerdo tiene estas características, según Google:

Una vez que se haya aprobado este acuerdo, [usted] podrá adquirir un acceso online total a millones de libros. Esto significa que podrá leer un libro completo desde cualquier equipo conectado a Internet sólo con acceder a su cuenta de la Búsqueda de libros de Google.

También ofrecemos a bibliotecas, universidades y otras organizaciones la posibilidad de adquirir suscripciones institucionales, lo que permitirá a los usuarios acceder al texto completo de millones de títulos mientras los escritores y editores obtienen una compensación por este servicio. Los estudiantes e investigadores podrán acceder a una biblioteca electrónica que combina las colecciones de muchas de las principales universidades del país.

El acuerdo también creará un registro de derechos de libros independiente y sin ánimo de lucro, donde se incluirá a los escritores, a los editores y a otros titulares de derechos de autor. En esencia, este registro ayudará a localizar a los titulares de los derechos de autor y a garantizar que reciben los beneficios obtenidos por su trabajo según este acuerdo.

Además de las suscripciones institucionales y los terminales gratuitos de acceso público, el acuerdo también crea oportunidades para que los investigadores puedan estudiar los millones de volúmenes incluidos en el índice de la Búsqueda de libros de Google. Los académicos podrán enviar consultas computacionales a una institución a través del índice sin tener que leer realmente cada uno de los libros.
De acuerdo con el mismo Google, este acuerdo creará "un nuevo mercado para que autores y editores vendan sus obras". ¿Bajo qué bases? Lo cuenta de nuevo John Naughton en The Guardian:
Google puede mostrar gratis hasta el 20 por ciento del texto, y hacer disponible por línea la totalidad de la obra por una tarifa. La compañía se levará el 37 por ciento [o sea, algo más de un tercio] de los ingresos resultantes , dejando el 63 por ciento par editores y autores. (De este modo los autores pueden obtener ingresos de obras que sus editores no han querido reimprimir. Imaginen qué le habría pasado al negocio de la música si los sellos discográficos hubiera negociado un acuerdo como éste.) Y si Google añade anuncios a los textos que muestra, partirá los ingresos sobre la misma base.
El acuerdo tiene puntos aún por aclarar, pero presenta aspectos claramente positivos, como el de sacar de la oscuridad millones de obras huérfanas. Claramente, tendrá consecuencias impensadas para el comercio del libro, tanto si las obras compradas se suministran por línea (con derecho a imprimirlas) como si se venden en impresión bajo demanda (aspecto no mencionado en el acuerdo, pero que creo que es la gran baza que está detrás de detrás de él).

¿A quién irán a parar los ingresos por venta de obras huérfanas (cuyos propietarios no son conocidos)? Supongo que a las asociaciones que agrupan a derechohabientes, autores o editores. Si de golpe todo el patrimonio de derechos de autor acumulado durante décadas y hoy sin propiedad pasa a ser disfrutado por los miembros de estas asociaciones, sus requisitos de transparencia en la gestión y claridad en el reparto deberán ser llevados al máximo.

Etiquetas: , ,

Geografía de la búsqueda de "lectura"

04 noviembre 2008 09:17


Un ejercicio siempre curioso es mirar la evolución de las búsquedas de un término en Google a lo largo del tiempo, para una zona determinada.

En el ejemplo que presentamos está la búsqueda de la palabra "lectura", desde el 2004 hasta la actualidad. El gráfico muestra una tendencia general ligeramente decreciente, con marcados valles en cada verano. ¿Significa esto que se lee menos en verano? Claramente, no: sencillamente, que hay menos personas buscando el término lectura en España.

Aunque puede haber cierto ruido en la búsqueda (por ejemplo, se tienen en cuenta las "lecturas del tarot"), la verdad es que recoge frases típicas como "promoción de la lectura". La adscripción geográfica de las búsquedas, a pesar de criterios extraños, porque figuran en el mismo nivel autonomías y provincias, marca un claro sesgo positivo a favor de Tarragona y Salamanca. Éste último caso no me ha sorprendido, porque allí hay interesantes instituciones dedicadas al tema. Pero sí lo de Tarragona, que parece además concentrado en búsquedas del 2007. Tal vez algún lector pueda explicarlo...

Etiquetas: , ,

Buscar en el sonido

22 septiembre 2008 09:17


Usted qué preferiría, ¿escuchar (tal vez con un video) una conferencia sobre un tema que le interese mucho, o acceder a su transcripción escrita? Digamos que, si se trata de la intervención de un poeta por quien tiene devoción, puede querer apreciar las inflexiones de su voz, e incluso ver sus ademanes.

Pero si se trata de una intervención técnica o plagada de datos, el texto escrito le permitirá varias operaciones útiles: hacerse una idea global de su extensión y estructura (a través del índice o de la visión de sus apartados), leer "en diagonal" para ver si hay algo de interés, y sobre todo buscar dónde aparece un término o el nombre de un autor.

Las intervenciones orales o en video colgadas en la Red por lo general carecen de acceso a su estructura (aunque nada impediría dividirlas en "apartados"), pero lo que hasta ahora era imposible era buscar una palabra en su interior: frente a un audio o un video de interés, lo único que uno podía hacer para buscar algo era verlo entero, o, todo lo más, acelerar o saltarse partes.

Cuando se quería dar acceso al contenido de una alocución (por ejemplo un discurso), lo que se venía haciendo era transcribirlo íntegramente, aunque ya existía algún buscador que hacía incursiones en audios y videos, como Everyzing.

Pero el desembarco de Google en este sector hace pensar en que esta tecnología se extenderá: su nuevo buscador GAudi ha puesto a disposición del público búsquedas dentro de videos de políticos en YoutTube, pero cuando se amplíe, se abrirá un campo formidable a las búsquedas.

Captura de GAudi: búsqueda de health en discursos de políticos:
las marcas amarillas señalan las apariciones, y al pasar el cursor muestran el texto.


Esta tecnología debe de ser muy específica de cada lengua, y se ha comenzado por el inglés, como es lógico, pero a la vista de cómo avanzan los temas ligüísticos en Google podríamos pensar que es español siga pronto...

Etiquetas: ,

ACAP

17 septiembre 2008 09:17


ACAP (acrónimo inglés de Automated Content Access Protocol, Protocolo automatizado de
acceso a contenidos) es un procedimiento desarrollado desde el mundo editorial para indicar a los buscadores qué partes de un sitio web permiten indizar y cómo. En este sentido, cumple en parte la misión de los archivos robots.txt.

Podría compararse también con las licencias Creative Commons, aunque éstas están orientadas al usuario final, mientras que ACAP es más bien un procedimiento para informar a entidades que recolectan, con distintos fines, materiales de la Web.

El sistema ACAP fue promovido a lo largo del 2006 y 2007 por la World Association of Newspapers (WAN), el European Publishers Council (EPC) y la International Publishers Association (IPA). Entre sus primeros susarios están poderosas agencias de noticias (como France-Presse e Independent News & Media Plc) y grupos editoriales dedicados sobre todo a edición científico técnica (como Reed Elsevier o Macmillan / Holtzbrinck).

Etiquetas: , ,

El nuevo navegador de Google

02 septiembre 2008 18:55


Sin duda se trata de una noticia de importancia: Google ha anunciado que ha creado un nuevo navegador, Chrome, en versión beta, como de costumbre, de tecnología abierta y gratuito. La primera versión es para Windows, pero seguirá para Mac y para Linux.

La forma de presentarlo ha sido un cómic, del gran Scott McCloud (a quien nuestros lectores ya conocen). Esta historieta, en sí misma todo un tour de force, explica muchas cosas para gente que entiende de programación, pero también para simples usuarios.

Más allá de la competencia que esto suponga, sobre todo para Microsoft, se trata de un movimiento muy estratégico. El navegador es hoy en día la plataforma en la que no sólo se accede a la Web, sino donde se ejecutan muchas aplicaciones: escribo este blog en un navegador, y si usted hace un comentario a este post, lo escribirá también en uno. En el navegador podemos recibir el correo y contestarlo, colocar imágenes en la Web, y un sinfín de acciones más.

Además, hay muchas posibles sinergias con otros productos Google: como dice Teleread, "no se puede pensar en posibles escenarios para Chrome sin también recordar la existencia de servicios como Google búsqueda de libros". En efecto: una de las vías de acceso más cómodas para los libros electrónicos podrían ser aplicaciones que corran sobre navegadores. La integración con las búsquedas parece también algo natural. Y por cierto: curioso ejemplo el elegido por el cómic:

Los procesos de compra tendrán también, se asegura, un entorno más seguro en el nuevo navegador. La filosofía de código abierto en la que se basa Chrome garantiza que puedan hacerse muchas mejoras sobre el producto inicial.

Chrome se podrá descargar desde las 21:00 de hoy, hora española.

Adición a las 22:37. Ésta es la dirección de descarga. Y aquí una imagen de este blog en el nuevo navegador.

Etiquetas: , ,

HIlos sueltos

31 julio 2008 09:17

Este es el último post antes de mis vacaciones, de modo que aprovecharé para resumir algunas cuestiones interesantes que, en condiciones normales, habrían merecido comentarios más extensos.

Knol: como ya anunciamos a finales del año pasado, aparece la alternativa moderada de Google a la Wikipedia. Sobre sus peligros véase el Caparazón. Sobre los problemas de colaborar con esta plataforma (frente a la colaboración en Wikipedia) véase Google Blogoscoped. Y, claro, lo que opina Wikipedia sobre su rival.

Cuil: se trata de un nuevo buscador. Sobre él habla Francis Pisani.

Impresión bajo demanda: libreros independientes americanos se asocian para hacerla. Pero al tiempo, ¿por qué no comprar e-books en las librerías?

Del historiador Robert Darnton un artículo sobre La biblioteca de la Nueva Era, muy favorable a las digitalizaciones de Google Libros, y la respuesta menos optimista de Jean-Claude Guédon, de la universidad de Montreal (junto con la contrarrespuesta de Darnton). Por cierto, en la misma dirección, en otra puntualización de los lectores (ese rasgo tan útil de la New York Review of Books), un comentario de Boudewijn Walraven, profesor de estudios coreanos en la universidad de Leiden, sobre la impresión bajo demanda, en bloques de madera, en Oriente.

Etiquetas: , , ,

Desorden alfabético

30 julio 2008 12:40

Fotografía de Martin Burns

Ya hablamos hace tiempo del orden alfabético y su utilidad manifiesta, incluso en épocas de interfaces gráficas.

¿Hay algún caso en el que el orden alfabético sea claramente desaconsejable? Me he encontrado por casualidad con uno.

El monumento a la Guerra del Vietnam (Vietnam War Memorial) fue creado a través de un concurso que ganó la por entonces joven estudiante chino-norteamericana Maya Lin. El monumento era una cicatriz de granito negro en forma de V, con los nombres de 58.000 muertos en la guerra. Como cuenta el blog CrossLeft:
Lin puso los nombres en orden cronológico, y no alfabético, para ayudar a invidualizarlos. Si los nombres estuvieran en orden alfabético, entonces un ser querido estaría perdido en un mar de Smiths o Jones, o cualquier apellido, y eso despersonalizaría al individuo. Si los nombres están en orden cronológico, llevará más tiempo buscarlo, pero el proceso le valdrá la pena a un miembro de la familia o a un amigo.

Etiquetas:

Bibliografía sobre Google Libros

20 junio 2008 09:17

Vía The Wired Campus, y gracias a Adán Griego, me entero de que ha aparecido la versión 2 de The Google Book Search Bibliography.

Está compilada por Charles W. Bailey Jr., bibliotecario, e intenta recopilar las "cuestiones legales, bibliotecarias o sociales" asociadas con Google búsqueda de libros. Se trata de unos 170 registros que comprenden prácticamente toda la vida del proyecto, y en los que se ha dado prioridad a las fuentes accesibles en la Red.

Se trata, por tanto de una herramienta excelente para el estudio de este colosal proyecto del que forman parte numerosas bibliotecas y editoriales.

Etiquetas: , , ,

¡Enhorabuena!

13 junio 2008 09:28

Cierra Microsoft Live Search libros y académica

23 mayo 2008 19:30

La noticia acaba de hacerse pública: Microsoft cierra dentro de su buscador Live Search la parte dedicada a libros y la académica. Lo comunica la misma compañía.

Los libros y las obras académicas segurán estando integradas en los resultados del buscador, afirma el comunicado, pero no tendrán un apartado independiente. Se interrumpe asimismo el programa de digitalizacion de fondos de bibliotecas y de libros de editoriales colaboradoras.

Live Search Books y Live Search Academic surgieron como respuesta sobre todo a los avances de Google en ambos campos, y sus esfuerzos no han sido pequeños: 750.000 libros y 80 millones de artículos de revistas. Pero, según confesión propia, no han alcanzado a rentabilizarlo. Aunque lo más interesante del comunicado de Microsoft son estas frases:
Sobre la base de nuestra experiencia, prevemos que el mejor medio para que los buscadores hagan accesible el contenido de los libros será rastrear los repositorios de contenido creados por los editores y las bibliotecas. Con nuestras inversiones ahora está disponible a un coste menor, para quienes tengan el interés comercial o el mandato público de digitalizar el contenido de los libros, la tecnología de creación de estos repositorios . [...]

Estamos animando a las bibliotecas a construir sobre la plataforma que desarrollamos con Kirtas, el Internet Archive, CCS, y otros para crear archivos digitales disponibles para usuarios de bibliotecas y buscadores.
Kirtas es la empresa de escáneres que firmó un acuerdo en el 2006 con Microsoft para digitalizar los libros de Live Search. CCS es otra empresa de digitalización. El proyecto del Internet Archive, conocido también como el del Millón de Libros, fue parcialmente patrocinado por Microsoft.

A primera vista, lo que se ve es lo que parece haber: Microsoft reconoce que no va hacer un duro con Book Search, e intenta montar su negocio por otro lado, mientras apoya un proyecto abierto, como el del Internet Archive, que es (junto con Amazon) una de las pocas alternativas que hay a Google Libros. Pero por otro lado es cierto que está aumentando notablemente la cantidad de obras digitalizadas por editoriales y bibliotecas. Quienes desean una amplia difusión de la cultura sólo pueden alegrarse de la existencia de múltiples opciones de acceso a las obras, y ese parece ser el panorama que se está dibujando.

Etiquetas: , , ,

Buscadores y Humanidades: seminario en Madrid y la Web

22 mayo 2008 12:00

El 11 de junio del 2008 a las 10 de la mañana tendrá lugar un seminario en la Residencia de Estudiantes de Madrid. El acto se podrá seguir en directo en la WWW, y después habrá partes sustanciales disponibles en la Red.

Buscadores y la investigación en Humanidades
Dirigido por José Antonio Millán

Los buscadores son el eje sobre el que gravita el acceso a la información, tanto en el universo de la Web como en los corpus documentales especializados. La investigación en disciplinas humanísticas tiene que apelar corrientemente a uno y otro conjunto. Además, y dada la naturaleza de sus objetivos, esta investigación debe hacer un uso variado y creativo de los procedimientos de búsqueda.

Este seminario tiene por objeto ofrecer un panorama de las modalidades de búsqueda generalista que las grandes empresas mundiales están desarrollando, así como de los sistemas de búsqueda surgidos de iniciativas ligadas al mundo de la investigación académica y documental. Servirá de punto de encuentro entre los principales generadores actuales de sistemas de búsqueda y el público especializado que los utiliza.

Programa:
10.00 h.
El universo de la Web
RICARDO BAEZA-YATES, Yahoo! Research

10.45 h.
Las búsquedas, más allá del papel impreso
LUIS COLLADO, Google Book Search / Scholar / News Archive para España y Portugal

12.00 h.
Los libros y Windows Live
JUAN ANTONIO RONCERO MARTÍN, Search Product Manager, Microsoft

12.45 h.
El buscador lingüístico de Edad de Plata, presente y futuro
CARLOS WERT y AGUSTÍN GARCÍA, Residencia de Estudiantes

16.00 h.
¿Qué buscamos en una biblioteca digital?
RAFAEL C. CARRASCO JIMÉNEZ, Director adjunto de la Biblioteca Virtual Miguel de Cervantes

16.45 h.
Las búsquedas en corpus textuales. El banco de datos de la Real Academia Española
CARLOS DOMÍNGUEZ CINTAS, Director del Corpus del Nuevo diccionario histórico de la Real Academia Española

Asistencia gratuita previa inscripción
Información e inscripciones:
Raquel Collazos
Residencia de Estudiantes
Pinar, 21-23
28006 Madrid
Tlf.: 91 563 64 11
E-mail: raquel.collazos@residencia.csic.es

Etiquetas: ,

Orden ¿alfabético?

01 mayo 2008 21:32

El orden alfabético, dispositivo que lleva básicamente intacto un par de milenios, ha ayudado eficazmente a la recuperación de información textual durante mucho tiempo.

A pesar de lo que digan algunos, el orden alfabético no está anticuado: sencillamente, su función ha cambiado. Por ejemplo, no lo usaremos para buscar una palabra en un diccionario por línea (porque basta teclearla), pero sí para buscar una palabra en una lista desplegable: por ejemplo, una relación de países. Quizás la lista podría sustituirse por una mapa del mundo clicable (aunque, ¿y la gente que no supiera dónde está Kazajistán?), o por un árbol jerárquico, que en este caso empezaría por los continentes (aunque, ¿y la gente que no supiera en qué continente está Kazajistán?). Y aún así, en este último caso, pronto habría que llegar a una lista... que estaría mejor ordenada alfabéticamente.

Sin embargo, veo con frecuencia un problema grave en las listas alfabetizadas, y es su traducción: supongamos que en el original era un relación, por ejemplo de países, perfectamente ordenada... en inglés. Y entonces a alguien se le ocurre traducirla, dejando cada país en su sitio original, y la resultante es un batiburrillo considerable.

Escojo el último ejemplo que me he encontrado: la búsqueda avanzada de Google, desplegable "Región. Buscar páginas ubicadas en:" (imagen superior). ¿"Islas Malvinas" e "Islas Feroe" antes de Fiyi? ¿"Alemania" entre "Georgia" y "Ghana"? El enigma se resuelve pensando en "Falkland Islands", "Feroe Islands" y "Germany".

Moraleja: bienvenida la traducción, pero !realfabetizando!

Etiquetas: ,

La Britannica, más accesible

23 abril 2008 10:01

Hoy, día en que se conmemora tanto la muerte de Cervantes como la de Shakespeare, me complace utilizar este último enlace para que los lectores puedan llegar a la extensa entrada sobre el bardo de Stratford-upon-Avon en la Encyclopaedia Britannica, hasta hace nada reservada a suscriptores...

La famosa enciclopedia que deleitara a Borges fue editada primero en papel, luego en CD-ROM y por último en la Web, con sus entradas completas accesibles sólo mediante suscripción. Pero la edición de las obras de consulta y referencia (como bien saben nuestros lectores) ha experimentado grandes cambios con la llegada de la Web y sobre todo con la existencia de la Wikipedia. Ello ha conducido a importantes modificaciones en el comportamiento de sus editores: el último de nuestro entorno fue que la Enciclopedia Catalana abrió sus páginas.

La Britannica no era una excepción; como dice David Corral:
Por cada página vista sobre Britanica.com, se ven 184 en Wikipedia. Este dato supone que mientras la prestigiosa enciclopedia británica tiene 3,8 millones de visitas en un mes, Wikipedia alcanza 21 millones de usuarios.
Pues bien: la afamada Britannica había venido defendiéndose de esta situación con inteligencia: por ejemplo, del año pasado proviene su acuerdo con Google para permitir a los usuarios que así lo desearan añadir sus resultados a las búsquedas.

Pero ahora ha optado por un astuto movimiento: permitir a los editores de webs (que pasan un pequeño proceso de seleccion) que se registren gratuitamente durante un año, pero además que puedan enlazar a cualquier artículo de la enciclopedia, y que sus lectores puedan llegar hasta la versión íntegra, algo antes reservado sólo para suscriptores y que incluye no sólo el texto de la enciclopedia, sino acceso a artículos de revistas seleccionados y enlaces de la Web. Esto es válido para cualquier tipo de entrada, desde Shakespeare hasta pinball machine.

Arriba, todo lo que se ve de un artículo cuando se entra directamente. Abajo, vista parcial del mismo artículo (con las referencias complementarias a la derecha) en visión de suscriptor o... a través de este blog.


¿Qué gana con esto la Britannica? Notoriedad, page rank y quizás nuevos suscriptores. ¿Qué pierde?: probablemente nada. Y, si realmente tiene más calidad que otras opciones disponibles, ahora podrá demostrarlo.

Además, también se da ahora la posibilidad de incluir widgets en las páginas web, como éste:



Los widgets son pequeñas aplicaciones que ya están usando editoriales como Random House y HarperCollins para publicitar sus libros en webs ajenas.

En resumen: Britannica ha hecho un ágil movimiento comercial que reportará beneficios para todo el mundo: los editores de webs y blogs, sus lectores ... y ellos mismos.

Etiquetas: , , , ,

Números con sentido

21 abril 2008 21:15


Los números en las páginas son algo que damos por sentado en cualquier publicación, y de hecho sólo reparamos en ellos cuando usamos un índice (esa fabulosa máquina de encontrar cosas en una obra), o cuando detectamos un salto de sentido entre la página par y la impar de un libro, y la numeración nos informa de que al encuadernador se le ha olvidado un cuadernillo...

Una campaña anti SIDA del diario sudafricano Cape Argus ha optado por utilizar los números de sus páginas para transmitir información estadística. Por ejemplo: "El porcentaje de personas con HIV que vivían en Western Cape en el 2006 era de 15" (para la página 15). Y así sucesivamente.

Etiquetas:

La enciclopedia de la web del libro de Rowling

14 abril 2008 17:51

Hoy ha empezado el juicio de la autora de Harry Potter, J.K. Rowling y la compañía cinematográfica Warner Bros. contra una pequeña editorial que pretende publicar en forma de libro el contenido del sitio web The Harry Potter Lexicon.

Curioso pleito, que pone en cuestión al menos dos interesantes cuestiones:

Un libro hace más daño que una web

Curiosamente, J.K. Rowling había dado su apoyo en el 2004 a este sitio web. Llegó a decir que lo consultaba mientras escribía, en busca de algún dato. La verdad es que, como ocurre con muchas webs de fans, presta un importante servicio de promoción y apoyo a los lectores

¿Por qué la web sí y el libro no? Rowling dice que ella planea publicar una enciclopedia (bueno, digo yo: pues que gane la mejor), y además donar sus beneficios para caridad, no como el editor, al que guía un sórdido afán de lucro...

Aunque: ¿no quería lucrarse Steve Vander Ark, autor del sitio web The Harry Potter Lexicon (y que de hecho no ha sido demandado)? Su web es de acceso gratuito, pero la mayor parte de sus páginas tienen anuncios, y dado que tiene 25 millones de visitas, algo sacará de ellos... Creo que en este pleito lo que está en juego es el prestigio del libro frente a la volatilidad de la Web: lo que no molestaba en web (antes al contrario), molesta en libro.

Ordenar material ajeno es infringir el copyright

El segundo aspecto es que J.K. Rowling afirma que la futura enciclopedia (y por ende el sitio web, seamos serios) vulnera su propiedad intelectual y derechos de autor, porque hace un uso extenso de materiales de la obra...

¡Claro que sí! The Harry Potter Lexicon es una obra cuidadosa, que se extiende a lo largo de 2.347 artículos, elaborada por un profesional de la biblioteca y las obras de consulta, y hace constantes referencias y citas de la obra sobre la que versa: ¡faltaría más!.

Quien quiera ver lo bien que se ha elaborado, que lea las declaraciones del autor acerca de qué considera el
canon de Harry Potter, y sus cuidadosos distingos entre lo que dicen los libros de la saga (en qué edición, además), lo que presuponen algunos de sus párrafos, aunque no lo digan explícitamente, las afirmaciones de la autora, lo que cuenta la película, incluso en escenas supervisadas por la autora, etcétera, etcétera. Su trabajo no ha sido sólo copiar fragmentos, sino bucear en el texto, y el mundo que este describe, hasta los extremos inverosímiles que muestran sus cuadernos de apuntes (ver abajo). Si: un trabajo meritorio, aunque habrá quien piense que al servicio de un objetivo banal... pero ésa es otra historia.


Anthony Falzone, abogado de la editorial y director ejecutivo del Fair Use Project de la Stanford Law School , relacionado con el Center for Internet and Society (fundada por Lawrence Lessig, creador de Creative Commons) ha dicho:
Durante cientos de años todo el mundo ha estado de acuerdo en que la gente es libre de escribir guías de otras obras. Esta es la primera vez que alguien ha dicho seriamente que la gente no tiene el derecho de hacerlo.
Las acusaciones mutuas entre los creadores del mataerial de consulta y los demandantes se están enzarzando, pero esto solamente indica que la tarea de penetrar en una obra literaria, y más si es tan extensa y compleja, sólo puede ser colectiva: las cronologías de los DVDs de la Warner, afirma el editor, han sido copiados de los del sitio web.

Etiquetas: , , , ,

Los cajones del escritor (digital)

28 marzo 2008 09:50


Estoy en el proceso de promoción de un nuevo libro (como quizás algunos lectores hayan notado), y en medio de él he tenido ocasión de reflexionar sobre lo que podríamos llamar "la huella digital de los libros en papel". Tengo por costumbre concentrar en un directorio los elementos relacionados con cada libro en el que estoy trabajando (y, si la cosa se complica mucho, creo subdirectorios dentro de él). Pues bien: me he dado cuenta de que su contenido sigue pautas muy similares casi en cada libro que he hecho.

Los primeros archivos (cronológicamente hablando) son la propuesta que he enviado al editor y a mi agente: un libro con este título provisional, de tal extensión, para tal público... En esta fase suelo tener ya un documento Notas.doc donde voy acumulado de forma desordenada ideas, referencias y demás. Puedo tener también un borrador del contrato, que me ha pasado mi agente.

En la siguiente fase ya aparecen borradores de la obra, que voy rotulando con números correlativos (en este caso Manual de urbanidad 1.doc, Manual de urbanidad 2.doc, etc.). Sí, podría trabajar en un solo documento, pero entonces correría el riesgo de no poder encontrar fragmentos o ideas que había descartado en estadios anteriores..

En un momento dado (el borrador 6, o el 12, depende de la obra), empiezo a mandarla a los amigos y parientes que hacen de protolectores, o sea: conejillos de indias. Rotulo con su nombre los envíos, lo que luego me sirve para no olvidarme a nadie en los agradecimientos.

Aparecen a continuación sus respuestas: algunos me devuelven mi original en Word comentado y otros reúnen en un email las cosas principales. Y por fin genero el Manual de urbanidad OK.doc, que es el que mando a mi agente a y a mi editor. Por fortuna (porque mis editores suelen ser puntillosos), me mandan nuevas sugerencias, y estas constituyen un nuevo archivo, por ejemplo: Manual de urbanidad OK tras editor.doc.

Bien, bien: ya estamos en camino. Aparecen entonces PDFs de las pruebas, que leo y contesto, y luego mi documento con el índice de conceptos (mientras pueda, prefiero hacerlo yo). Hay luego otro archivo con mis sugerencias para textos de contraportada y solapas, y por último uno titulado Envíos para prensa.doc: la lista de críticos y personas a quien enviárselo.

El conjunto de documentos que he ido generando en el proceso de escritura, junto con el correo electrónico relacionado y algunos otros elementos (como marcadores de sitios web, y páginas guardadas en mi disco duro, si ha habido un trabajo de investigación), son realmente la radiografía del proceso de creación autorial y del trabajo editorial.

Estos archivos digitales deberían tener un lugar donde custodiarse, igual que hay archivos a donde van a parar los papelotes de los escritores de antaño. Si no, se corre el riesgo de que cuando se quiera revisar esta época, falten los documentos que mejor podrían explicarla. Y no lo digo por mí, sino por los muchos escritores e investigadores de valía que en España y en Latinoamérica hoy trabajan, sobre todo, en soporte digital.

Etiquetas: , , , ,