Guardando la WWW

16 noviembre 2007 10:37


Archive-It es un proyecto del bien conocido Internet Archive, que colabora con instituciones para que éstas decidan qué sitios web archivar. Como es sabido, el Internet Archive recolecta webs según ciertas pautas (el azar, o la propuesta de sus gestores), a las que luego se puede acceder mediante la WayBackMachine. Archive-It hace acuerdos con instituciones para que éstas archiven por sí mismas no sólo sus propios materiales, sino también los materiales ajenos que consideren valiosos (en principio, cualquier página web que no tenga una indicación robot.txt para que no sea recolectado por los buscadores se puede archivar).

Las recolecciones de las distintas instituciones pueden constituir colecciones diferenciadas. Por ejemplo, la California Digital Library ha archivado varias decenas de webs (desde oficiales hasta blogs) relacionadas con los recientes fuegos de California.

Las instituciones que colaboran con Archive-It pueden también encargar recolecciones específicas. Por ejemplo, la Library of Congress ha pedido a la Electronic Literature Organization (fundada, entre otros por el novelista Robert Coover, y que se ocupa de expresiones literarias que no serían posibles fuera del medio digital) que reúna una muestra de 300 sitios web que contengan o recopilen este tipo de obras (cuenta if:book).

Etiquetas: ,