Wayback Machine

Ir a la navegación Ir a la búsqueda
Wayback Machine

Logotipo
Información general
Dominio https://web.archive.org/
Tipo Archivo
Comercial
Registro No
Idiomas disponibles inglés
En español No
Estado actual En línea
Gestión
Desarrollador Brewster Kahle
Bruce Gilliat
Propietario Internet Archive
Operador The Internet Archive
Lanzamiento enero de 1996
Ranking Alexa 293 y 303

Wayback Machine es un servicio y una base de datos que contiene copias de una gran cantidad de páginas o sitios de Internet. Si por alguna razón algún sitio no está disponible momentáneamente o ha sido borrado del servidor de origen, es posible consultar una réplica vía "Wayback machine". Como consecuencia de este proyecto, también se puede consultar la historia o modificaciones de las páginas a través del tiempo.

Características

El servicio Wayback Machine funciona de una manera simple: basta teclear la dirección (URL) de una página web para ver cuál es la última copia que hay guardada en el archivo.[1]​Si queremos ver cómo era hace un tiempo una página en cuestión, entonces Wayback machine nos pedirá en qué fecha y año queremos visitar la página. Existe un calendario en la parte superior de la pantalla, que permite ver gráficamente las capturas a lo largo del tiempo. La longitud de las barras del gráfico indica en qué meses se hicieron más copias.

Lo que hace este sitio para almacenar todo el contenido de la página web es muy simple pero ingenioso: almacena sólo el contenido html del código fuente y no guarda las imágenes sino solo el código; por eso, cuando un servidor de imágenes elimina alguna imagen del sitio web original, ésta no es reproducida, sino que se marca como un error 404. En 2012 contenía 10 petabytes de información y crecía en torno a 20 terabytes por mes.[2]

Sin embargo Wayback Machine está lejos de ser una copia completa de internet pues varios sitios evitan su indexación y grabación de información, como por ejemplo usando el archivo robots.txt con: User-agent: ia_archiver Disallow: /

Wayback CDX Server API

Desde noviembre de 2015 Wayback Machine cuenta con un servicio de indexado de capturas de páginas que permite, rápidamente, conocer el historial de grabado para cada URL tanto en formato propio como en formato JSON.[3]​ Dicho servicio es un proyecto en fase beta denominado Wayback CDX Server API y cuyo código fuente y manual de uso está alojado en GitHub.[4]

Referencias

  1. Wayback Machine: la máquina del tiempo de las páginas web se renueva
  2. Minard, Jonathan (25 de octubre de 2012). «10,000,000,000,000,000 Bytes Archived» (html). Archive Org (en inglés). Consultado el 14 de febrero de 2018. «Documentation of the unplugged presentation "10 Petabytes Archived!" on October 25, 2012 at the Internet Archive Featuring presentations by Brewster Kahle, Robert Miller, Kristine Hanna, Alexis Rossi, Dave Marvit, and Roger Macdonald, with live music by Jeff Kaplan (guitar), and Don Knuth (organ).» 
  3. Leetaru, Kalev (16 de noviembre de 2015). «How Much Of The Internet Does The Wayback Machine Really Archive?» (html). Forbes (en inglés). Archivado desde el original el 1 de diciembre de 2015. Consultado el 14 de febrero de 2018. «The complete history of all snapshots ever recorded by the Archive for the homepage of each website was requested using the Wayback CDX Server API through November 5, 2015. While this only reflects snapshots of homepages, rather than sites as a whole, it nonetheless captures a key metric of how often the Archive is crawling each site.» 
  4. Wayback CDX Server API - BETA

Enlaces externos