Internet è ormai diventato lo spazio per eccellenza dell’informazione e l’incredibile archivio di milioni di dati, ma ha un difetto: quello che i suoi contenuti cambiano con rapidità e che molti collegamenti portano a dei siti ormai cancellati e irraggiungibili, scomparsi nel passato del web.
Con le pubblicazioni su carta, le biblioteche e gli archivi di tutto il mondo hanno sempre fatto e fanno ancora un enorme sforzo per preservare tutto ciò che è stato stampato nel tempo, ma con l’avvento di Internet il compito di catalogare, memorizzare e ritrovare un dato è uno sforzo immenso che davvero pochissime biblioteche sono state disposte a fare. Le pagine del web vengono create, cambiate e poi muoiono, senza alcuna traccia delle pagine che magari valeva la pena conservare.
Fortunatamente non tutto è perduto, grazie all’immenso lavoro di due compagnie di digitalizzazione elettronica di Brewster Kahle: “Alexa“, ora venduta ad Amazon.com, e Internet Archive. Dal 1996, si occupano di memorizzare pagine web comprendenti anche le immagini. Col lancio nel 2001 della Wayback Machine, questo immenso archivio è ora liberamente accessibile a tutti e utilissimo per:
- scoprire com’è cambiato negli anni un sito
- viaggiare nel tempo agli albori di Internet
- usarlo come supporto a lezioni sulla storia del computer e dell’informatica
- ricavare dati per ricerche e PowerPoint
La “Macchina del Tempo” di Kahle comprende innumerevoli terabytes di dati pari a circa 85 miliardi di pagine memorizzate a partire dal 9 novembre 1996 (!). Inserendo l’indirizzo web di un sito nel semplice motore di ricerca della homepage e cliccando sul “Take me back“, compare una pagina che presenta una lista di date divise per anno riferite ai vari momenti in cui quel sito è cambiato o è stato memorizzato con nuovi contenuti. Interessante scoprire come nella stragrande maggioranza dei casi, la colonna che va dal ’96 al ’99 è molto povera, segno tangibile di come Internet non fosse accessibile a tutti. A partire dal 2001, in particolare, comincia il boom.
Cliccando una delle date fornite, verremo trasferiti sul sito richiesto che verrà visualizzato come esattamente compariva in quel giorno. Ecco come orizzontarci:
- l’indirizzo del sito http://www.sito.net del 30 dicembre 2001 memorizzato alle ore 10 30 minuti e 20 secondi, ad esempio, cambierà in “web.archive.org/20011230103020/http://www.sito.net“
- questa lunga lista di numeri corrisponderanno all’anno 2001, al mese 12, al giorno 30, alle ore 10, ai minuti 30, e ai secondi 20 (AAAAMMGGhhmmss = 2001.12.30 la data e 10.30.20 l’orario).
Davvero notevole come precisione. L’unico limite dell’archivio è dato da qualche collegamento a immagini non più disponibili sul web, ma il database è così grande che non c’è da annoiarsi.
Un sito imperdibile da inserire tra i “preferiti”.