Posts Tagged ‘emulazione’

Alleanze per il cloud di domani: fine dei giochi per archivi e biblioteche?

Docker_(container_engine)_logo

Ho ripetutamente sostenuto, in questo blog e non solo, circa l’opportunità che archivi e biblioteche si facessero promotori della costruzione di data center pubblici (nel senso di stretto proprietà pubblica, non di public cloud!) analoghi a quelli che i colossi dell’informatica vanno costruendo oramai da un lustro in giro per il globo e che sono destinati ad ospitare gli archivi digitali del futuro (prossimo).
Purtroppo questo mio desiderata è, a giudicare dall’evoluzione dello scenario tecnologico, ben lungi dall’avverarsi; anzi, a guardare le scelte strategiche prese nel frattempo dai player globali, il timore che oramai si sia fuori dai giochi è più forte che mai.
Giusto per dirne una, allo stesso cloud computing, locuzione all’interno della quale si è buttato un po’ di tutto, è sempre meno collegata l’idea di fornire un mero “spazio” all’interno di un server (aspetto che lo ha reso di primario interesse per le implicazioni archivistiche).

Al contrario, si sta scendendo sempre più di livello e, ad esempio con Docker si perseguono obiettivi di “snellimento” degli ambienti sui quali girano le varie applicazioni che, in prospettiva, potrebbero mandare in pensione le classiche virtual machine (VM).

Si badi, niente che riguarda direttamente gli archivi (anche se mi viene da pensare che un ambiente più snello qual è quello container potrebbe render più agevole lo sviluppo di programmi di tipo EaaS; emulation as a service), ma resta il fatto che ancora una volta gli archivi sono ad inseguire l’evoluzione tecnologica, la quale, tanto per cambiare, continua ad essere guidata dai soliti colossi. Per restare in tema di container basta guardare a quanto fatto di recente da Google, che ha “ceduto” il controllo di Kubernetes, la sua piattaforma open-source che offre gli strumenti di comando per quei sviluppatori che utilizzano, per l’appunto, i container, stipulando nel contempo una sorta di pax (ma con i contorni di una vera e propria alleanza) con tutti i colossi parimenti interessati a questa evoluzione: Amazon, Microsoft, Rackspace, Red Hat, etc.

Inutile dire che le carte che si possono giocare gli archivi e le biblioteche, in questo contesto, sono davvero minime al punto che, probabilmente, è bene prendere atto di tutto ciò e cambiare strategia: se non si può essere attivi in prima persona, sarebbe almeno opportuno riuscire ad agire a livello “politico” ottenendo che gli archivi sulla nuvola, ed i meccanismi che li governano, siano “scientificamente” adeguati e gestiti in modo deontologicamente corretto.

Annunci

Hardware: conservare o gettare?

New PC

New PC di XiXiDu, su Flickr

Essendo l’argomento un po’ eretico, spero che le mie professoresse dei tempi dell’università non leggano mai questo post perché probabilmente balzerebbero dalla sedia e si pentirebbero di avermi promosso agli esami! Ciò nondimeno, dopo un paio di settimane che ci rifletto sono giunto alla conclusione che l’argomento merita di essere reso pubblico e dunque eccomi qua. Il quesito che pongo (e mi pongo) è il seguente: siamo così sicuri che anche l’hardware, soprattutto quello che si occupa della memorizzazione ed immagazzinamento dei dati, non vada conservato?
Mi spiego meglio. I vari InterPARES (la fase tre è tuttora in corso e dovrebbe terminare quest’anno) hanno evidenziato come in termini generali la conservazione permanente di documenti elettronici sia possibile solo se si dispiegano adeguate risorse, si seguono determinate procedure e si adotta un approccio dinamico e flessibile tale da adattare le diverse strategie conservative a seconda delle evoluzioni future.
Per quanto queste indicazioni tendano volutamente ad assumere il valore di enunciazione di principi generali, nel concreto una certa preferenza è stata accordata alla metodologia della migrazione (vale a dire il passaggio da vecchie a nuove piattaforme tecnologiche man mano che le prime diventano obsolescenti) purché essa avvenga all’interno di sistemi in grado di assicurare autenticità, affidabilità, etc. ai documenti migrati; inoltre è previsto che i documenti vengano conservati e migrati assieme ai relativi metadati, con questi ultimi deputati a fornire le indispensabili informazioni di contesto.
Come strategia alternativa InterPARES suggerisce l’emulazione, ovvero il far “girare” all’interno di ambienti tecnologici software altrimenti non funzionanti e con essi i rispettivi documenti; l’emulazione, dal momento che non comporta la modifica della sequenza binaria dei documenti rappresenterebbe l’optimum, peccato che sia costosa e che ponga non indifferenti difficoltà tecniche.
In tutto questo l’hardware trova scarso spazio nelle riflessioni teoriche, per quanto la sua obsolescenza sia perfettamente nota (oltre che evidente a tutti coloro che possiedono un qualsivoglia gingillo tecnologico); di norma ci si ricorda che esso esiste (specificatamente al tema della conservazione): 1) allorquando si deve decidere su quali supporti e/o sistemi puntare per lo storage di breve – medio respiro (nastro, disco ottico, disco rigido esterno, NAS, RAID, etc.) 2) nel momento in cui esso sta per arrivare alla fine della propria “carriera” e si propone di creare un “museo dell’informatica” con il compito di tenere operative quelle macchine senza le quali i relativi SW (con annessi dati e documenti) diventano inutili / inutilizzabili.
In realtà mi sto convincendo sempre più che conservare l’hardware, o in subordine una dettagliata documentazione sul tipo di infrastruttura posseduta, sia di notevole importanza per comprendere appieno il valore attribuito a specifici materiali, nonché il contesto e la “stratificazione” dell’archivio del soggetto produttore. Alcuni banali esempi renderanno più chiara la mia posizione.
Prendiamo il caso di un’impresa: se essa è previdente, provvederà a duplicare (ed in taluni casi a moltiplicare) quei dati e documenti ritenuti più critici e che non può assolutamente permettersi di perdere; similmente essa potrebbe decidere di allocare i dati considerati importanti in partizioni più prestanti della propria infrastruttura HW e viceversa per quelli meno importanti (è questo il caso tipico dei sistemi HSM; Hierarchical Storage Management). Il ragionamento è valido anche per il singolo individuo (= archivi di persona): l’adozione di particolari strategie conservative (backup sistematici su dischi rigidi esterni oppure sulla nuvola) così come la scelta di attribuire maggior protezione a specifici dati e documenti può aiutare a comprendere a quali di essi il produttore accordasse maggior valore. Ma non finisce qua! La conoscenza delle modalità di storage / conservazione può aiutare a chiarire aspetti relativi al modus operandi del soggetto produttore oltre che dare una spiegazione alla presenza, altrimenti non comprensibile, di varianti dello stesso documento: tipico il caso del documento A conservato nell’hard disk e del documento A-bis (leggermente diverso) conservato in una cartella public accessibile a più persone e frutto di un lavoro collettivo. Ovvio che se non sappiamo da dove proviene A e da dove proviene A-bis potremmo essere tentati di attribuire la differenza tra i due (tecnicamente il “mancato allineamento”) ad un back-up di aggiornamento fallito, perdendo così importanti informazioni sulla genesi del documento stesso (per un file di testo pensiamo alle diverse stesure) nonché alla sua “stratificazione”.
Da ultimo, la stessa analisi del tipo di hardware adoperato fornisce informazioni utili: il ricorso a materiale non consumer ad esempio indica ipso facto attenzione e sensibilità per le problematiche della conservazione!
Alla luce di quanto esposto credo appaia evidente a tutti come approfondire la conoscenze del tipo di infrastruttura di storage approntata dal soggetto produttore sia un’opera tutt’altro che infruttuosa ma capace di fornire informazioni aggiuntive sul contesto di riferimento e soprattutto di attribuire un valore qualitativo a dati e documenti che nel mondo digitale siamo in genere soliti considerare in termini meramente quantitativi.
Concretamente tale obiettivo è raggiungibile, al di là della provocazione iniziale di “conservare l’hardware” (compito oggettivamente improbo) ampliando la nozione di “metadato tecnico” ed inserendo alcuni campi e tag capaci, per l’appunto, di descrivere quella miniera di informazioni preziose che risulta essere l’hardware; insomma, la possibilità di fare qualcosa in questa direzione c’è, adesso tocca agli “iniziati” dei linguaggi di marcatura mettersi all’opera.

%d blogger hanno fatto clic su Mi Piace per questo: