Posts Tagged ‘archivi sulla nuvola’

La settimana prossima arriva Drive, il servizio di cloud storage di Google. Cosa cambia per gli archivi

Cloud storage: a confused but evolving market

Cloud storage: a confused but evolving market di joe.ross, su Flickr

Di Google Drive, servizio di cloud storage del gigante di Mountain View, si parla da tempo ma questa sembrerebbe essere davvero la volta buona. I principali blog tecnologici hanno infatti diffuso la notizia che la settimana prossima è previsto il lancio del nuovo servizio; John Biggs di Techcrunch è stato pure in grado di fornire la prova dell’esistenza (si veda l’articolo su Techcrunch) avendone persino scaricato l’app! Biggs non è riuscito ad entrare nel nuovo servizio, in quanto esso risulta “essere ancora non abilitato per la sua utenza” (ovvio dal momento che ufficialmente il servizio nemmeno esiste), ma ha potuto scoprire che offre il supporto nativo per quei tipi di file creati con strumenti come Google Docs e GDraw. Per il resto le indiscrezioni trapelate indicano che Google, che da tempo sta lavorando a questo dossier, adotterà una politica aggressiva del mercato: è infatti ormai opinione comunemente accettata che saranno ben 5 i Giga di memoria gratuitamente messi a disposizione (ovvero più del doppio rispetto a Dropbox, principale rivale) e verosimilmente saranno immediatamente disponibili le relative app per Android ed iOS, a testimonianza dell’importanza cruciale assunta dalla dimensione mobile (comprovata dagli accordi stipulati dalla citata Dropbox con HTC per l’One X e Samsung per il Galaxy Tab).
Personalmente della notizia, in sé scontata, trovo interessanti le implicazioni industriali e quelle archivistiche: delle prime basti qui dire che è in atto quello che Chris Velazco, sempre di Techcrunch, definisce cloud storage clash e che vede in campo, oltre alle due aziende già ricordate, pesi massimi del calibro di Microsoft (con Skydrive), Amazon (con Cloud Drive) ed Apple (con iCloud). La domanda a questo punto è: c’è spazio per tutti sul mercato? La natura affermativa o negativa della risposta dipende anche dai prezzi che Google farà per i servizi pay (purtroppo, lo dico per inciso anche se la questione meriterebbe più spazio, quando si valuta un servizio di cloud storage quello dei soldi è il principale parametro osservato, mentre scivolano in secondo piano aspetti quali garanzie legali e bontà delle soluzioni tecnologiche adottate): se, come credo, questi saranno altamente competitivi è probabile che non tutti ci staranno più dentro con i costi e dunque potrebbe profilarsi qualche operazione di M&A. Di sicuro il settore è ritenuto profittevole, se si considera che ad ottobre 2011 Dropbox, azienda contestualmente valutata in 4 miliardi di dollari, non ha avuto alcun problema a portare a termine un round di finanziamenti da 250 milioni di dollari.
Non meno interessanti le ripercussioni “archivistiche”, le quali sono a mio avviso essenzialmente di due ordini: 1) il primo riguarda nello specifico Google, 2) il secondo è di respiro più generale. Procediamo con ordine.
1) Come noto numerosi servizi di Google (GMail e Google Docs su tutti) sono largamente usati da molte Pubbliche Amministrazioni; ora che arriva Google Drive vien quasi automatico pensare che molti dei dati e documenti prodotti da queste ultime saliranno sulla nuvola e di qui prenderanno… vie ignote! Il problema, insomma, è il solito: a meno che Google non abbia ampliato o costruito ex novo i suoi data center europei (due nei Paesi Bassi ed uno in Belgio) questi dati e documenti prendono la via degli Stati Uniti violando pertanto le leggi UE sul trasferimento dei dati (sorvoliamo qui su quelle dei singoli Stati!). In altri termini l’utilizzo di Google Drive da parte di questi soggetti pubblici non sarebbe attualmente possibile, motivo per cui vedo aprirsi quattro possibili strade: a) l’azione di lobby dei vari colossi hi-tech ottiene dagli euroburocrati una deroga al trasferimento dei dati sulla nuvola qualora vengano rispettati alcuni paletti fissati su misura b) Google (& soci) si adattano e realizzano / ampliano data center nel Vecchio Continente (non sarebbe male, giacché si creerebbero nuovi posti di lavoro qualificati) c) noi europei rinunciamo ai vantaggi della nuvola made in Mountain View oppure al contrario d) ci sobbarchiamo, magari in maniera collettiva, degli oneri di realizzazione di queste strutture strategiche.
2) La questione di carattere generale è la seguente: la discesa in campo di Google in termini di teoria economica (rudimentale) è da accogliere con favore in quanto amplia la concorrenza ed a beneficiarne dovrebbe essere il consumatore / utente finale. Dal punto di vista pratico però non vorrei che si rafforzasse quella frammentazione degli archivi, specie quelli di persona, di cui ho ripetutamente parlato: giusto per fare un esempio “mirato” se possiedo casualmente uno smartphone HTC, un tablet Kindle Fire ed un normale PC con connessione ad Internet ed account Google il risultato sarebbe che le foto ed i video realizzati con il telefonino intelligente finiscono sulla nuvola di Dropbox, i miei e-book ed i miei film su quella di Amazon ed infine i miei documenti su quella di Google! Una vera e propria diaspora!
Si ha pertanto la riprova che la nuvola, sia essa di “proprietà” del singolo cittadino o (a maggior ragione) di un ente pubblico con migliaia di Giga caricati, per apportare reali vantaggi va gestita con attenzione e che tale attività di gestione può essere facilitata da una parte attraverso l’uso consapevole della nuvola (ad esempio imponendosi una sorta di codice di comportamento per cui i vari documenti e contenuti non vanno uploadati a casaccio) dall’altra ricorrendo a quegli strumenti di metacloud descritti in un precedente post.
Questi ultimi servizi, in quanto capaci di garantire l’indispensabile integrazione e coerenza, saranno, ne sono convinto, il prossimo oggetto del contendere dei colossi tecnologici.

Annunci

Archivi in the cloud

Server farm

Server farm (foto MrFaber)

PREMESSA

Più volte in questo blog ho fatto riferimento al cloud computing ed alle sue ricadute archivistiche (e biblioteconomiche). Dal momento che non mi sembra ci sia molta chiarezza a riguardo, provo a farne un po’ io, in particolare spiegando cos’è questo fantomatico paradigma tecnologico e cosa si intende dire quando si afferma che “un archivio va sulla nuvola”.

DEFINIZIONE

Partiamo dall’inizio: la definizione di cloud computing è assai eterogenea e ne esistono più declinazioni, personalmente trovo che quella fornita da Rinaldo Marcandalli sia una delle più esaurienti, ovvero: “un insieme (o combinazione) di servizi, software e infrastruttura It offerto da un service provider accessibile via Internet da un qualsiasi dispositivo. Tutto si traduce in offerta di servizio, che in funzione dell’entità erogante può essere categorizzata in quattro generi: basata sul Web (il genere Rich Internet application da Flickr a Microsoft Office Live); Software as a Service o Saas (applicazioni accessibili Internet e customizzabili come Gmail e Salesforce.com); Platform as a Service o Paas (esempi classici le piattaforme Force.com e Google App Engine); Infrastructure as a service o Iaas (servizi infrastrutturali di capacità di elaborazione virtualizzata tipo Amazon Elastic compute cloud o Ec2, o di hosting di server virtualizzati o di utilità storage; importante osservare che Iaas può venir erogata da un data center pubblico o privato)”.
Si noterà che molti degli esempi riportati da Marcandalli non rappresentano novità assolute, al contrario riguardano servizi noti al grande pubblico; in effetti il tratto distintivo di un servizio in cloud computing non dipende tanto dal suo livello di innovatività ma piuttosto dalla modalità di erogazione (in questo senso i requisiti di scalabilità e personalizzazione sono essenziali).

GLI ARCHIVI SULLA NUVOLA

Come si sarà evinto dalla lettura della definizione appena data, all’interno della tipologia definita come IaaS vi è la precisa funzione di “utilità storage“, che è quella qui di nostro principale interesse e che andrò ora ad analizzare (da notare bene che per il soggetto erogante tale servizio si colloca a livello infrastrutturale mentre per il client si tratta di accedere ad un servizio basato online, ovvero ricadente all’interno di una delle due prime categorie a seconda del grado di customizzazione). In soldoni si tratta della possibilità, per individui ed organizzazioni pubbliche e private, di “archiviare” i propri dati e documenti all’interno di server remoti sui quali in genere NON SI HA alcun controllo. Se fino a ieri dunque la destinazione di questi dati erano le varie unità di archiviazione di massa di tipo generalmente magneto-ottico (dagli hard disk esterni ai juke box di CD/DVD, passando per tape library e via discorrendo) di proprietà, oggi essi finiscono in server residenti in luoghi talvolta non geograficamente determinati, aspetto che rende il ricorso al termine “nuvola” del tutto calzante ma che pone nel contempo numerosi problemi pur a fronte di alcuni innegabili vantaggi.

I VANTAGGI

Abbracciare il modello del cloud computing garantisce alcuni innegabili vantaggi per coloro (privati ed organizzazioni) che effettuano questa scelta: a) essi hanno il vantaggio economico e “gestionale” di non dover più preoccuparsi di comprare e, per l’appunto, gestire, lo spazio di memoria necessario a contenere i propri dati e documenti (si tratti del disco rigido esterno da poche decine di euro o del server da qualche migliaio, la sostanza non cambia) b) in linea di principio i propri dati e documenti vengono messi al riparo dai rischi di perdita, corruzione, cancellazione, etc. (poi anche le server farm possono andare a fuoco, ma su questo meglio sorvolare…) c) caricare i propri dati e documenti sulla nuvola è in linea con l’evoluzione che sta interessando il modo di organizzare l’attività lavorativa nonché la gestione delle risorse umane: lavoro in condivisione e senza l’obbligo di trovarsi fisicamente in uno specifico ufficio o sede di lavoro, in quanto vi si può accedere attraverso molteplici dispositivi (tablet, notebook, netbook, smartphone, etc.). Il risultato ultimo di tutto ciò è non solo una ridefinizione dei carichi individuali e dei flussi di lavoro (inclusi quelli documentari), ma pure un aumento nella circolazione di idee, della conoscenza collettiva e (si spera) della produttività.

I PROBLEMI

Nella definizione data da Marcandalli si parla di “utilità di storage”, anche se è invalso l’uso del termine di “archivi sulle nuvole” come suo sinonimo, benché qualunque archivista abbia perfettamente presente come quest’uguaglianza sia ben lungi dal corrispondere al vero! Come bisogna dunque considerare questi servizi? Come meri “depositi” oppure come archivi? Una veloce analisi di un campione di essi basta ed avanza per evidenziare carenze tanto dal punto di vista teorico quanto da quello pratico, tali da far propendere indubbiamente per la prima opzione.
Dal punto di vista teorico semplicemente non è possibile parlare di archivio, dal momento che il client sceglie (con modalità differenti da servizio a servizio) quali dati e documenti caricare sulla nuvola sicché si viene a creare una completa discrasia tra l’archivio presente in locale e quello in remoto cosa che a sua volta fa venir meno la necessaria organicità oltre che il fondamentale concetto di vincolo archivistico (e qui non mi sto riferendo al tradizionale vincolo puro, ma al concetto “nuovo” di vincolo impuro sviluppato in ambito di archivio informatico da autori come Antonio Romiti!). A rafforzare un tale drastico giudizio contribuisce poi la mancanza de facto di un contesto così come l’assenza di una profondità temporale (di norma i documenti sono datati solamente a partire dal momento dell’upload, con un evidente effetto distorsivo).
Non meglio vanno le cose se si esaminano tali servizi per quanto riguarda il profilo tecnico e legislativo; infatti, usando come criteri di valutazione quelli suggeriti da Chenxi Wang in un interessante report redatto per Forrester (peraltro sovrapponibile in molti punti alle MOIMS-RAC stilate dal Consultative Committee for Space Data Systems), i servizi in analisi risultano quanto meno carenti circa i seguenti aspetti: 1) integrità dei dati uploadati non garantita, con risarcimenti nulli o irrisori in caso di loro perdita 2) loro residenza ignota (spesso le aziende si giustificano asserendo che il non rivelare l’ubicazione dei data center fa parte della stessa politica di sicurezza e prevenzione) 3) salvo rari casi, non viene esplicitato in alcun modo il tipo di architettura adottata (ad es. RAID3, 4, etc.) così come gran pochi cenni si fanno alle politiche in fatto di disaster prevention, business continuity e le relative misure adottate (e questo è paradossale, essendo proprio il desiderio di cautelarsi da simili evenienze a spingere molti CIO ad adottare il modello del cloud computing… in pratica a volte si abbandona il noto per l’ignoto!) 4) assenza di audit, con il risultato che talvolta è impossibile stabilire chi e quando “ci ha messo le mani” e su quali e quanti di questi dati e documenti 5) scarsi e/o generici riferimenti alle leggi di riferimento in tema di privacy, etc.

LE SOLUZIONI

Anche alla luce di molte di quelle problematiche individuate nel precedente paragrafo si sono cercati dei correttivi tali da far accettare il modello cloud anche ai responsabili delle strutture informatiche più restii, senza però che tali correttivi togliessero quegli elementi di indubbio vantaggio. A riguardo, essendo uno degli aspetti più critici (e criticati) quello della sicurezza (fisica e “intellettuale” dei dati e documenti caricati), molte organizzazioni stanno creando delle private cloud, ovvero delle infrastrutture tecnologiche che ricalcano i medesimi principi di una “normale” nuvola (definita per distinguerla dalla precedente public cloud) ma che sono usate esclusivamente dalle organizzazioni stesse che le realizzano. Così facendo si godono dei vantaggi elencati e si annullano per contro gli aspetti negativi; l’unico neo è che una simile opzione è praticabile solo da realtà grosse e dotate del necessario capitale finanziario, umano e tecnologico mentre quelle più piccole ed i singoli individui non potranno che affidarsi a quello che c’è sul mercato! A questi ultimi, dunque, non resta altro che cercare di contrattare con il fornitore servizi il più possibile vicini ai propri desiderata.
Un’altra strada percorsa è quella seguita da Amazon con il governo degli Stati Uniti, con la prima che ha “riservato” al secondo una cloud specifica ed ottemperante ai particolari e più restrittivi requisiti del “cliente” Federale.
Dal momento che non tutti hanno il peso contrattuale del governo statunitense, sono state poi trovate ulteriori soluzioni intermedie, com’è il caso delle cosìdette hybrid cloud, che come suggerisce il nome presentano elementi dell’una e dell’altra soluzione.

LE PROSPETTIVE

Dando credito alle previsioni delle principali società di analisi e ricerca del mercato, il futuro del cloud computing è roseo: secondo Gartner il suo giro d’affari complessivo nel 2010 si è attestato attorno ai 68 miliardi di dollari. Il peso complessivo dello storage all’interno di questo settore è preminente ed assicurerebbe quasi la metà degli introiti. E che “gli archivi sulla nuvola” siano un business che porta guadagni lo confermano gli stessi operatori. La statunitense Dropbox è quotata attorno ai 4 miliardi di dollari e persino in Italia Telecom, che ha lanciato “Nuvola Italiana”, lo ha definito un “business profittevole”! Se dunque sembra proprio che dovremo abituarci alla prospettiva che i nostri “archivi” finiscano sulla nuvola, possiamo almeno sperare che intervengano alcuni fattori correttivi di questi servizi. Ad esempio l’inserimento di metadati rappresenterebbe già un notevole passo in avanti, così come la partecipazione degli archivisti nella fase di progettazione delle private cloud che sicuramente le Pubbliche Amministrazioni vorranno realizzare sarebbe un altro aspetto sicuramente positivo. In generale, poi, vale la raccomandazione di leggere attentamente i “Termini & Condizioni” del servizio e cercare di valutare l’affidabilità della soluzione tecnologica proposta (l’assenza di specifiche tecniche sulle quali poter effettuare valutazioni è di suo un elemento negativo!), personalizzandoli ove possibile.

CONCLUSIONI

Da quanto scritto si capisce come negli “archivi sulla nuvola” vi sia la compresenza di aspetti positivi e negativi; nell’attesa che anche questi servizi maturino (e nella convinzione che ciò equivarrà ad un loro miglioramento) credo stia all’utilizzatore finale discriminare tra buoni e cattivi servizi. In altri termini il buon senso come principio guida è l’unico mezzo per non rimanere “scottati” da una parte e perdere il treno dell’innovazione tecnologica dall’altra perché, credo di non essere troppo enfatico sostenendo ciò, il futuro degli archivi passa anche dalla nuvola.

Per la versione su Storify con puntuali riferimenti a documenti e notizie alla base di questo post cliccate qui.

%d blogger hanno fatto clic su Mi Piace per questo: