Posts Tagged ‘Internet Archive’

Dalla crisi di SoundCloud un campanello d’allarme per gli archivi musicali in cloud

La notizia l’ha data per primo Techcrunch: SoundCloud, “lo YouTube della musica”, si trova in serie difficoltà finanziarie e, con l’obiettivo di tagliare i costi, si accinge a licenziare il 40% del proprio personale.
Nel prosieguo del post, il blog tecnologico californiano si sofferma principalmente sulle questioni economiche, sull’analisi del perché il modello di business adottato non abbia funzionato, esplorando le possibili opzioni per il rilancio di questo universalmente apprezzato servizio. Solo in chiusura dell’articolo ci si pone la domanda, ovviamente centrale per il sottoscritto, della fine che faranno, in caso di chiusura definitiva, le migliaia di tracce audio finora caricate: a tale domanda non viene fornita risposta ma l’autore non manca di evidenziare di come si tratti in molti casi di “rarità” (i file audio caricati consistono infatti per la maggior parte di remix artigianali, podcast, esecuzioni live, etc.), soggiungendo, con una vena nostalgica, come a venir meno è una piattaforma che ha rappresentato e tuttora rappresenta un punto d’incontro per decine di musicisti indipendenti, stimolandone la creatività.

A tornare con decisione sul punto è Brian Feldman del New York Magazine: Feldman infatti ricorda che, dovesse chiudere SoundCloud, a sparire sarebbero non solo le tracce audio ma anche un’intera scena musicale (quella del cosiddetto “SoundCloud Rap”, genere caratterizzato da contaminazioni punk, emo, etc. sul quale ha scritto persino il New York Times e del quale riportiamo qui sopra un sample) con la relativa community (virtuale ma anche fisica), contraddistinta da specifici linguaggi, codici e stili. Il problema, per Feldman, non è pertanto esclusivamente di business ma anzi soprattutto “culturale” e questo perché “as we move creative scenes from cities and neighborhoods and onto the web, we outsource the publishing, storage, and archiving of their products to young, for-profit businesses — and therefore run the very serious risk of losing huge and important libraries of culture […]”. Ecco dunque che da più parti si invoca l’intervento di un cavaliere bianco che salvi l’azienda o, dovesse la situazione precipitare, almeno le tracce musicali fin qui caricate. Peccato che anche quest’ultima strada non sia esattamente indolore: secondo Jason Scott di Internet Archive per conservare “nel prevedibile futuro” (arco temporale, permettetemi, alquanto fumoso…) il petabyte di dati che costituiscono l’archivio musicale di Soundcloud, sono necessari da 1,5 a 2 milioni di dollari, cifra che, per un’organizzazione che vive essenzialmente di donazioni, non è così semplice racimolare.

In attesa di vedere l’epilogo di questa storia, tre mi pare siano i punti degni di essere messi in rilievo: 1) con l’avvento della cosiddetta musica liquida, vale a dire fruibile senza la presenza di un supporto fonografico tradizionale (sia esso CD, vinile oppure nastro), la “musica” – secondo un trend che come noto riguarda anche altre tipologie di materiali – non risiede più presso il soggetto produttore né tantomeno presso il generico fruitore bensì presso aziende private (com’è appunto il caso di SoundCloud) che spesso e volentieri impongono pesanti vincoli / limitazioni al loro ascolto (è ad es. risaputo che con servizi tipo Spotify oppure iTunes non si acquista la musica che si ascolta, bensì la si noleggia) 2) se chiude il servizio, viene in definitiva a mancare il contesto (che, in base ai principi archivisti, è non meno importante dei documenti stessi) che ha consentito la genesi e la formazione delle “canzoni”; ciò significa, per replicare idealmente a Jason Scott di Internet Archive, che non si tratta solo di reperire i soldi necessari per le relative risorse di storage ma di conservare la “piattaforma SoundCloud” tout court (!), il che, inutile dire, è affare leggermente più complicato 3) anche da questa vicenda emerge l’estromissione, o peggio ancora l’impotenza, degli istituti pubblici di fronte alle sfide poste dal digitale: nel caso italiano, ad esempio, l’Istituto Centrale per i Beni Sonori ed Audiovisivi (ex Discoteca di Stato), che in base alla Legge 106/2004 sul deposito legale dovrebbe provvedere alla raccolta “di tutti i beni sonori ed audiovisivi prodotti e distribuiti in Italia”, ben poco avrebbe potuto fare preventivamente e questo per il semplice motivo che, nel momento in cui ci si affida a servizi (peraltro stranieri) come SoundCloud, la produzione e distribuzione musicale non passa più attraverso le case discografiche che, finora, controllando il mercato avevano anche potuto fungere da collettore di quanto prodotto.

Il quadro sopra delineato risulta dunque alquanto cupo giacché è la natura stessa della musica liquida (punto 1) a renderne difficile, per quanto non impossibile, l’archiviazione; oltre agli aspetti legali, concorrono a rendere ardua questa “cattura” oggettive criticità tecnologiche (punto 2) e di inefficacia – ma vien quasi da dire inattuabilità – delle prescrizioni legislative (punto 3). Con queste premesse pare difficile pensare che, in futuro, potranno essere predisposti strumenti bellissimi come il portale “Archivi della musica”, capace di tessere le relazioni esistenti tra soggetti produttori (ad es. cantautori e compositori, cori, accademie e conservatori musicali dei quali vengono forniti profili biografici / istituzionali ed artistici) ed i relativi soggetti conservatori (fondazioni, associazioni, etc.), mettendo a disposizione relativi inventari e spesso un ricco corredo documentario, iconografico e sonoro. Va peraltro osservato come in questa direzione si stiano già muovendo servizi come SoundHound e Shazam: nati come app per dispositivi mobili capaci di riconoscere, fornendo i relativi cantanti, titoli e dati catalografici, le canzoni che si stanno ascoltando (motivo per cui a monte di questi servizi vi è uno sterminato archivio / database di canzoni), tali servizi hanno ampliato il proprio “raggio d’azione” finendo con l’aggregare alla musica i relativi testi, video (da Youtube) oltre a biografie dei cantanti / gruppi musicali.
A guardare l’evoluzione dei citati servizi (ai quali mi permetto di aggiungere DiscoGS per il raffinato livello di dettaglio catalografico al quale scende) vien dunque da sperare che, nel momento in cui il digitale mette in crisi istituti e prassi consolidate, esso sia in grado di far emergere nuovi strumenti che, benché in modo nuovo, esaudiscono immutate esigenze di “conservazione”!

Pubblicità

Internet ed instabilità tipografica

Does the Internet make you smarter?

Does the Internet make you smarter? (Illustration for the Wall Street Journal) by Charis Tsevis, on Flickr

In un lunghissimo articolo apparso qualche settimana fa sul The New Yorker a firma di Jill Lepore vengono toccati moltissimi di quei temi da anni al centro del dibattito della comunità archivistica: dall’opportunità di “archiviare Internet” dandogli la necessaria profondità storica al ruolo svolto in questa direzione da organizzazioni non governative come Internet Archive con la sua Wayback Machine (il cui funzionamento però, fa notare l’autrice, ha ben poco di archivistico essendo le varie “istantanee” del web salvate da quest’ultima organizzate semplicemente per URL e per data!) passando per il crescente impegno profuso in questo settore da parte di istituzioni pubbliche (come la British Library o la National Library of Sweden, le quali portano avanti una tradizione tutta europea che affonda le sue radici nell’istituto del deposito legale) per finire con le implicazione derivanti dal fenomeno dei link rot, vale a dire di quei collegamenti ipertestuali non funzionanti che impediscono ai documenti presenti sul web di ricoprire una funzione all’interno del sistema di note e riferimenti analoga a quella ricoperta dai corrispettivi cartacei.
Proprio circa quest’ultimo punto, sul quale peraltro già avevo scritto qualcosa oramai qualche anno fa, vale la pena di sviluppare un paio di ulteriori riflessioni; partiamo dalle parole dell’autrice, la quale a riguardo scrive:

The footnote, a landmark in the history of civilization, took centuries to invent and to spread. It has taken mere years nearly to destroy. A footnote used to say, “Here is how I know this and where I found it”. A footnote that’s a link says, “Here is what I used to know and where I once found it, but chances are it’s not there anymore”

La teoria che soggiace ad una simile impostazione è quella, oramai classica, di Elisabeth Eisenstein e della “stabilità tipografica”: secondo questa autrice l’invenzione della stampa a caratteri mobili non fu un fatto meramente tecnologico ma ebbe profonde ricadute industriali e sociali al punto da segnare lo sviluppo successivo dell’Occidente, contribuendo ad assicurarne nel lungo periodo il predominio globale; in particolare la stampa in tirature sempre più elevate unitamente alla “standardizzazione” dell’oggetto libro, con l’affermazione di aree ben definite ed individuabili (frontespizio, colophon e soprattutto apparato critico / notazionale), da una parte rese possibile una migliore e più efficace circolazione delle idee (non più soggette a quelle storpiature imputabili ad errori più o meno involontari da parte del copista) dall’altra, grazie alla possibilità data dalla presenza di precisi riferimenti bibliografici e documentali di verificare ed eventualmente confutare o correggere le diverse tesi dibattute, pose le basi per lo sviluppo della scienza e della cultura occidentali.
Come ricorda Jill Lepore nel passaggio poc’anzi citato, tale secolare sistema è stato brutalmente messo in crisi all’avvento del digitale: com’è stato possibile ciò? quali le cause?
Personalmente ritengo che additare come colpevoli i soli link rot sia semplicistico; questi ultimi sono a mio modo di vedere parte di un problema ben più complesso che anzi li trascende: è la società contemporanea nel suo complesso, bulimica di informazioni sempre aggiornate, che ci porta a “bruciarle” dopo pochi minuti, che ci spinge ad avere prodotti editoriali digitali redatti in più versioni nel tempo (versioning) e capaci di aggiornarsi spesso e volentieri senza che venga mantenuta traccia della versione precedente (il che, piccolo inciso, porta al tramonto del concetto di edizione), che richiede che gli innumerevoli articoli e post pubblicati vengano tumultuosamente “updated” ed altrettanto repentinamente spostati oppure messi offline una volta che perdono di attualità, senza che vi sia il tempo necessario per una stratificazione delle idee.

In questo senso Internet ed il Web costituiscono, nell’accezione massmediatica e filologica del termine, il palinsesto perfetto: tutto è spostabile, tutto è cancellabile, tutto è (digitalmente) “sovrascrivibile”. Questo richiamo alla prassi medievale di raschiare e cancellare i codici, pergamenacei e non, rappresenta peraltro simbolicamente il tramonto dell’epoca di “stabilità” delineata dalla Eisenstein ed il ritorno, per contro, ad una che, parafrasando, possiamo definire di “instabilità tipografica”. Dando ciò per assodato, la domanda da porsi è a questo punto la seguente: i rischi paventati da Jill Lepore sono concreti?

La risposta, con tutta evidenza, non può che essere affermativa: come già ricordato è il metodo scientifico stesso che prevede, tra gli altri, il requisito della verificabilità e quest’ultima non può prescindere, a sua volta, dalla presenza di una fitta rete di rimandi e riferimenti. Venendo questi meno, la ricerca non può dirsi tale anche se ciò non significa automaticamente che non vi saranno alcuni benefici. Ad esempio lo “sganciamento” da auctoritas citate più o meno acriticamente potrebbe portare a percorrere nuove vie; parallelamente la mole crescente di dati prodotti (big data), per di più spesso e volentieri disponibili liberamente ed in formati aperti (open data), pertanto con la possibilità di trattarli ed incrociarli / collegarli (LOD) per mezzo di elaboratori, apre il campo a nuove frontiere nelle ricerche (in ambito storico perché non pensare, ad esempio, ad una nuova storia quantitativa?).

In definitiva quel che avremo non sarà altro che, com’è forse giusto che sia, una ricerca rispecchiante la società (digitale) che l’ha prodotta; in quest’ottica è doveroso che le istituzioni deputate alla conservazione, archivi e biblioteche, aumentino i propri sforzi.
Sicuramente un primo ambito d’intervento dev’essere, sulla falsariga di quanto fatto da Internet Archive e da molte biblioteche centrali, quello teso a dare profondità storica ad Internet “archiviandolo” ma anche contribuendo alla diffusione di persistent URL. Ma un secondo, ed in prospettiva persino più importante, terreno d’azione sarà inevitabilmente quello della gestione e conservazione dei big data, fenomeno che a mio avviso caratterizzerà gli anni a venire: è pertanto impensabile che gli archivi e le biblioteche non giochino un ruolo cruciale nel “mantenimento” tout-court dei vari dataset che, più dei singoli documenti, saranno alla base delle ricerche dei prossimi anni e dai quali dipenderà, c’è da scommettere, il progresso scientifico dei prossimi decenni.

Conservazione degli e-book, missione (quasi) impossibile?

Civil Liberties Litigation ePub Experiment di colecamp

Photo credits: Civil Liberties Litigation ePub Experiment di colecamp, su Flickr

Circa un’annetto fa ho scritto un post nel quale spiegavo come l’ebook, specie quello “potenziato” (enhanced), cambiasse il rapporto con le fonti documentarie, concludendo, tra le altre cose, che ciò implicava un significativo cambiamento nel modo in cui da una parte gli storici e dall’altra i lettori si approcciano alle fonti stesse.
In questo articolo intendo invece soffermarmi su un aspetto che all’epoca aveva appena abbozzato, ovvero quello delle possibili (anzi, probabili) difficoltà poste alla conservazione.
In genere si tende infatti a ritenere che la difficoltà stia nel conservare i documenti digitali (con relative marche temporali, firme elettroniche / digitali più o meno qualificate, glifi, etc.), e questo perché va mantenuta (almeno nella fase attiva) la valenza giuridico-probatoria che è insita in essi; al contrario con i libri digitali questo problema non si pone: anche se muta la sequenza binaria, si è soliti sostenere, l’importante è che il contenuto non subisca modifiche sostanziali (cambiamenti nel layout della pagina, nel font del carattere, etc. sono ritenuti accettabili anche se pure essi ci dicono molto su come l’autore ha voluto che fosse il suo libro).
Ebbene, specie se in presenza di ebook potenziati, è tutt’altro che pacifico che ciò sia assicurato. Come sottolineavo “en passant” nel succitato articolo (ma ponendomi nella prospettiva peculiare dello storico), vi è infatti il serio rischio che salti tutto quell’insieme di riferimenti “esterni” all’ebook che nelle intenzioni autoriali costituisce parte integrante (e talvolta fondamentale) dell’opera: il problema è in primis quello noto dei rot link (ovvero di collegamenti ipertestuali che conducono a risorse che nel frattempo sono state spostate di indirizzo o che, nella peggiore delle ipotesi, non esistono più) ma in generale si può parlare della (non) persistenza degli oggetti digitali che popolano la Rete. In sostanza il pericolo è quello di conservare ebook che nel giro di pochi anni si trovano monchi.
Le riflessioni da fare a questo punto sono sostanzialmente due:
1) gli enhanced ebook diverranno dominanti nell’arena dei libri digitali o, al contrario, resteranno di nicchia e specifici di alcuni ambiti (settore educational, storia, etc.)? Ovviamente qui si entra nel campo del probabile ma personalmente ritengo verosimile, considerando a) la spinta proveniente dalla vendita, che va per la maggiore, di tablet multimediali a discapito di ebook reader dedicati che invece non supportano tali elementi b) lo stimolo costituito dallo stesso standard epub 3, che ha abbracciato in toto l’idea della multimedialità, che essi diverranno, magari in un futuro non così prossimo, predominanti rispetto a quelli “classici” composti di testo ed immagini
2) è possibile ovviare al problema? In questo caso la risposta è senz’altro affermativa. Difatti, al di là dell’obiettivo forse irraggiungibile di “archiviare Internet”, ci si può accertare (così come invita a fare Wikipedia) che nel momento in cui si va ad effettuare una citazione / riferimento ad una risorsa esterna perlomeno essa sia stata archiviata da uno dei vari servizi esistenti (il più famoso è Internet Archive) e, in caso negativo, far sì che essa venga archiviata. Esiste poi un’altra alternativa, a mio avviso sconsigliabile, che consiste nell’incorporare nell’ebook tutte le risorse esterne cui si fa riferimento: purtroppo, trattandosi di immagini e di file audio e video, ciò significa far aumentare il “peso” complessivo dell’ebook di un paio di ordini di grandezza (diciamo da uno a 100 mega), il che non è agevole né per il lettore nel momento in cui va ad effettuare il download né per chi, successivamente, dovrà farsi carico della conservazione.
Per concludere credo che questa veloce analisi sia sufficiente a dimostrare come la conservazione dei libri digitali sia operazione tutt’altro che scontata; difatti, al di là delle difficoltà tecniche, se si vuole che gli ebook aderenti al formato epub 3 siano trasmessi nella loro interezza alle generazioni che verranno è necessario impostare, sin dal momento della loro creazione, una apposita strategia che preveda l’archiviazione di quei link e di quelle risorse digitali alle quali essi fanno riferimento. Obiettivo raggiungibile a patto che si creino le necessarie sinergie tra autori (in caso di self publishing), editori, bibliotecari ma probabilmente anche archivisti.

%d blogger hanno fatto clic su Mi Piace per questo: