istella, il motore di ricerca che scandaglia gli archivi nascosti

istella

istella (screenshot)

Settimana dedicata al lancio di nuovi motori di ricerca questa: ha iniziato due giorni fa istella mentre ieri è stata la volta di Quag.
Diciamo subito che dopo la delusione di Volunia ero molto scettico circa la reale capacità di innovare delle start up nostrane (tanto più considerando che alle spalle di Quag c’è quel Mariano Pireddu già finanziatore di Volunia), invece l’impatto è stato immediatamente, anche dal punto di vista grafico, più che positivo.
In particolare interessantissima è l’idea di motore di ricerca che sta alle spalle di istella, creatura di Renato Soru (fondatore di Tiscali): un SE che privilegia il web italiano, con un algoritmo che punta sulla qualità (piuttosto che sulla popolarità) dei risultati e soprattutto che indicizza (su invito) documenti e risorse solitamente precluse ai “normali” spider in quanto nascoste in quell’hidden web (personalmente io preferisco il termine deep web) che pur ne costituisce la parte preponderante.
Com’è stato raggiunto questo risultato? “Semplicemente” stipulando appositi accordi con prestigiose istituzioni (hanno aderito, tra gli altri, l’Istituto Enciclopedia Treccani, l’Archivio LaPresse, l’Archivio RAI, il MIBAC – SAN e l’Archivio Touring Club) le quali hanno fatto in modo che non solo le pagine ma anche le risorse più nascoste fossero raggiungibili, indicizzabili ed accessibili.
Gli ideatori di istella non si sono però fermati agli archivi istituzionali, ma hanno previsto che tutti i navigatori (purché registrati) possano uploadare quelle che il videotutorial definisce digital library (ma che in realtà altro non sono che porzioni più o meno complete degli archivi digitali degli utenti ovvero file di testo, audio, immagini, video), rendendole indicizzabili (= reperibili), liberamente consultabili ed eventualmente scaricabili.
Non mancano ovviamente alcuni problemi, com’è naturale che sia essendo istella ancora in fase di rodaggio: i risultati della ricerca a volte non sono pienamente pertinenti, così come l’accesso alle risorse “nascoste” non è così immediato (non mi ritengo un navigatore sprovveduto ma nel corso dei miei test non sono riuscito, nonostante il tempo e le diverse ricerche, ad accedere ai documenti che il SAN dovrebbe – ma forse non l’ha ancora fatto – aver condiviso; al contrario non ho avuto alcun problema ad accedere agli archivi digitali di altri utenti che come il sottoscritto hanno risposto all’appello lanciato dagli ideatori di istella a “condividere”).
Un progetto, per concludere, decisamente interessante dal momento che sottintende, da parte di tutti (pubbliche amministrazioni, possessori di archivi istituzionali, singoli cittadini), uno scatto culturale con l’apertura ad un modello nel quale tutti contribuiscono all’accrescimento ed alla circolazione del Sapere mettendolo a disposizione di tutti. Anzi, l’auspicio è che questa openess, incentrata sui documenti “finiti”, si saldi con quell’altro fecondo movimento che sta rapidamente prendendo piede, ovvero quello che guarda ai “grezzi” open data.

One response to this post.

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger cliccano Mi Piace per questo: