Sebbene ne sia previsto il lancio ufficiale per la primavera 2013, già si può dire che sarà un progetto potenzialmente rivoluzionario quanto lo fu Wikipedia nel 2001: si tratta di “Wikidata”, un database secondario libero, collaborativo e multilingua per la raccolta di dati strutturati che “possa essere letto e modificato sia dagli umani che dalle macchine”, come recita la pagina ufficiale del progetto.

L’iniziativa è stata presentata durante Wikimania 2012, l’annuale incontro mondiale degli utenti di Wikipedia e dei suoi progetti fratelli, tenutosi quest’anno a Washington (Stati Uniti). L’idea era già auspicata dalla comunità wikipediana da vari anni, ma solo l’anno scorso è stato annunciato l’avvio ufficiale del progetto, in occasione dell’edizione 2011 di Wikimania tenutasi a Haifa (Israele).

Wikidata permetterà innanzitutto di centralizzare in un unico progetto la gestione di dati relativi a un determinato argomento (come il numero di abitanti di un comune, la massa di un corpo celeste o la data di nascita di un personaggio storico), mettendoli poi automaticamente a disposizione di tutti i progetti della Wikimedia Foundation, Wikipedia in testa.

Questo alleggerirà notevolmente il carico di lavoro dovuto alla manutenzione di questi dati – con notevoli vantaggi soprattutto per le cosiddette versioni “minori”, ossia quelle con un minor numero di utenti attivi.
Inoltre, i dati saranno strutturati in maniera da essere trasformati in meta-dati, ossia in informazioni leggibili anche da computer. L’obiettivo ultimo di Wikidata è, infatti, quello di rendere i dati disponibili anche al di fuori dei “confini wikipediani” e di permettere agli utilizzatori di poter effettuare ricerche personalizzate sul database.

Riguardo l’affidabilità dei dati, è stato già previsto l’inserimento di un campo per le fonti dei dati inseriti, sia per motivi di principio che per motivi pratici: poter distinguere fra dati “affidabili” e “incerti” permetterà di concentrare il lavoro di ricerca e di verifica su questi ultimi. Gli sviluppatori hanno annunciato a Washington che questo sarà uno dei punti fondamentali su cui lavoreranno nei prossimi mesi, assieme alla creazione di una interfaccia grafica user-friendly.

Il progetto, supportato da Wikimedia Deutschland (la corrispondente tedesca della Wikimedia Foundation), può contare anche sull’appoggio dell’Allen Institute for Artificial Intelligence, della Gordon and Betty Moore Foundation e di Google. I dati saranno ovviamente rilasciati con la stessa licenza di Wikipedia, la CC-BY-SA 3.0 Unported.

La base di partenza saranno i dati (e le relative fonti) provenienti dalle varie comunità linguistiche di Wikipedia, ma l’intenzione è di ampliare successivamente la raccolta anche a “fonti” terze. Un altro degli obiettivi prefissati dagli sviluppatori è, infatti, quello di attirare scienziati e ricercatori, affinché collaborino anche loro all’arricchimento e alla verifica dei dati presenti.

Soprattutto l’intervento della comunità scientifica non è da escludere: fra gli utenti di Wikipedia, da anni, si notano professori e ricercatori, mentre molte istituzioni hanno raggiunto o stanno per raggiungere accordi di collaborazione per “liberare” i propri contenuti. Questo nuovo progetto potrebbe costituire, soprattutto per la sua portata, un’ulteriore “incentivo” alla collaborazione fra il mondo accademico e il mondo volontaristico.