Parole portatrici di segni
http://nova.ilsole24ore.com/
Tratto da nòva24 N.74 di Giovedì 26 Aprile 2007
Parole portatrici di segni
Il web semantico era l’utopia della classificazione scientifica
del sapere.Nel Web 2.0 c’é una pratica sociale.La sintesi è ancora lontana.Ma la sua potenziale utilità cresce con la quantità di dati che si trova nella rete.
di Guido Vetere
Alla prima conferenza sul web, nel 1994, Tim Berners-Lee già lo pensava come organismo “semantico”, cioè come un sistema globale di risorse informative interconnesse di cui fosse possibile codificare il significato in una forma comprensibile anche alle macchine. Pochi anni dopo quel pensiero diede vita alla “visione collettiva” del Semantic web. Un web dove la parola non è vaga, dove uomini e macchine dicono “pane” al pane e “vino” al vino. Ma, ironicamente, la prima ambiguità che venne incontro al Semantic web fu proprio quella dell’aggettivo semantico: per i linguisti, infatti, la semantica è la descrizione a posteriori degli usi della lingua, mentre per i logici è la scelta a priori del rapporto tra un predicato come “pane” e un insieme qualsiasi di oggetti, siano pure biscotti. Una differenza sulla quale si gioca oggi il destino del Semantic web.
I primi a far propria la visione di Berners-Lee furono i logici dell’Intelligenza artificiale, quelli che già da molti anni si occupavano di come formalizzare descrizioni “decidibili” del Mondo, e come ragionarci sopra. Ma, s’è detto, per il logico è irrilevante che le descrizioni incontrino o no il senso comune, qualsiasi cosa esso sia, e il web, si sa, con quel “qualcosa” ha molto a che fare. Dai recessi della metafisica vennero allora gli “ontologi”, che si occupano di «cos’è quello che c’è nel Mondo», e dunque possono indicare quali descrizioni siano più appropriate a esso. In loro onore, ma con abuso, vennero chiamate “ontologie” le teorie logico-descrittive, fatte per catturare a priori i concetti sottostanti alle varietà espressive del web. Poi vennero gli standard per condividere ontologie in rete, a cui seguirono i tool, dapprima accademici, poi anche industriali. Nacque così il Semantic web?
No, ma nel frattempo era nato il Web 2.0. Il Web 2.0, per O’Reilly, non ha confini rigidi, ma ha piuttosto un centro gravitazionale costituito dalle pratiche cooperative degli utenti: blog, wiki, tagging. Questa miscellanea sembra in grado di far emergere dal disordine digitale (per dirla con Weinberger) alcune forme significative, non molto ontologiche, ma immediate, utili e gratuite. Ad esempio, la pratica di attaccare una parola (tag) alle risorse web a cui si accede, unita al fatto che questi tag sono collezionati da un sistema condiviso tra gli utenti e in grado di analizzare le loro correlazioni, rende possibile ritrovare quelle risorse in modo migliore di quanto si faccia con le keyword estratte dal testo. Inoltre, è possibile scoprire “retìcoli” di tag in base alle regolarità del loro uso da parte di milioni di persone. Queste strutture sono quelle che oggi si chiamano folksonomie, cioè tassonomie popolari. Attorno a queste è nata una certa attenzione nelle comunità scientifiche che si occupano di web e semantica. Lo stesso Berners-Lee distìngue oggi tra ontologie profonde e superficiali, facendo con quest’ultime un passo verso la folksonomia.
Il fatto è che la semantica emergente della cooperazione in rete, sia pure incerta, promette di superare l’impasse dell’approccio “onto-logico” al Semantic web. Anzitutto, quelle parolette che gli utenti attaccano ai siti, alle foto, ai filmati, vaghe ma pur sempre portatrici di segno, sono una risorsa preziosa in un web in cui estrarre contenuto dalle risorse è da sempre un “collo di bottìglia”. E poi, c’è il problema di produrre ontologie davvero condivise. Se non è affatto provato che le folksonomie possano produrre concetti migliori di quelli di un’ontologia, è pur vero che le folksonomie sono fatte dagli utenti e dalla statìstica, e permettono agli informatici di non connettersi su alcunché di concettuale. Ma quante chance ha una folksonomia di assurgere, per le vie della statistica, al rango di teoria logico-descrittiva del senso comune? Scarsa, a mio avviso. Non perché non sia vero che il senso della parola è il suo uso nel gioco linguistico. Ma perché il gioco della lingua non è quello dei dadi, ed è difficile che la statìstica possa farne emergere le regole con la chiarezza di cui il Semantic web ha bisogno. Un esempio. Le parole scuola e arma co-occorrono nel web in funzione dell’occorrenza periodica di tragici episodi di cronaca. Per non giungere alla triste conclusione che tra queste parole ci sia un nesso semantico, un sistema statìstico dovrebbe analizzare la distribuzione della co-occorrenza nel tempo. Difficile, visto che anche il sistema è nel tempo: come ci si regola la prima volta che un fatto accade? Insomma, da una parte l’ontologia stenta a dare al web concetti condivisi, dall’altra la folksonomia è esposta alle bizzarrie del caso (e delle persone). E allora che si fa? Intanto, si può fare un po’ di chiarezza. L’ontologia parla di ciò che è. Tutti possiamo riconoscere che il vino è una sostanza (e non, per dire, un evento). Non tutti dobbiamo dire che il Chianti è un vino toscano: potrei voler chiamare così un vino conle stesse proprietà organolettiche ma prodotto altrove, senza per questo voler dire che Chianti è il nome di quelle proprietà. Ma ora guardate la Wine Ontology sul sito del W3C. Lì tutto è mischiato insieme: essenza, convenzioni sociali, consigli del sommelier. Non sarebbe il caso di distinguere tecnicamente tra commitment ontologico e tutta quella ingente, controversa e vaga attività predicativa umana che Quine chiamò ideologia?
Nel futuro del Semantic web vedo un ruolo più incisivo per la linguistica. Essa parla del fenomeno sociale della comunicazione umana, che con ciò che è ha un rapporto complesso. È a questo che dobbiamo guardare meglio se vogliamo capire cos’è il significato nel web cooperativo. La logica formale, e con essa l’informatica, è solo (si fa per dire) lo strumento per modellare le teorie sull’essere e quelle sul comunicare, il loro rapporto, il ragionamento che su di esse, nelle loro specificità, è utile fare. Nel distìnguere il ruolo di tali discipline e integrarle in una visione consapevole dei nostri limiti è il futuro possibile del Semantic web.
Guido Vetere è manager & research coordinator all’Ibm Center for advanced studies, Roma
un commento da [semioblog] alle tesi di Vetere