Internet: sovrabbondanza di dati – scarsità di informazione

Patrizia Fariselli * - 14.02.2015

La caratteristica fondamentale delle tecnologie digitali di rete è l’atomizzazione della materia informazione in bit, l’unità minima di codificazione. La digitalizzazione non riguarda solo i contenuti, ma anche i programmi e i sistemi di elaborazione e di trasmissione dell’informazione codificata, e la stessa infrastruttura che la veicola - e quindi la rete delle reti. Poiché tutto viene ridotto alla stessa sostanza, il risultato e il processo non sono separabili. Ciò ha un duplice effetto: da una parte l’informazione viene trasformata in dati digitali, e quindi acquisisce fisicità; dall’altra parte qualunque tipo di informazione diventa catturabile, comunicabile, accessibile, rielaborabile, manipolabile indipendentemente dal suo supporto originario (testo, audio, video), dalla competenza e dallo status di proprietari, autori e utilizzatori dei dati. Non solo: gli sviluppi delle tecnologie digitali di rete e la diffusione capillare di dispositivi a basso costo e ad alta prestazione hanno progressivamente eroso i confini tra i servizi, e tra produttori e utilizzatori dei dati. In uno smartphone sono concentrate molteplici funzionalità che l’uso di “app” rende tendenzialmente illimitate, e impiegando uno smartphone possiamo sia attingere che generare e diffondere dati in rete (Web 2.0). Il vantaggio tecnico e sociale è straordinario, pervasivo e irrinunciabile e va oltre la somma delle innovazioni tecnologiche, legittimando ogni sorta di enfasi (rivoluzione tecnologica; network society, economia digitale, etc.) nella letteratura e nella pubblica opinione. Una delle formule di cui si abusa per rappresentare l’esito sociale delle tecnologie digitali di rete è quella della “società dell’informazione”. Ma, a prescindere dalla considerazione che ogni società è una società dell’informazione, configurata dalle tecnologie dell’informazione e della comunicazione prevalenti, è interessante analizzare il rapporto esistente tra dati e informazione nell’attuale ambiente digitale di rete.

Senza entrare nel merito della distinzione, che è certamente complessa, è chiaro che – indipendentemente dalla tecnologia - dati e informazione sono concettualmente diversi. I dati sono i mattoncini e l’informazione il risultato del loro montaggio, che è variabile a seconda degli obiettivi, del contesto, e della stessa disponibilità di dati. Per avere informazione bisogna far parlare i dati. Lo stesso dato può dar luogo a informazioni diverse, molti dati affastellati non danno necessariamente luogo a informazione; l’assenza di dati può avere un valore informativo. I dati, cioè, vanno organizzati.

La codificazione digitale accentua – anziché ridurre – la differenza tra dati e informazione e ne squilibra il rapporto. Per due motivi. Il primo, come abbiamo visto, è la “datificazione” dell’informazione. Il secondo ne è una conseguenza: la digitalizzazione espande più che proporzionalmente la produzione di dati, poiché richiede la produzione supplementare di dati digitali (metadati) necessari a generarli, classificarli, archiviarli, esplorarli e utilizzarli. La codificazione digitale, infatti, decontestualizzando e atomizzando l’informazione, esige che altra informazione venga generata per descriverla e per collegarla ad altre descrizioni. La digitalizzazione e la circolazione in rete accentuano le caratteristiche di autoreferenzialità e di autopropulsione della produzione di dati, amplificando la scala della loro crescita. Basti pensare all’uso corrente del cellulare come macchina fotografica: non si guarda quello che abbiamo davanti, lo si riprende ossessivamente, generando dati su dati che saranno archiviati, rimessi in circolazione, ma per lo più dimenticati. Le imprese, la pubblica amministrazione, le organizzazioni non-profit, le aziende sanitarie, i servizi di sicurezza, qualunque tipo di organizzazione che applica tecnologie digitali di rete ai processi produttivi e gestionali generano quantità ciclopiche di “big data” che si accumulano e lievitano per le loro stesse procedure di raccolta e archiviazione, sono sovradimensionati rispetto alle capacità analitiche dei database relazionali ordinari, non diventano informazione. L’espansione della cosiddetta “Internet of Things” (IoT) e della “Machine-to-Machine” (M2M) con cui i dati digitali vengono emanati e comunicati direttamente da oggetti provvisti di sensori (autoveicoli, elettrodomestici, impianti sanitari, etc.) o da “smart objects” tramite dispositivi di comunicazione autonomi, contribuisce a far impennare in modo esponenziale la produzione di dati digitali, dando luogo a quello che viene nominato “data deluge” e stimato con unità di misura fantasmagoriche (exa-zetta-yottabyte). Ma noi stessi seminiamo dati digitali ogni volta che operiamo in rete, anche senza averne l’intenzione. Lasciamo tracce digitali che permettono, a chi lo ricerca, di ricostruire il nostro “profilo”, e di utilizzarlo per vari scopi, prevalentemente di natura commerciale. Dati e informazioni sulla nostra identità, cioè, così come dati e informazioni relativi alla polis, sono spesso disgiunti.

Le conseguenze sono notevoli da molti punti di vista, che richiederebbero molti articoli per essere appena sfiorati. Limitiamoci al rapporto tra dati e informazione. La sovrapproduzione di dati digitali ostruisce il canale diretto tra utente e informazione che ci si aspetta con l’accesso a Internet e al World Wide Web, aumenta la necessità di operatori e servizi di intermediazione per navigare nell’oceano dei dati, e quindi assegna un ruolo centrale agli intermediari che si specializzano nella raccolta e nella gestione dei “big data”, per farli parlare. Man mano che i dati si espandono, non è più possibile concentrare nello stesso dispositivo l’accesso e l’archivio, occorre spostare i dati nella “cloud” e delegarne la gestione, la ricerca, l’elaborazione agli specialisti. Ma la cloud non è in cielo, è in potentissimi server che occupano molto spazio e consumano molta energia. Poiché la proliferazione del “pulviscolo digitale” ha determinato uno “storage gap”, una forbice tra la sovrapproduzione di dati digitali e la capacità di contenerli fisicamente, gli operatori che sono tecnicamente in grado di allocare e governare i dati sono molto avvantaggiati sul mercato. Imprese come Google e Amazon, che nascono come fornitori di un servizio particolare sulla scorta del quale accumulano enormi quantità di dati, strutture per contenerli e capacità analitiche, sviluppano sulle loro piattaforme un vasto raggio di business collaterali che ne fanno dei leader globali tra gli operatori dell’informazione digitale, in quella che tempo fa è stata appellata “l’economia dell’attenzione”.

L’informazione in rete, dunque, diventa necessariamente sempre più intermediata, e quindi sottoposta paradossalmente a maggiore scarsità a fronte di un diluvio di dati che rimangono in gran parte sommersi e quindi inaccessibili. Ne facciamo esperienza quotidianamente sui media. L’informazione è più frequente (la RAI sta diffondendo una pubblicità basata esclusivamente sulle quantità del monte ore della sua offerta!) ma è frammentata, ripetitiva, superficiale. Abbiamo accesso libero alla schiuma informativa che emerge a pelo d’acqua, ma l’immenso potenziale informativo sta sotto e non è accessibile all’utente medio senza i servizi di aggregatori e analisti che dispongono delle tecnologie e degli strumenti per organizzare, selezionare e distribuire i dati. I grandi Internet player sono operatori di mercato, che nella maggior parte dei casi hanno interesse ad organizzare i dati in modo funzionale ad obiettivi privati, in particolare quello di attrarre pubblicità, che è la vera fonte di profitto dei loro molteplici business. In alcuni casi, tuttavia, si determina una convergenza tra gli obiettivi (privati) degli operatori e quelli (pubblici) degli utenti, come dimostra il caso di Google che ha interrotto la pubblicazione di Google News in Spagna come reazione all’imposizione della legge spagnola sulla proprietà intellettuale, entrata in vigore il 1 gennaio 2015, che impone di pagare le aziende editoriali per l'utilizzo dei loro contenuti, diffusi gratuitamente da Google News. Gli editori spagnoli si sono già pentiti, perché la conseguenza immediata è un crollo del traffico sui loro siti, che avviene di rimbalzo a Google News. Lo stesso è avvenuto in Germania, dove, in seguito ad un’analoga disposizione, Springer ha deciso di rinunciare alla Google Tax che gli editori tedeschi erano riusciti a imporre. L’informazione online resta un formidabile ponte per l’informazione offline, ma questo processo non necessariamente porta ad ottenere più informazione o migliore informazione.

Si stima che nel 2020 ci saranno 500 miliardi di dispositivi connessi a Internet. Una sovrabbondanza di dati in entrata e in uscita, ma il tempo quotidiano a disposizione è e resta limitato. La selezione dei dati per costruire informazione richiede tempo e risorse analitiche, sia sul lato dell’offerta che della domanda. Aumentano i costi dell’informazione e quindi l’informazione in rete diventa relativamente più scarsa.

* Patrizia Fariselli è docente di Economia dell'innovazione presso l'Università di Bologna

Segnala ad un amico

Indice: Anno 2 uscita 19 - 14.02.2015

Una costituzione anti-schiavista (1865)
di Arnaldo Testi *

Guerra in Europa?
di Nicola Melloni *

Internet: sovrabbondanza di dati – scarsità di informazione
di Patrizia Fariselli *

ARGOMENTI