Data Visualization: linguaggi e tecnologie per la visualizzazione dei dati

 In Big Data

Esempio di dashboard“Visualizations give us access to huge amount of data, very rapidly”

Quand’è stata l’ultima volta che avete visto una presentazione di business che non includesse almeno una slide con un istogramma o un grafico a torta? Quanti report pieni di tabelle e numeri capita di ricevere ogni giorno, ad esempio come allegati di email?

La visualizzazione dei dati è un aspetto che riguarda una buona parte della nostra vita, anche non lavorativa. Al livello più basilare, le visualizzazioni dati ci permettono di comparare rapidamente numeri o insiemi di numeri.

Le visualizzazioni sono collegate alla nostra innata abilità umana di discernere pattern rapidamente, e di convertirli in informazioni utilizzabili. I nostri antenati avevano bisogno della capacità di riconoscere pattern, per salvaguardarsi dai predatori che si mimetizzavano tra gli elementi naturali. Le Visualizzazioni Dati si rivolgono a circuiti simili nel nostro cervello: la maggior differenza tra noi ed i nostri antenati è situazionale. Loro cercavano segnali di predatori o prede, noi cerchiamo di capire dove investire per massimizzare i profitti.

Oggi la quantità e l’eterogeneità dei dati a disposizione delle Enterprise cresce sempre di più. A fronte di questa enorme disponibilità di informazioni, diventa ancora più critica la fase di sintetizzazione e soprattutto comunicazione dei dati, per poterli utilizzare a fini decisionali.

Data Visualization come linguaggio

La visualizzazione dei dati rappresenta il cuore della Business Analytics: è il modo in cui si trasforma una grande mole di dati complessi in comunicazioni comprensibili, ricche di insight e accattivanti. La visualizzazione dati, che può essere intesa come una forma di comunicazione visuale, è diventata un vero e proprio linguaggio: il linguaggio delle immagini.

“Data graphics visually display measured quantities by means of the combined use of points, lines, a coordinate system, numbers, symbols, words, shading and colors.” (E. Tufte)

Le regole di questo linguaggio stanno nello scegliere gli oggetti grafici migliori per il tipo di dato che si vuole rappresentare e assemblarne le componenti nel giusto modo, a seconda di ciò che si vuole comunicare. Le scelte adottate in questo stadio (anche solo su singole componenti come il colore) possono radicalmente modificare la percezione del risultato, quindi è importante esserne consapevoli. Per esempio, si può rappresentare una serie di numeri tutti uguali dividendoli comunque in pattern e facilitandone l’impatto visivo e la successiva memorizzazione.
Memorizzazione dei datiUn esempio famoso di visualizzazione dati (che non ha raggiunto l’obiettivo per cui era stata creata) è la mappa della metropolitana di Londra a inizio Novecento.

La mappa mostra le fermate della metropolitana in relazione alle vie e alle strade di superficie, ma è molto difficoltoso interpretare la mappa, per esempio, se si deve fare un cambio di linea metropolitana.

Dopo qualche anno, si è arrivati a una modalità molto più efficace di visualizzare la stessa informazione: una mappa schematica, in cui è molto più semplice contare il numero di fermate, i cambi, e capire qual è la linea con il minor numero di fermate per arrivare a destinazione.

Gli stessi dati possono quindi essere mostrati in diverse modalità, a seconda degli obiettivi e di cosa si vuole mostrare alla propria audience.
Esempio visualizzazione dati

Esempio di visualizzazione dei dati

L’efficacia della visualizzazione può essere scomposta in tre principali aree di valore: Appeal, comprensione e Retention. L’Appeal identifica il potere attrattivo, coinvolgente e stimolante dell’informazione, in altre parole, l’estetica, il modo con cui si attira l’attenzione della propria audience. La comprensione si delinea in un ambiente specifico, in cui l’argomento e le relazioni tra oggetti sono già note. Il rappresentare informazioni in modo visuale, rispetto al descriverle semplicemente, impatta sulla chiarezza e la velocità con cui l’informazione viene recepita. La Retention ci permette di memorizzare per lungo tempo le informazioni visualizzate e collegarle rapidamente ad informazioni già note. A seconda degli obiettivi, si può puntare più o meno su queste tre diverse aree. Per esempio, l’obiettivo del marketing è in primo luogo l’Appeal, in secondo luogo la Retention, e infine la comprensione.

Visualization

Data Visualization come tecnologia

Dal punto di vista delle Enterprise, la Data Visualization si può definire come la tecnologia che permette agli utenti aziendali di “vedere” i dati, al fine di supportarli in una migliore comprensione delle informazioni e utilizzarle in funzione degli obiettivi di business.

Soprattutto nel mondo delle aziende regna spesso un caos terminologico: la visualizzazione dei dati e altri temi correlati spesso vengono affrontati con lo stesso approccio. Per esempio, ci si riferisce a visualizzazione dei dati quando invece si intende un diagramma di flusso che mostra come i dati vengono processati da un determinato software. Ci si riferisce a dashboard, quando invece si intende un’infografica. E ancora, si parla di “dinamico” ed “interattivo” come fossero sinonimi, e lo stesso può succedere con i concetti di “esplorativo” ed “esplicativo”.

Cerchiamo di mettere un po’ di chiarezza, distinguendo gli “ingredienti” e mettendoli in relazione tra loro. Alla base di tutto sta la distinzione tra il concetto di reportistica statica o dinamica.

Reportistica statica

Parlando di reportistica statica ci si riferisce per esempio ai report in formato pdf che vengono condivisi periodicamente all’interno dell’azienda e che non hanno alcuna flessibilità. Si può trattare di dati più o meno dettagliati: da tabelle con molti item e molte dimensioni – quindi, spesso difficili da leggere – a prospetti di Key Performance Indicators.

Una dashboard si colloca all’interno di questo scenario: mostra “a colpo d’occhio” i cosiddetti “key operational tracking data” come KPI (eventualmente accompagnati dalla variazione rispetto al periodo precedente o ad un determinato obiettivo; i gauge sono spesso utilizzati a tal fine) e scorecard. È adatta per rispondere alla domanda: “cosa sta succedendo?”

All’interno di una dashboard si possono inserire elementi di interattività, ad esempio dei tooltip contenenti maggiori informazioni, che compaiono al clic su un particolare oggetto. Il livello di interattività resta comunque molto ridotto.

Esempio di dashboard

Sempre nell’ambito della reportistica statica, una recente forma di comunicazione che sta riscuotendo grande successo è l’infografica. Si tratta di una narrazione dei dati strutturata in modo molto accattivante, utilizzando un’unica grande visualizzazione che raccoglie molte informazioni. Il motivo di questo successo è semplice: quando si vogliono trasmettere delle informazioni, anche complesse, con diagrammi e schemi, la priorità è quella di ottenere un testo chiaro ma anche invitante (appealing), e in questo l’infografica è l’ideale. È in grado di raccontare rapidamente numerosi dati e di coinvolgere il lettore fino a stimolarlo alla condivisione. Anche nell’infografica possono essere inseriti elementi di interattività, come per esempio degli zoom sequenziali che seguono il filo logico della narrazione suddividendola in slide.

Reportistica dinamica

Un report è dinamico quando è flessibile: variando alcuni parametri, si osserva in real-time come cambiano le metriche rappresentate. Per esempio è possibile cambiare l’intervallo temporale considerato, o filtrare per un sottoinsieme di dati al fine di osservarne il comportamento in modo disaggregato.

La flessibilità è legata alla possibilità di fare Discovery ed Exploration: si cercano insight o particolari tendenze nei dati, creando visualizzazioni e analisi ad hoc, confrontando scenari, indagando relazioni tra dati, studiando trend e distribuzioni.

In genere, gli strumenti di Discovery e Visualization permettono anche di aggregare dati provenienti da diverse sorgenti di informazione, creando un central data repository che normalizza i vari dati in modo da mostrare una singola “versione della verità”. In quest’ottica diventa ancora più importante e stimolante l’esplorazione del dato, cercando di rispondere a domande come “cosa è successo?” e “perché è successo?”.

In tale processo di elaborazione di grandi flussi di informazioni, il tempo – che grazie agli strumenti di Discovery ed Exploration può venir abbattuto considerevolmente – ha un ruolo fondamentale:

“The speed at which you can combine all your data, the speed at which you process and visualize it, and most importantly the speed at which you reach actionable insights. The faster you can juggle information, the more data and data combinations you can afford to cover, the more unexpected the insights you will find.” (I. Erez)

Questa è la grande potenzialità degli strumenti di Discovery: la possibilità di scoprire in autonomia particolari insight e condividerli con altri grazie alla componente di condivisione che spesso fa parte di questi tool. Il mondo della Business Intelligence si sta evolvendo verso una Self Service Business Intelligence, in cui da interfaccia grafica si possono esplorare dati e creare query avanzate, senza dover gravare sull’IT.

Quale tipo di reportistica scegliere?

In generale, la reportistica dinamica permette libertà e autonomia maggiore rispetto alla reportistica statica. Tuttavia è necessario considerare il contesto. Diverse audience hanno bisogno di diverse tipologie di visualizzazione dei dati.

I grafici esplorativi si costruiscono per se stessi, i grafici esplicativi si costruiscono per mostrarli ad altri. L’obiettivo primario delle visualizzazioni esplorative è la velocità, per trovare rapidamente insight (Discovery): per questo sono necessari strumenti che permettano di creare in fretta e con facilità molti grafici e consentano l’interazione per farsi “raccontare una storia che non si conosce ancora”.

Il processo di creazione di visualizzazioni esplicative è generalmente più lento, perché si deve cercare di comunicare in modo chiaro, semplice ed efficace (ma non necessariamente dinamico o interattivo) ciò che si è scoperto nella fase precedente. Si può pensare alla fase esplorativa come “il leggere” e alla fase esplicativa come “l’insegnare”.

Quindi, la Data Visualization è uno strumento che può coniugarsi in molte differenti modalità di rappresentazione. Non va perso di vista il suo obiettivo primario, che è quello di rendere facilmente e rapidamente comprensibili i dati che abbiamo a disposizione. E quando il business ha le informazioni giuste nel momento giusto, questo significa più profitti e più efficienza.