Sondaggi: come analizzare i risultati con Excel
Analizzare i dati di un sondaggio con Excel permette di fare valutazioni statistiche approfondite, differenziando il risultato a seconda del campione di interesse.
Perché scegliere uno strumento come Excel?
Analisi preliminare del campione
Se vi è capitato di condurre dei sondaggi, vi sarete confrontati con i numerosi strumenti presenti sul mercato per la raccolta e l’analisi dei dati. Vi sarete accorti che, quasi tutti, permettono di visualizzare i risultati della raccolta secondo modelli già predefiniti: una semplice riproposizione percentuale (o numerica), con l’aggiunta di un grafico sull’andamento del sondaggio una domanda alla volta.
Sicuramente uno dei motivi del successo di queste piattaforme, ne è un esempio Google Moduli, è la loro semplicità. Riuscire a visualizzare – in tempo quasi reale e senza necessità di particolari competenze – i risultati del nostro sondaggio non è cosa da poco.
Perché scegliere uno strumento come Excel?
Vista la rapidità e facilità di utilizzo di questi strumenti, potrebbe venire da chiedersi “Perché sbattere la testa sui dati, esportare un CSV ed analizzarlo con un altro strumento, quando ho tutto già pronto?”.
Perché un simile trattamento del dato non è un’analisi! Certo, potrà darvi il risultato della singola domanda, ma difficilmente vi permetterà di andare oltre e fare valutazioni sull’andamento dell’intero sondaggio, differenziando il risultato a seconda del campione che vi interessa.
In secondo luogo, non è detto che il tipo di visualizzazione “suggerita” sia la più corretta; se ad una domanda ha risposto soltanto una minima parte dei partecipanti al sondaggio, una torta con la percentuale è poco adatta. Potrebbe essere una scelta migliore una tabella, o magari un istogramma.
La nostra scelta per l’analisi dei dati esportati come CSV è ricaduta su Excel. Siamo ovviamente consapevoli dei suoi limiti, ma per un’analisi come la nostra vi dimostreremo come sia uno strumento dalle grandi potenzialità, se sfruttato in modo adeguato.
Dal CSV all’XLSX
Ovviamente prima di poter fare qualunque tipo di analisi, il nostro file va riportato ad una formattazione più adatta. Le strade per ottenere questo risultato sono diverse, vi illustriamo la più immediata. Apriamo un nuovo file di Excel ed importiamo il CSV (che verrà convertito direttamente dal programma).
A questo punto avremo i nostri dati correttamente ordinati in colonne e potremo iniziare a rielaborarli. Di seguito vi mostreremo una serie di possibili report e visualizzazioni dei dati.
Una volta arrivati a questo step, sfrutteremo uno degli strumenti più comodi ed utilizzati di Excel per ottenere, una volta definita la matrice d’origine, una riorganizzazione dei dati in grafici e tabelle. L’avrete sicuramente usato o sentito nominare: la pivot.
Il punto di forza di questo strumento è sicuramente la rapidità di utilizzo. Ci permette infatti di variare i dati selezionati nell’analisi, scegliere cosa mostrare nelle righe e nelle colonne della tabella, aggiungere filtri, aggiungere grafici e editarli; il tutto direttamente da un’unica maschera di inserimento.
Non entreremo in dettagli tecnici e le funzioni/formule da utilizzare per arrivare a questi risultati, vogliamo infatti darvi solo un’idea del potenziale dietro a una simile analisi e perché no, qualche spunto!
Analisi preliminare del campione
Una delle prime cose che vogliamo ottenere è la composizione del nostro campione. In prima battuta, il genere.
La nostra scelta è ricaduta su un semplice istogramma. Abbiamo inoltre scelto di affiancare sempre ad ogni grafico anche una tabella con il dato numerico. Non sempre si fa, ma siamo convinti che i numeri contino e che a volte le percentuali possano essere fuorvianti.
Ad esempio, 80% donne e 20% uomini quando vi presentano una survey non vi crea grossi pensieri, ma se magari quell’analisi vi è costata molto e scoprite che il campione sono 8 donne e 2 uomini, questo potrebbe sì crearvi qualche pensiero.
Questo tipo di visualizzazione non differisce, se non per la grafica, a quelle già pronte di cui vi parlavamo prima. Abbiamo pensato di inserirla comunque, per dimostrare come si possa facilmente ottenere la stessa analisi. Passiamo quindi a qualcosa di più evoluto.
Genere ed età
Ma se per caso a qualcuno venisse in mente di chiederci: “Abbiamo 81% donne, ma quante hanno tra i 45 e i 55 anni?”
Con gli strumenti semplificati rispondere a una simile domanda potrebbe essere scomodo: dovremmo filtrare il genere e poi l’età richiesta (o il contrario). Ma con i giusti parametri impostati, possiamo ottenere un grafico di questo tipo:
Appare evidente come sia di facile interpretazione (e d’impatto). Passiamo ora ai risultati delle singole domande.
Questo tipo di grafico ci permette di avere ben chiare le risposte alla domanda, in più abbiamo i numeri nella tabella e le percentuali sul grafico. Ma se osservate bene c’è di più: sulla destra della schermata potete notare due elenchi. Sono dei filtri applicabili al grafico. Ci permettono di segmentare rapidamente le risposte. Vogliamo sapere come hanno risposto alla domanda le donne tra i 45 e i 54 anni? Applico i due filtri ed ecco il risultato:
Vi mostriamo infine quella che reputiamo l’analisi allo stesso tempo più interessante e complicata (sia per realizzazione che per utilizzo). Noi l’abbiamo per comodità chiamata “di flusso”, ma è una scelta del tutto personale.
Conclusioni
Questo tipo di visualizzazione ci permette di raffinare sempre di più il nostro campione secondo i nostri parametri, che sceglieremo ampliando la selezione nella tabella superiore. Potremo ad esempio avere il numero di partecipanti al sondaggio che allo stesso tempo:
- appartengono a un certo genere ed età;
- hanno risposto in un determinato modo alla Domanda 1;
- hanno risposto in un secondo modo alla Domanda 2.
Ovviamente possiamo andare sempre più nel dettaglio, fino a trovare l’esatto percorso di un singolo nel questionario. Potremo inoltre invertire l’ordine delle domande, ampliando quindi le possibili combinazioni.
Il grafico presente ci permetterà di farci un’idea immediata dei volumi, mentre la tabella posta nella parte inferiore mostrerà i dati numerici correlati alla selezione da noi effettuata. Avremmo potuto ottenere lo stesso risultato con una serie di filtri, formule e conteggi, ma la rapidità e flessibilità di questa soluzione è ben diversa.
Speriamo quindi di avervi dimostrato come, spesso, gli strumenti più semplici non siano i più adatti per eseguire un’analisi dei dati più approfondita.
Simone Grippa
Junior Full Stack Developer