Twitter prevede il vincitore? Il caso Sentimeter

Tra i primati del Prez Obama (primo nero alla casa bianca, primo nobel per la pace sulla fiducia, primo ad usare i socialmedia nella campagna elettorale del 2008, ecc.), l’ennesimo è «la foto più ritwittata nella storia». (Che la storia dei tweet sia giovane, poco importa). Il capitale reputazionale conta, e per quantificarlo la nuova frontiera giornalistica supera il sondaggio demoscopico e si adopera al conteggio dei tweet e retweet. Non che se ne sentisse il bisogno di (altre) prove statistiche, specialmente dopo l’endorsement di mezza e più hollywood e di mezza e più industria culturale popolare americana che conta. Il presidente più cool è Obama, da sempre, non c’è partita. E lo staff della comunicazione lo sa bene. Per Mitt Romney oltre al fuoriclasse Clint Eastwood, che i liberal hanno dato per rincoglionito per giustificare il fatto che sia di destra, hanno parteggiato i musicisti country, fichi solo per chi ha questo aspetto qui.

31 milioni di tweet durante la notte elettorale. Dicevamo. L’attività, anzi, l’iperattività degli utenti di Twitter ha toccato picchi di 321 mila messaggi al minuto. Ho letto che in un ipotetico mondo parallelo gli americani twitteranno chi vincerà le primarie tra Renzi e Bersani. Certo, ma fino a ieri tutti i discorsi erano catalizzati da Obama e Romney, tanto che qualcuno ha deciso di rilevarli e studiarli direttamente da internet.

Twindex nasce dall’idea del provider di socio-analisi Topsy in partnership con Twitter, con l’obiettivo di analizzare un campione di messaggi, in media 2 milioni di tweet alla settimana, allo scopo di ottenere: «Una misurazione giornaliera dell’umore espresso in Tweet nei confronti dei due sfidanti alle presidenziali». I dati sono stati interpretati da un complesso algoritmo e sistemati in grafici interattivi. L’umore, il feeling, dei messaggi e dei discorsi, era indicizzato tra zero e cento punti sul barometro umorale 2.0.

Anche il sito Voices from the blogs ha analizzato milioni di dati, grazie a Sentimeter, con la differenza che nel processo di elaborazione e analisi dei cinguettii è entrata in gioco anche la valutazione umana, considerata superiore (dai creatori) alla sola analisi algoritmica. Ecco la differenza tra Topsy e Sentimeter: il primato umanistico sulla macchina.

Alcuni giornalisti da tempo si chiedono se si possa indovinare il candidato vincitore tramite il monitoraggio dei social media. In genere si leggono  sovra-interpretazioni di vario genere, dal naif: più ti cercano su Google più probabilità hai di vincere, all’eccessiva enfasi ottimistica sulle analisi sociometriche. Lo hanno scritto in molti, dal Guardian al Telegraph. Fabio Chiusi ne ha fatto un’utile rassegna sostenendo l’idea anti-ingenua sull’interpretazione cauta di questi dati. Tra le tante etichette, quella di cyber-utopismo è la più appropriata per i giornalisti che non hanno nessun interesse nello studiare il funzionamento delle reti sociali ma desiderano creare titoli sensazionalistici che stimolano fervide idee sul funzionamento “magico”, o meglio, esoterico, di potenti e misteriosi algoritmi.

Studi recenti indicano che Twitter non solo non è in grado di prevedere il vincitore alle elezioni, come ha già dimostrato in uno studio Daniel Gayo-Avello, ma non è in grado neppure di prevedere le vendite del box office al cinema. Il ricercatore Gayo-Avello sostiene che c’è un grosso problema di metodo e calibrazione: «I social media non sono un campione rappresentativo imparziale dell’elettorato», e ha aggiunto: «C’è un problema di selezione. Le persone che commentano fatti politici sono quelli più interessati. La maggioranza dell’elettorato è silenzioso, ed è un problema capire cosa pensa questo vasto gruppo di persone».

Eppure, contro il buon senso e ponderando ogni affermazione ingenua della rete sempre pronta a sovrastimare l’analisi web, Sentimeter ha dato i dati corretti. Come mai? Scrivono così gli autori di Voices from the blogs dopo l’esito elettorale:

Il setimento della rete ha correttamente anticipato  la vittoria del Presidente Obama nel voto popolare, la vittoria nei tre stati cruciali: Ohio, Virginia e  soprattutto Florida (6089 sezioni scrutinate su 6089) e ben 9 su un totale di 11 Swing States, uniche eccezioni Colorado e Pennsylvania.

Questo significa che, se l’analisi dei discorsi online è stata corretta, e non abbiamo motivo di dubitarne, gli utenti americani attivi su Twitter hanno espresso una preferenza vicina a quella degli americani ai seggi.

In un articolo che spiegava il funzionamento e i criteri del sistema di analisi di Sentimeter, gli stessi autori ammettevano che:

[è] solo un modo diverso di guardare al sentimento di scrive su Twitter, alla pancia dell’America durante queste elezioni che per una larga parte passano attraverso questo social network. Poi, come sempre, chi andrà realmente a votare determinerà, con il suo voto, il risultato di queste elezioni.

Concludo con qualche domanda, che poi sono dubbi di uno scettico, sulla questione Twitter e interpretazione del voto:

1. La pretesa di scientificità della rilevazione dei dati online può essere comparata per efficacia e autorevolezza a quella fin ora usata nei sondaggi su base statistica? I Big data rimpiazzano i sondaggi?

2. Possiamo ritenere i sondaggi superati da un modello tecnologico che per sua natura taglia fuori dai risultati tutti coloro che non lo utilizzano? Pare che Twitter negli Stati Uniti sia per lo più utilizzato da giovani (18-34) e più da neri e ispanici rispetto ai bianchi. (e qui) L’elettorato di Obama, insomma.

3.  Che tipo di persona è colui che appoggia o critica un candidato attraverso Twitter? l’iperattività o l’interazione tra coloro che usano i social network è un campione rappresentativo e affidabile del voto dell’americano medio?

4. Twitter è un sismografo umano di eventi socialmente rilevanti (e irrilevanti), ma è anche rappresentativo di un “popolo della rete” uniforme durante i momenti di aggregazione di dati in #hashtag che diventano trending topic?

Io tenderei ad escludere che si possa predire il comportamento elettorale in base all’umore dei tweet poiché non tutte le categorie di votanti sono rappresentate e perché i criteri utilizzati nella valutazione sono, per ora, scarsamente consultabili e troppo esoterici. Quanti tweet scrive un utente in favore o contro un candidato? Si conteggiano i big data o i singoli utenti?Gli Hub valgono tanto quanto gli utenti comuni? Si tiene conto di chi non può votare (minorenni)? Eccetera.

About these ads

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...