L’Arabo supera l’Inglese nei tweet su IS (Islamic State)

isis-twitter

L’analisi di milioni di tweet che parlano di IS (Islamic State) condivisi dall’inizio del 2014 fino a febbraio 2015, rivela che l’arabo ha superato ormai da mesi l’inglese come lingua predominante nelle conversazioni su Twitter.

Lo studio è stato realizzato da Recorded Future, una startup specializzata in predictive analytics (cioé di previsione di eventi, come per esempio i moti di protesta) a partire dall’ascolto di ciò che avviene sui social media. Tra i suoi investitori spiccano Google e la CIA.

L’ESITO DELLO STUDIO

L’analisi quantitativa dei tweet che riguardano IS (Islamic State) rivela che il loro volume è aumentato nel periodo agosto-ottobre del 2014, calato nettamente tra novembre e dicembre, quindi esploso nel 2015.

La crescita nel 2015 è quasi interamente dovuta ai tweet scritti in arabo, che già dal settembre 2014 ha soppiantato l’inglese come lingua dominante nelle discussioni riguardanti IS (Islamic State) su Twitter. Questa tendenza è spiegabile in parte con l’intensificarsi degli sforzi di alcuni Paesi arabi verso lo Stato Islamico. Inoltre, la diffusione dell’attività di IS (Islamic State) in nuove aree geografiche (per esempio, in Giordania e in Libia) ha generato un maggiore interesse tra le popolazioni di questi Paesi, così come tra quelli confinanti.

L’analisi del volume dei tweet però non è sufficiente a comprendere il fenomeno; per fare un’analisi qualitativa si ricorre alla sentiment analysis, una disciplica che studia le conversazioni sui Social network attraverso software che provano a interpretare il linguaggio umano. Questo è un processo molto complesso basato su un modello che può essere più o meno preciso a seconda dei casi. I passaggi comprendono l’identificazione della lingua utilizzata, la classificazione della polarità (tra atteggiamento positivo, negativo o neutrale) e la classificazione dello stato d’animo (che può essere “felice“, “arrabbiato“, :D, LOL,…). La classificazione avviene quindi in base all’analisi delle singole parole, dei concetti, dei modi di dire, degli emoticons e degli acronimi utilizzati nel testo. Un margine di errore è dovuto agli errori di battitura, alla difficoltà di rilevare l’ironia e alla sintesi imposta dai 140 caratteri a disposizione.

Da questa analisi qualitativa emerge che dalla fine di gennaio 2015 è aumentata la percentuale di tweet che hanno contemporaneamente un atteggiamento positivo sia su “IS” che sulla “violenza“, inclusa quella contro IS. L’aumento maggiore del volume di tweet sembra derivare dagli account contrari a IS.

Lo studio ha anche verificato se e in quale misura il volume dei tweet sia riconducibile a comportamenti umani o se invece sia stato alterato da automatismi (bot) che ne riproducono il comportamento. I bot sono in grado di generare anche migliaia di tweet al giorno e risultano utilizzati da tutte le parti coinvolte nel conflitto. Ciononostante, il grande incremento del volume nel 2015 sembra non dipendere solo da questi perché il numero medio di tweet per account rimane basso.

Dopo il volume, la lingua e l’atteggiamento, un altro punto di osservazione è quello dell’area geografica. Da gennaio a febbraio del 2015, il maggiore incremento del volume di tweet in arabo su IS ha origine in Egitto (+400%) e in Arabia Saudita. E’ ipotizzabile una relazione tra il comportamento on-line e gli avvenimenti sul terreno, per esempio l’intensificazione degli sforzi nel conflitto.

 

I DATI DELLO STUDIO

La crescita esplosiva

Il volume dei tweet che riguardano IS (Islamic State) è cresciuto nel periodo agosto-ottobre del 2014, è calato nettamente tra novembre e dicembre ed è esploso nel 2015.

Complessivamente, dal 1° Gennaio 2014 si è incrementato notevolmente il numero di tweet che parlano di IS, specie se confrontato con le citazioni sugli altri media. In particolare, da dicembre 2014 a febbraio 2015 la media dei tweet giornalieri su IS è cresciuta del 250% (con un picco di oltre 1,2 milioni di riferimenti il ​​3 febbraio).

isis-twitter-growth-01

Il sorpasso della lingua araba sull’inglese

Dividendo i tweet per lingua, si nota che dal settembre 2014 la lingua dominante nelle discussioni su IS non è più l’inglese ma l’arabo. La grande crescita del volume totale di tweet nel 2015 è dovuta proprio a quelli in arabo.

isis-twitter-growth-02

isis-twitter-growth-03

 

Il grafico successivo mostra invece che i due picchi principali nel mese di febbraio sono strettamente correlati all’attività di IS in Giordania e Libia.

isis-twitter-growth-04

 

Lo spostamento del Sentiment

I grafici precedenti non ci dicono però se i contenuti sono pro o contro IS.  Per fare questo occorre analizzare il “sentiment” dei contenuti. Recorded Future ha utilizzato vari parametri, tra cui l’atteggiamento positivo, quello negativo e la violenza. La presenza contemporanea nei contenuti di atteggiamento positivo e violenza è un criterio, anche se elementare, per tentare di identificare gli account Twitter pro-IS. Come già detto, l’aumento maggiore del volume di tweet sembra essere dovuto agli account che esprimono dissenso verso IS.

Il grafico seguente mostra come questa metrica sia rimasta piuttosto stabile dall’inizio di giugno fino alla fine di gennaio 2015, quando è aumentata in modo significativo (di circa sei volte su una media mobile di 14 giorni).

isis-twitter-growth-05

 

Questa tendenza è ancora più evidente se si considerano solo i tweet in arabo dove ci sono contemporaneamente atteggiamento positivo e violenza.

isis-twitter-growth-06

 

Nei tweet in inglese invece non c’è questo cambiamento di atteggiamento nel tempo.

isis-twitter-growth-07

 

L’attività è influenzata da Bot?

Per capire se questo enorme volume di tweet sia guidato da bot occorre differenziare un bot da un comportamento umano; questa attività non è affatto banale, ma discreti indicatori possono essere il volume e la frequenza di tweet giornalieri per un certo account. Sulla base di questo si potrebbero individuare alcuni bot, ma questo fenomeno non contribuisce a più di 5.000 tweet al giorno. L’analisi manuale di alcuni di questi account ha anche mostrato che sono utilizzati da tutte le parti coinvolte nel conflitto. Molti degli account da classificati da questa analisi come ad alto volume e pro-IS sono effettivamente stati sospesi da Twitter.

Il volume medio nel corso del 2015 è di circa 3 tweet giornalieri per account, dove probabilmente i tweet dei bot sono bilanciati da quelli a basso volume di persone fisiche. A gennaio si sono verificati due picchi dove l’aumento del volume totale sembra essere innescato da pochi account che generano grandi volumi; in realtà i due picchi del 3 e del 16 febbraio sono stati accompagnati da un aumento del numero di account attivi e non ci sono segnali evidenti che questo volume di tweet sia invece pilotato da bot.

Nel grafico, la linea blu indica il numero di account unici attivi, la linea verde indica il numero di tweet (valori a sinistra) e la linea rossa indica il numero medio di tweet per account (valori a destra).

isis-twitter-growth-08

 

Il volume potrebbe però essere guidato da un gran numero di bot a basso volume. In questo caso ogni fenomeno va analizzato separatamente. Prendiamo per esempio un tweet “meme” da 470 mila tweet a sostegno delle forze di sicurezza e militari saudite, che includeva il testo “God help and preserve the security and military forces who stand vigil for the preservation of the State after God #Arrest #Daash #Islamic State“) più alcuni testi e immagini di soldati non appartenenti a IS.

Questa campagna, iniziata il 28 gennaio, mostra un calo del numero di tweet nelle giornate di venerdì (giorno di preghiera per i musulmani).

isis-twitter-growth-10

 

Il grafico successivo mostra il numero di account attivi al giorno per questa campagna e il numero medio di tweet al giorno per account.

isis-twitter-growth-11

 

In totale, da quando la campagna è iniziata, 2.463 account sono stati attivi e il numero massimo di condivisioni giornaliere per singolo account è stato di 104 tweet. Tutti questi dati suggeriscono che in questo specifico caso si sia trattato di una campagna manuale che ha coinvolto un buon numero di account per massimizzare l’impatto.

Da dove provengono i Tweet?

I tweet giornalieri in arabo da gennaio a febbraio sono cresciuti mediamente del 60%. Purtroppo, di tutti questi tweet quelli georeferenziati sono solo circa uno su 3.000: pochissimi rispetto alla media tradizionale dei tweet, che si aggira attorno a qualche punto percentuale. In compenso sono ben il 10% dei tweets di gennaio e il 19% di quelli di febbraio.

Moltissimi di questi tweet provengono dall’Arabia Saudita, mentre l’incremento maggiore arriva dall’Egitto, dove a febbraio il numero di tweet si è quintuplicato. E’ immaginabile che il numero di tweet su IS di un Paese cresca nel momento in cui ne viene coinvolto. Tra le nazioni occidentali sono rilevanti solo Stati Uniti e UK.

isis-twitter-growth-12

 

QUALCHE CONSIDERAZIONE FINALE

Questo studio è rilevante perché abbraccia un arco temporale molto lungo e un enorme volume di contenuti eterogenei. Inoltre su tutti questi dati sono state condotte analisi complesse e in profondità. Può quindi, a mio personale avviso, ritenersi un modello rappresentativo del fenomeno IS su Twitter.

Il disegno finale suggerisce non tanto un cambio di strategia (o atteggiamento spontaneo) da parte di IS o delle nazioni occidentali, quanto delle persone di lingua araba che sono contrarie alle azioni di IS.

Come già ampiamente spiegato in passato, IS utilizza Twitter in modo evoluto (ma anche Youtube, Facebook e Justpaste.it) con varie finalità, dal social recruiting al rafforzamento dell’immagine (brand awareness) tra le persone di lingua araba, generalmente condividendo contenuti autoprodotti. Tutto questo avviene sfidando i Termini di Utilizzo dei servizi utilizzati, in una rincorsa continua tra chiusura di account e la riapertura sotto altro nome.

Al contrario, i contenuti su IS nelle altre lingue sono per lo più di carattere giornalistico, con molti riferimenti ad articoli su testate. E’ opinione diffusa che una eccessiva amplificazione dei contenuti di IS da parte dei media (o degli account) occidentali faccia il gioco dell’avversario. La ricerca della violenza, le provocazioni estreme e le condivisioni sui social media cercano appunto questo tipo di reazione. Se da un lato è già stato dimostrato che una certa amplificazione ci sia, vuoi per diritto di cronaca o a volte per una discutibile scelta per attirare lettori, dall’altro questo studio ci dice che sia l’impegno che l’atteggiamento dei media occidentali sono rimasti costanti nel tempo.

fonte: Recorded Future

Info su Roberto Favini

Sono un blogger col pallino del giornalismo dei dati, del fact-checking e delle forme digitali di storytelling, oltre che fervente sostenitore della libertà di espressione. Il mio contributo a “Con bagaglio leggero” riguarderà appunto questo tipo di pratiche.
categorie analytics, Digitale
tag ,