Calcio e statistiche, la rivoluzione fatevela in casa

La Germania c'ha vinto il Mondiale. Nella Nba e nello sport americano in generale si usano da anni. Ecco come calcolare quelle che leggete su GQ
Calcio e dati la rivoluzione si può fare in casa

La rivoluzione dei dati è arrivata anche nel calcio. La prova provata l'ha offerta, ai livelli più alti, la Germania, campione del mondo. I tedeschi hanno conquistato la coppa anche grazie alle sofisticate elaborazioni realizzatecon l'aiuto del colosso (tedesco) della business intelligence SAP, la stessa azienda che contribuisce alle bellissime statistiche della Nba. Ma non si tratta solo di nazionali, anche squadre di club, come noto, hanno abbracciato la tendenza impiegando sistemi che tracciano i movimenti dei giocatori o promuovendo all'interno dell'organizzazione dipartimenti dedicati all'analisi delle performance della squadra basate sui numeri. Nel frattempo, schiere di blogger che un tempo discutevano su chi deve giocare titolare o se una squadra sia più forte o più fortunata continuano a farlo ma con una sofisticazione prima sconosciuta*.*

Insomma, la rivoluzione è cominciata anche se non è proprio per tutti. Le società di calcio, comprensibilmente, tengono le loro statistiche custodite nei rispettivi forzieri informatici. Mentre le aziende che raccolgono dati sul calcio come Opta o Panini, altrettanto comprensibilmente, li vendono. E chi non ha i soldi per acquistarli deve arrangiarsi. Fortunatamente in Rete non mancano le risorse e anche chi non ha il portafogli per assicurarsi i numeri più raffinati può divertirsi con quel che passa (gratis) il convento digitale e con un pò di buona volontà. Il risultato sono alcune metriche “artigianali” che, anche se non sono le più raffinate in circolazione, possono aiutare ad analizzare l'andamento di un campionato oltre i punti, le vittorie e la differenza reti. È quello che facciamo anche noi.

Qui di seguito una lista (in divenire) delle statistiche “fatte in casa” che utilizziamo spesso su GQ Italia

TSRCome si calcolaIn inglese sta per Total Shot Ratio. È stato introdotto e popolarizzato nella community dei blogger che si occupano di statistiche sul calcio, da James Grayson. Si calcola dividendo i tiri fatti (TF) da una squadra per i tiri fatti sommati a quelli subiti (TS). La formula è: TF / (TF + TS). Il risultato è uno zero-virgola-qualcosa che dice quanto una squadra è in grado di arrivare al tiro rispetto agli avversari. La media di un campionato è sempre 0,50.

Perché è utile?In Serie A il TSR mostra una discreta correlazione con il punteggio finale in classifica, ovvero più alto è il TSR, più tende ad essere buona la posizione in campionato. Per chi mastica un pò di statistica nelle ultime 9 stagioni l'indice di Pearson tra punti e TSR è stato di 0,62 mentre l'R2 di 0,47, come nel grafico.

Al di là della correlazione, il TSR è utile perché tende a stabilizzarsi in fretta: dopo 6-7 partite, in media, il valore resta più o meno quello fino alla fine della stagione. In questo modo fornisce abbastanza presto un'indicazione del potenziale delle squadre. Inoltre, il TSR tende ad essere abbastanza stabile da una stagione all'altra e dunque il suo andamento può essere una buona base per predire le performance future di una formazione o analizzare l'andamento negli anni.

Fonti dei datiPer calcolare il TSR utilizziamo i dati grezzi forniti da Football-Data.co.uk

STRCome si calcolaIn inglese sta per Shot on Target Ratio. Si calcola dividendo i tiri nello specchio fatti (TSF) da una squadra per i tiri nello specchio fatti sommati a quelli nello specchio subiti (TSS). La formula è: TSF / (TSF + TSS). Il risultato è, di nuovo, uno zero-virgola-qualcosa che dice quanto una squadra è in grado di centrare la porta rispetto agli avversari. La media di un campionato è sempre 0,50.

Perché è utileIn Serie A il STR mostra una buona correlazione con il punteggio finale in classifica, ovvero più alto è il STR di una squadra, più tende ad essere buona la posizione nella classifica finale. Nelle ultime 9 annate l'indice di Pearson tra punti e STR è stato di 0,82 mentre l'R2 di 0,67 (guarda il grafico).

Anche il STR è abbastanza stabile da una stagione all'altra e dunque il suo andamento può essere una buona base per predire le performance future di una formazione o analizzarne l'andamento negli anni.

Fonti dei datiPer calcolare il STR utilizziamo i dati grezzi forniti da Football-Data.co.uk

ISRCome si calcolaIn inglese sta per Inside-the-box Shot Ratio. Si calcola dividendo i tiri da dentro l'area effettuati (TAF) da una squadra per i tiri da dentro l'area fatti sommati a quelli da dentro l'area subiti (TAS). La formula è: TAF / (TAF + TAS). Il risultato dice quanto una squadra è in grado di arrivare al tiro da una posizione, almeno teoricamente favorevole, rispetto agli avversari. La media di un campionato è sempre 0,50.

Perché è utileIn Serie A lo ISR denota una buona correlazione con il punteggio finale in classifica. Nelle ultime 5 stagioni della Seria A l'indice di Pearson tra punti e ISR è stato di 0,81 mentre l'R2 di 0,66 (guarda il grafico qui sotto).

È una metrica interessante dal momento che per arrivare con una certa costanza a scagliare palloni verso la porta degli avversari da più vicino (e per impedire agli avversari di fare altrettanto) ci vuole una buona dose di sapienza offensiva, difensiva e tattica. Insomma, è un'altra misura della qualità di una formazione. Si può aggiungere che, come già scritto, negli ultimi 5 anni lo scudetto l’ha vinto proprio la squadra con lo ISR più alto.

Fonti dei datiPer calcolare lo ISR incrociamo i dati di Football-Data.co.uk (tiri totali) con quelli di WhoScored.com (percentuale di tiri da dentro l'area).

TASSO DI CONVERSIONECome si calcola Si calcola dividendo la percentuale di tiri nello specchio fatti convertiti in reti (%TFC) per la percentuale di tiri nello specchio fatti convertiti in rete sommata alla percentuale di tiri nello specchio subiti convertiti in rete (%TSC). La formula è: %TFC / (%TFC + %TSC). Il risultato è un'indicazione di quanto una squadra riesce a trasformare in gol i tiri rispetto agli avversari, si potrebbe dire che misura il “cinismo” di una formazione. La media di un campionato è sempre 0,50.

Perché è utileIl tasso di conversione mostra una buona correlazione con il punteggio finale. Nelle ultime 9 stagioni l'indice di Pearson tra punti e tasso di conversione è stato di 0,78 mentre l'R2 di 0,61, come si può vedere in questo grafico.

Ma, a differenza, delle altre metriche non è stabile da una stagione all'altra, anzi. Tra un campionato e l'altro e anche durante lo stesso campionato, tende a quella che gli statistici chiamano “regressione verso la media”, vale a dire che i valori estremi (approssimativamente sopra lo 0,60 e sotto lo 0,40) tendono a tornare verso la media. Per questo alcuni blogger specializzati usano questa metrica (anche se in una versione leggermente modificata chiamata PDO come misura della “fortuna” di una squadra in un campionato. Va detto però che le squadre migliori riescono comunque ad avere stabilmente nel tempo un tasso di conversione sopra la media Probabilmente perché riescono ad arrivare al tiro più frequentemente degli avversari. Anche per questo combinare questa metrica con le precedenti può dare indicazioni interessanti.

Fonte dei datiPer calcolare il Tasso di Conversione utilizziamo i dati grezzi forniti da Football-Data.co.uk