Serie A, ecco la formula della fortuna del calcio

La community degli appassionati di calcio e dati sviluppa metodi statistici per capire quali squadre beneficiano dell'aiuto della sorte e quali no. Abbiamo provato ad applicare uno di questi sistemi alla Serie A e il responso è...

(Foto: Ap/LaPresse)
(Foto: Ap/LaPresse)

Ci sono i giocatori che segnano e quelli che cercano di evitare che questo accada. E poi c’è l’imponderabile, ovvero quell’elemento che viene, a seconda dei contesti, chiamato “fortuna”, “caso”, “fato”, “scarogna”, e in tanti altri modi non sempre ripetibili in pubblico. Come sa chiunque segua un po’ il calcio e come confermano gli appassionati di pallone che si occupano di statistica, anche questo fattore determina i risultati di partite e campionati: nella storia della Serie A, secondo l’analisi di Luigi Curini, professore di scienza politica alla Statale di Milano, incide fino al 40%. E’ come dire che in media 4 incontri su 10 del nostro massimo torneo sono decisi da eventi casuali (anche se negli ultimi decenni l’impatto della dea bendata è andato sensibilmente diminuendo).

Sapere quanto la casualità influisce sui risultati è certo interessante, ma scoprire quale squadra in un determinato momento beneficia dei favori della sorte e quale è bersagliata dalla sfiga lo è anche di più. E infatti la crescente community di nerd che si nutrono a dati e calcio lavora a strumenti con cui rispondere a questa domanda. Uno, per esempio, si chiama PDO ed è mutuato dall’hockey su ghiaccio. In pratica misura la percentuale di tiri nello specchio trasformati in gol rispetto agli avversari. Siccome si tratta di un indicatore che in termini statistici tende a regredire velocemente verso la media, valori troppo alti o troppo bassi per una squadra in un certo momento sono interpretati come un sintomo di buona o cattiva sorte ovvero, più precisamente, come tendenze insostenibili sul medio e lungo termine che dovranno prima o poi scendere o salire verso la norma.

A volte il PDO viene accoppiato con metriche più sofisticate come quelle che misurano i “Gol Attesi” (Expected Goals in inglese). In questa categoria di formule (non ce n’è una sola: ognuno si inventa la propria e di solito la tiene segreta) per prima cosa si analizza la posizione del campo da cui una squadra effettua e subisce tiri (più vicino alla porta o meno, centrale o defilata, eccetera). Dopodiché, sulla base della frequenza con cui storicamente i palloni scoccati da quelle zone sono convertiti in rete, si calcola quanti gol dovrebbe segnare e subire in termini di probabilità quella stessa compagine. Infine, la differenza tra “gol attesi” e quelli reali può essere letta come un’indicazione di chi in un determinato momento può contare, oltre a quello degli undici in campo, sul talento della fortuna.

Tra i metodi per cercare di scoprire chi gode del favore degli Dei pallonari c’è poi quello delle cosiddette “Aspettative pitagoriche”. La formulazione originaria si deve a Bill James, figura leggendaria delle statistiche applicate al baseball. E’ lui che ha inventato il termine “sabermetrica”, ovvero l’impiego di equazioni rigorose per l’analisi di quanto accade nei campi a forma di diamante, come raccontato nel film Moneyball con Brad Pitt. James si rese conto che nello sport che amava il numero di vittorie di una squadra in una stagione poteva essere previsto con ottima approssimazione attraverso una formula che un po’ ricorda quella del celebre teorema che tutti abbiamo studiato a scuola (da qui il nome), ovvero: il quadrato del numero di punti (runs, in inglese) messi a segno da una formazione diviso per la somma degli stessi punti e di quelli concessi, il tutto sempre rigorosamente al quadrato (se vi siete un po’ persi, la “ricetta” per esteso è qui).

Nel tempo, l’intuizione di James è stata variamente raffinata e qualcuno ha provato ad applicarla al calcio (tra questi anche 538, il sito di giornalismo dei dati lanciato da Nate Silver). Sostituire le runs del baseball con i gol segnati e subiti e le vittorie con i punti ha richiesto un po’ di lavoro sugli esponenti per rendere conto del fatto che la disciplina più amata dagli italiani prevede il pareggio, epilogo che gli sport americani di solito aborrono.

Risultato: grazie a Bill James e ai suoi epigoni siamo in grado di calcolare quanti punti storicamente realizza una squadra con un determinato tasso di reti (che è cosa diversa dalla differenza reti) e poi confrontare la cifra ottenuta con la classifica reale. La differenza tra punti “pitagorici” e effettivi indica quali formazioni stanno ottenendo di più o di meno rispetto a quanto dovrebbero dai gol realizzati e concessi. Questa discrepanza può suggerire, di volta in volta, chi può ragionevolmente lamentarsi contro il destino avverso e chi invece dovrebbero toccare ferro sperando che continui così.

Cosa si scopre se si applica la formula (qui utilizziamo la variante elaborata dal blogger Martin Eastwood) a queste prime 12 giornate di campionato? Innanzitutto che, fossimo tifosi dell’Atalanta, non dovremmo lamentarci, o forse sì nel senso che il peggio potrebbe ancora venire. La classifica vera e propria dei bergamaschi infatti non è eccelsa ma sarebbe ben peggio se non stessero ottenendo dai loro gol più di quanto storicamente accada in Serie A a chi che segni e subisca quanto loro: quasi 3 punti in più, 2,95 per la precisione. Al contrario, i tifosi del Cagliari hanno un bel po’ da recriminare. Le aspettative pitagoriche dicono che i rossoblu dovrebbero avere in saccoccia 4,79 punti in più sulla base di quanto realizzano e concedono.

Se poi confrontiamo la graduatoria “pitagorica” con quella reale, i supporter atalantini possono, di nuovo, affrettarsi a fare gli scongiuri: la loro amata, secondo Bill James e seguaci, dovrebbe essere ultima da sola. Al contrario, nel mondo “pitagorico” il Cagliari staziona quasi a ridosso della zona Europa League.

Certo, tutto questo va preso con le pinze del buon senso. Anche perché in una fase così precoce del torneo risultati statisticamente anomali (come il 7-0 dell’Inter al Sassuolo e quello della Juventus al Parma) possono distorcere il responso. Né il sistema tiene conto del fatto che ci sono squadre, come il Torino, capaci di sbagliare 5 rigori consecutivi, cosa che i supporter granata – con qualche ragione – potrebbero definire il massimo della sfiga o dell’autolesionismo.

Tutto quello che le “Aspettative pitagoriche” fanno, insomma, è illustrarci delle tendenze. Per il resto, non c’è altro da fare che vedere come si evolverà la situazione perché, come noto, la ruota (della fortuna) gira.

Per chi volesse provarla, la formula elaborata da Martin Eastwood è la seguente:

GF^1,22990463136253
———————–
[GF^1,16792760632132+GS^1,20053157314425]*2,29761008220905*N

LEGENDA: GF=gol fatti; GS= gol subiti; N=numero di partite; ^= elevato a…

Leggi anche