Riprendiamo quanto fatto ieri per simulare il resto del campionato e proiettare la classifica finale.
Ieri ho parlato dei limiti di un’analisi del genere, che è fatta più per divertimento che per altro (ed è anche relativamente facile da aggiornare dopo ogni giornata di campionato).
Paragonando la media punti di chi si affronta, si ottiene un metodo veloce per valutare chi sia favorito in ciascuna partita. Sappiamo che nel campionato italiano poco più di una partita su 4 finisca in parità. In base a questo possiamo stimare quanti pareggi e quante vittorie potranno esserci da qui a fine stagione, sulle 120 rimaste. E’ relativamente facile capire che se due squadre hanno una media punti identica, il risultato più probabile sarà il pareggio, mentre se una ha una media punti di 2.50 e l’altra di 0.50, il risultato più probabile sarà la vittoria della prima. Ovviamente parliamo sempre di probabilità, perché il risultato a sorpresa è sempre dietro l’angolo.
Dobbiamo individuare quale sia il “threshold”, ossia il limite oltre il quale si passa da un pareggio ad una vittoria. Io ho stimato che se una squadra fa più del 134% dei punti della rivale (ossia se la sua media punti, divisa per la media punti dell’avversaria, è superiore a 1.34), allora può ritenersi favorita per la vittoria. Usare la costante di 1.34 porterebbe ad 86 vittorie (e sconfitte) e 34 pareggi da qui alla fine del campionato sulle 120 rimaste, un rapporto piuttosto simile a quello avuto sinora e pertanto piuttosto attendibile. Naturalmente per semplicità io uso una costante rigida, che porta ad un rapporto di 1.35 come una vittoria, ed uno di 1.34 come un pareggio, quindi dovete essere elastici nelle valutazioni. Premesso questo, possiamo procedere a stimare il resto del campionato, ma prima facciamo un esempio usando la prossima giornata:
- Roma (2.25 punti a partita in casa) – Parma (0.67 punti a partita in trasferta): rapporto di 3.36, quindi vittoria per la Roma.
- Cagliari (1.69) – Lazio (1.50): pareggio.
- Milan (2.08) – Napoli (1.77): pareggio.
- Palermo (2.00) – Udinese (1.31): vittoria del Palermo.
- Catania (1.69) – Genoa (1.31): pareggio.
- Juventus (1.75) – Bologna (0.77): vittoria della Juventus.
- Cesena (1.15) – Chievo (1.00): pareggio.
- Brescia (1.31) – Lecce (0.62): vittoria del Brescia.
- Bari (0.77) – Fiorentina (0.69): pareggio.
- Sampdoria (1.54) – Inter (1.54): pareggio.
Solo 4 vittorie, con ben 6 pareggi. La prossima giornata in realtà è un’anomalia, perché già in quella successiva ci sarebbero 9 vittorie con un solo pareggio (Juventus-Milan). Come detto, Sampdoria-Inter sembrerebbe un pareggio scritto, ma sono due squadre molto diverse da mesi fa. Inoltre gli obiettivi delle ultimissime giornate (una che si gioca tutto contro una che non ha più nulla da chiedere) potrebbero ulteriormente distorcere questa analisi, ma è un punto di partenza importante.
Usando la strength of schedule di ieri e questo metodo comparativo, quanti punti farebbero le varie squadre da qui alla fine? Questo deve essere fatto, perché se è vero che il Bari abbia il secondo calendario più semplice da qui alla fine (dopo la Sampdoria) è anche vero che sia il Bari, ossia l’ultima della classe. In effetti il Bari sarà favorito per la vittoria solo una volta da qui alla fine, in casa col Catania (0.77 media punti contro 0.31), e se continuasse a giocare così raccatterebbe pochissimi punti nonostante il calendario più semplice. Vediamo i punti che otterrebbero le squadre da qui alla fine:
- Napoli 24
- Milan 24
- Roma 22
- Inter 22
- Udinese 19
- Chievo 18
- Lazio 18
- Juventus 18
- Genoa 17
- Sampdoria 17
- Palermo 16
- Bologna 16
- Fiorentina 15
- Cagliari 14
- Catania 14
- Lecce 13
- Brescia 13
- Cesena 12
- Bari 7
- Parma 7
Come detto ieri, il calendario del Parma è davvero terribile. L’unica partita in cui il Parma è chiaramente favorito è Parma-Bari. Se le squadre ottenessero questi punti, come finirebbe la stagione?
- Milan 79
- Napoli 76
- Inter 72
- Lazio 66
- Roma 64
- Udinese 63
- Juventus 59
- Palermo 56
- Genoa 52
- Chievo 49
- Cagliari 49
- Sampdoria 48
- Fiorentina 48
- Bologna 48*
- Catania 40
- Lecce 40
- Brescia 36
- Cesena 34
- Parma 34
- Bari 22
*Il Bologna farebbe 51 punti sul campo, ma è stato penalizzato di 3.
I verdetti sono semplici, ma guardate la cima: con Milan e Napoli divise da soli 3 punti, gli scontri diretti diventerebbero tutti fondamentali. Lo stesso vale per l’Inter, che avendo due scontri diretti in mezzo è meno distante di quanto sembri. L’Inter ha fatto “solo” 1.54 punti a partita fuori casa, e giocherà entrambi gli scontri diretti fuori (incluso il derby, per calendario), quindi la simulazione la da’ perdente in entrambe le partite (oltre a limitarsi a pareggiare a Brescia e Parma, per gli stessi motivi). Se riuscisse a sovvertirle, sarebbe facilmente in testa (oltre ad aggiungere 6 punti all’Inter, bisognerebbe toglierne 3 al Milan ed al Napoli). Udinese-Lazio alla terzultima di campionato potrebbe valere la Champions (anche se la simulazione l’ha già assegnata all’Udinese, quindi i bianconeri dovranno trovare punti da altre parti per raggiungere i biancazzurri), ed Udinese-Milan all’ultima potrebbe essere a sua volta determinante se l’Udinese si stesse giocando il quarto posto. La Roma a sua volta è ad un passo. Ancora una volta: scontri diretti, episodi e semplice casualità saranno chiave per l’assegnazione del titolo.
Ci sarà un interessante sprint anche per il quarto posto in Champions League, dove solo il Palermo sembra tagliato fuori dal calendario, con la Juve sfavorita ma ancora comunque in piena corsa. Il Parma, col suo calendario orribile, rischia di essere risucchiato come previsto ieri, mentre Catania e Lecce sembrano essere più al sicuro. In effetti a fine campionato le squadre in lotta per la salvezza ottengono sempre qualche punto più del previsto, ma le due squadre del sud sembrano tranquille ugualmente.
Una delle cose più divertenti sarà vedere chi riuscirà a fare meglio delle previsioni, e chi farà peggio, perché naturalmente una squadra che diventa “calda” al momento giusto, e magari gioca contro una che non ha più nulla da chiedere al campionato potrebbe avvantaggiarsi. D’altra parte una trasferta a Marassi nell’ultima potrebbe essere più facile di andare a Cesena, per fare un semplice esempio, anche se questo non emerge dalla simulazione.
Ho effettuato una minima correzione ai calcoli rispetto alla prima versione di questo post (a stretto giro di pubblicazione comunque).
Dopo aver letto il primo commento che leggete qui sotto, ho deciso di fare un’altra proiezione. Io avevo cercato di assegnare (anche un po’ forzatamente, come detto), 3-1-0 punti in ogni incontro, però effettivamente anche quanto riportato dal commento ha un suo merito, specie se non si intende fare una proiezione ma una stima. Assegnare punti commisurati all’abilità (che si presume vengano “pareggiati” a fine stagione) non è una cattiva idea, anzi. Per la metodologia, leggete il commento. Ecco quanti punti guadagnerebbero le squadre da qui a fine stagione con questo metodo:
- Milan 20.56
- Inter 20.23
- Napoli 19.54
- Roma 18.64
- Udinese 18.41
- Lazio 17.78
- Juventus 17.72
- Palermo 16.84
- Bologna 16.78
- Cagliari 16.55
- Sampdoria 16.45
- Genoa 16.28
- Fiorentina 16.23
- Chievo 16.06
- Lecce 14.6
- Catania 14.02
- Brescia 13.88
- Cesena 13.47
- Parma 12.67
- Bari 12.16
Noterete il grosso schiacciamento al centro e l’aumento dei punti per le squadre col calendario più semplice. Vediamo la stima della classifica finale:
- Milan 75.56
- Napoli 71.54
- Inter 70.23
- Lazio 65.78
- Udinese 62.41
- Roma 60.64
- Juventus 58.72
- Palermo 56.84
- Cagliari 51.55
- Genoa 51.28
- Fiorentina 49.23
- Bologna 48.78
- Sampdoria 47.45
- Chievo 47.06
- Lecce 41.60
- Catania 40.02
- Parma 39.67
- Brescia 36.88
- Cesena 35.47
- Bari 27.16
Anche qui al Bologna ho tolto 3 punti (sarebbe arrivato a 51.78). Come noterete la metodologia non cambia di troppo il risultato, anche se due cambiamenti sono degni di nota: l’Udinese davanti alla Roma ed il Parma salvo. Forse è proprio il Parma a beneficiare maggiormente da tutto ciò. Anche l’Inter si avvicina al duo di testa, senza inserirsi però.

9 utenti hanno lasciato commenti su " Proiettare la classifica finale "
Abbonati al commento con l'rss o lascia un TrackbackCiao! So che è un suggerimento più di facciata che altro, ma… considerare le medie punti “concessi” da una squadra per le proiezioni? Ad esempio, la Roma in casa concede 0,5 punti a partita, il Parma fuori ne realizza 0,67 (media: 0,58). Viceversa, la Roma in casa realizza 2.25, il Parma ne concede in trasferta 2,17 (media: 2,21). Bene, dato che l’idea di questa classifica è di essere orientativa, the evil proposal is: perché non dare direttamente 2,21 punti alla Roma e 0,58 al Parma, e così via per tutte le altre, e quindi nuovamente per tutte le giornate rimanenti fino a fine torneo? Si otterrebbe un proiezione dei punteggi a fine campionato, con un ovvio piccolo margine di errore (magari verrebbe fuori, chessò, una previsione di 76,243 punti per il Milan), ma penso sarebbe abbastanza indicativa. Dico questo solo perché non amo troppo il fissare dei limiti arbitrari, e nel medio-lungo termine il problema dei punteggi ipotetici si dovrebbe compensare da sé (nelle due partite in cui il sistema prevede gli impossibili 2 e 2 punti per una squadra, magari alla fine se ne otterranno comunque 4 tramite vittoria e pari). Tutto questo ovviamente al netto delle classiche pastette di fine torneo, dato che ben sappiamo la differenza che c’è nell’affrontare alla penultima un Milan ancora in lotta per qualcosa oppure già campione d’Italia. Solo un pensiero. Ciao e buon lavoro!
Ciao,
è un discorso interessante per quanto riguarda le stime. Io avevo cercato di effettuare una proiezione facendo una vera e propria “simulazione”, però se vuoi stimare i risultati in base alla difficoltà del calendario, è un’idea con merito. Ho aggiornato il post sopra per inserire anche questa tabella, e puoi vedere l’eventuale classifica risultante. Come vedi non ci sono grandi differenze, a parte per il Parma magari.
Il salto del Parma mi ha dato un po’ da pensare, probabilmente i suoi numeri con questo sistema beneficiano un po’ troppo dall’aver avuto fino ad oggi un calendario “facile”, e le stime ne risulterebbero quindi gonfiate. Oggi non ho molto tempo, domani vedrò se riesco ad aggiustare il risultato dei ducali in base agli avversari affrontati nel girone di ritorno.
Per inserire il fattore “forma” o recenti cambiamenti (esempio di Inter e Sampdoria), si potrebbe pensare di inserire nel calcolo per determinare il risultato di una partita (potrebbe essere un coefficiente additivo) la media punti degli ultimi 5 risultati oppure la media punti degli ultimi 3 o 5 risultati in casa o trasferta. Sarebbe uno small sample size ma potrebbe aiutare a considerare il fattore “forma”.
Angelo: si, ma sarebbe anche molto, forse troppo, legato allo stato di forma delle avversarie ed allo stesso calendario. E’ un discorso interessante però da fare magari per il prossimo campionato, quando cercherò di monitorare la stagione dall’inizio (e cercherò di usare un “proxy” migliore per il valore delle squadre, come i gol fatti e subiti).
Inoltre secondo me hanno più peso altri fattori come infortuni, squalifiche ed eventuali impegni europei. Le prime 3 usciranno dall’Europa più o meno assieme probabilmente, quindi quest’anno non sarà un problema, ma fattori del genere secondo me possono avere un peso rilevante.
Dunque, aggiustare i dati del Parma, dicevamo.
La somma della MPC (Media Punti Concessi) in trasferta delle 14 squadre affrontate sinora dal Parma in casa è 24,35; il Parma ha realizzato 19 punti, per una percentuale di efficienza del 78,03%. La somma della MPC casalinga delle 12 squadre affrontate in trasferta è 13,23 (Parma: 8, efficienza 60,47%). Sommando le MPC delle partite rimanenti ed aggiustandole per le percentuali di efficienza sinora ottenute, vediamo che la nuova stima ci dice che il Parma, rimanesse lo stesso visto in campo fino ad oggi, conquisterebbe circa 9,78 punti (6,11 casa, 3,67 trasferta). Come immaginavo, il dato precedente era un po’ gonfiato, questo mi pare più probabile… anche se alla fine resta una vittoria di differenza. Ciao
Si, ovviamente il problema è che l’assegnazione dei punti non sia simmetrica. Ha importanza relativa se uno pareggia 3 volte oppure vince una volta e perde 2 volte. Sempre 3 punti realizza… mentre con questo metodo verrebbe penalizzato molto (efficienza del 100% contro il 50%). La logica dietro il ragionamento è chiara, solo che temo che non si traduca adeguatamente in una proiezione di classifica finale.
In ogni caso nelle prossime settimane continuerò ad aggiornare la SoS e le proiezioni secondo i due metodi del blog. Vediamo cosa ne viene fuori.
Penso che tu abbia capito male, i punti concessi non sono dalla squadra campione, ma dalle avversarie. In questo sistema, metto a confronto la media punti realizzati da una squadra con la media punti concessi DALLE SUE AVVERSARIE.
Se le squadre B,C,D in casa concedono tutte in media 1 punto a partita, e la squadra A vi pareggia 3 volte, l’efficienza è ovviamente del 100%, ma idem in caso di 1 vittoria e 2 sconfitte, sarebbero 3 punti segnati in 3 partite comunque. Se per ipotesi ne vincesse 2 e pareggiasse 1 su quei campi, l’efficienza andrebbe al 233% (a questo punto credo sia meglio parlare di efficienza come rendimento di una ipotetica squadra “media”, forse per questo ti ha imbrogliato), escluse ovvie modifiche di quelle medie a seconda della grandezza del campione (con ogni risultato la media ovviamente cambia). La controprova di ciò è che a fine stagione la media punti fatti e la media punti concessi di tutte le squadre di serie A si equivalgono. Spero di aver chiarito il funzionamento, questo metodo mi ha dato delle grosse soddisfazioni… con un torneo di cricket amatoriale
Ciao
Si, effettivamente più chiaro in questo modo. Ma per come è organizzata adesso la spreadsheet è piuttosto impraticabile. Magari dall’anno prossimo potrei adottarlo come metodo, usandolo dall’inizio.