WAR sta per Wins Above Replacement, ossia le vittorie a cui contribuisce un giocatore rispetto ad un collega del calibro del Replacement Level. Esistono diverse implementazioni di questo sistema, pubblicate principalmente da Fangraphs, Baseball Reference e Baseball Prospectus. Prima di entrare nelle spiegazioni specifiche, è importante chiarire un concetto fondamentale: le implementazioni possono variare, ma l’infrastruttura è unica e fornisce un modo elegante per esprimere il valore di un giocatore per la propria squadra. Qui parleremo dei pitchers.

L’infrastruttura è chiara e semplice: il valore di un pitcher deriva dai suoi contributi in termine di prevenzione dei punti segnati, e da quanto giochi. Con questa infrastruttura, chiunque può effettuare la sua valutazione. Prima di parlare delle più comuni implementazioni, l’importante è spiegare in parole semplici cosa siano le Wins Above Replacement: sono le vittorie in più (o in meno) a cui un giocatore contribuisce rispetto ad un suo collega minor league free agent. Il numero viene calcolato esprimendo in Runs i suoi contributi sul monte ed il playing time, ossia quanto giochi, ovvero la quantità. Le Runs vengono convertite in Wins. Fondamentalmente possiamo dire che un giocatore da 4 WAR, se rimpiazzasse in tutto e per tutto un collega da 2 WAR, porterebbe la propria squadra a vincere 2 partite in più a fine anno. Naturalmente i calcoli non sono precisi al decimale, quindi è inutile discorrere delle differenze fra un giocatore da 4.5 ed uno da 4.3, ma l’accuratezza è molto soddisfacente, tanto che la correlazione fra WAR e vittorie reali in classifica ogni anno è attorno a 0.90 o più (ad 1.00 sarebbe perfetta), ossia incredibilmente elevata, per quanto le diverse implementazioni a volte “litighino” fra loro nell’esprimere i valori dei giocatori, specialmente a causa del sistema difensivo scelto di volta in volta.

Ma parliamo adesso delle singole implementazioni:

Fangraphs per separare le responsabilità di lanciatori e difesa usa la FIP. Si parte considerando che un lanciatore medio, con difesa e run support medi, sia un lanciatore da .500. Sperimentalmente hanno determinato che un lanciatore di replacement level avrebbe una FIP del 31.6% peggiore della media se partente, e del 6.4% se rilievo, rendendoli rispettivamente lanciatori da .380 e .470 di record, con difesa e run support medi. A quel punto bisogna paragonare come questo lanciatore influenzi le segnature in una singola partita, paragonando le segnature di un incontro medio alle segnature delle partite in cui lancia lui, considerando anche gli inning totali da lui lanciati. A quel punto, conoscendo il run environment ed il numero di IP a partita che lancia, sappiamo quante runs salvi alla propria squadra in ciascun incontro, poi convertiamo quelle runs in wins ed abbiamo la sua “vera” winning% (sempre con difesa e run support medi). Sottraiamo la win% del replacement level (a seconda del ruolo, partente o rilievo) da quella del giocatore analizzato, moltiplichiamo per gli IP lanciati, ed abbiamo il risultato. Vi sembra complesso? Beh, non posso negarlo. Qui avete un esempio illustrato col calcolo del WAR di Felix Hernandez con la sua prestazione del 2008, che procedo a tradurre:

Nel 2008 Felix Hernandez ha avuto 200.2 IP con 3.80 FIP. Moltiplicando la FIP per 0.92 per metterla in scala con la RA e normalizzando la sua prestazione secondo il park factor di Safeco Field, otteniamo una FIP neutra di 4.28, contro la FIP media dell’AL di 4.78. Per vedere quale sia il run environment delle partite di Felix si usa una formuletta precompilata: sappiamo che lui lanci 6.5 IP in media a partita, e che normalmente ci siano 18 IP a partita (mezzo inning può non servire, ma solo se la squadra di casa sta vincendo), quindi (((11.5*4.78+6.5*4.28)/18)+2)*1.5 = 9.90. Questo 9.90 è il suo run environment, e ci dice che ogni 9.90 Runs prevenute da Felix Hernandez, lui abbia guadagnato 1 Win per la sua squadra. Abbiamo visto che la sua FIP sia di 0.50 migliore di quella media, quindi 0.50/9.90 = 0.050, che sono le W da aggiungere alla media. Questo fa di Felix un lanciatore da .550 di record (con difesa e run support medi), ossia 0.17 più forte del replacement level (che come detto è da .380) ogni 9 IP. Ma lui ha lanciato 200 IP e 2/3 in stagione, quindi 0.17*200.67/9 = 3.8 WAR. Spero di essere stato chiaro, o spero che lo sia il link messo sopra. Non nego che sia complesso. Se volete una scorciatoia invece vi propongo questo metodo, che porterà a risultati un po’ meno accurati ma comunque piuttosto simili, e può essere usato sia con l’ERA che con la FIP o altre misure. Per i rilievi si segue lo stesso metodo, ma si moltiplica il suo risultato per il Leverage Index, perché a parità di tutto è naturale che un rilievo usato in momenti più delicati finisca per avere un impatto maggiore di uno usato sul 10-0 o sullo 0-10.

In fondo a questo link potete trovare una serie di pezzi (7 per la precisione) su come le WAR di Fangraphs siano calcolate, in dettaglio. Buona lettura. Ricordo che il sistema WAR di Fangraphs sia spesso definito fWAR.

Baseball Reference usa un sistema diverso. Invece di usare la FIP per escludere la difesa, prendono direttamente il numero di punti concessi dal lanciatore e poi usano il TotalZone di squadra per escludere (o sommare) i contributi difensivi. Calcolano il numero di Runs che un Replacement pitcher concederebbe nelle stesse condizioni, e le condizioni includono appunto la difesa, gli IP totali lanciati, il campo e la lega di appartenenza ed il ruolo (partente o rilievo). Poi calcolano la differenza fra le Runs del lanciatore in questione e le Runs del replacement, e convertono in Wins direttamente. E’ un metodo molto più semplice e che io preferisco nettamente, perché prende in considerazione l’esatto contributo della difesa (mentre la FIP la normalizza per tutti, semplificando troppo il concesso) ed usa dunque le Runs effettive. Questo è il link al sistema WAR di BBRef per Roy Halladay. R sono le Runs concesse effettivamente da lui, Rrep sono le Runs che verrebbero concesse in quelle condizioni da un Replacement Level pitcher, Rdef sono le Runs difensive a cui ha contribuito la squadra (Rrep contiene già anche questa voce, al suo interno), aLI è il Leverage Index medio delle partite del pitcher (per i partenti è quasi sempre vicinissimo ad 1, ma cambia per i rilievi). RAR è Rrep-R, quindi le RAR (Runs Above Average) vengono convertite in WAR, considerando anche il Leverage Index (più alto è, più valore hanno le RAR). Baseball Reference usa un Replacement Level lievemente superiore a Fangraphs, quindi “bastano” meno RAR per avere 1 WAR (per Fangraphs siamo quasi a 10, per Baseball Reference siamo poco sopra 9, con un LI di 1).

Penso che sia stato più facile da comprendere rispetto a Fangraphs, ma qui c’è un’ulteriore spiegazione delle intestazioni usate. In ogni caso passando sulle intestazioni stesse col puntatore del mouse, apparirà una piccola spiegazione della sigla.

Fondamentalmente, al di là del meccanismo specifico, è importante capire su cosa si basino le due infrastrutture diverse: Fangraphs punta sulla FIP, quindi sulle peripherals, mentre Baseball Reference usa le Runs effettive. Per descrivere ciò che è accaduto, io preferisco nettamente Baseball Reference, perché fortuna o sfortuna con la BABIP e con la LOB%, quelle Runs ormai ci sono state. Per proiettare il valore futuro di un giocatore però tende a funzionare meglio Fangraphs proprio perché lavora con la FIP che ha maggior valore predittivo rispetto ad ERA o RA.

C’è anche la misura di Baseball Prospectus, ossia il WARP (la “p” sta per “player”, ma il concetto è identico agli altri). Da loro tutto si basa sul calcolo della FRA, o Fair RA, ossia la RA che un pitcher concederebbe normalizzando i linear weights di ogni evento secondo l’influsso della difesa (misurata attraverso la FRAA) e convertendo poi quelle Runs in WARP in base ai suoi inning lanciati, sempre convertendo circa 10 Runs in 1 WAR. Per leggere una discussione approfondita e dettagliata della FRA (e comprendere conseguentemente il WARP), potete cliccare qui.

Sono 3 metodi diversi, ognuno valido a modo suo, ognuno con pregi e difetti. Uno esclude completamente BABIP e LOB%, uno considera le Runs, includendo quindi eventuale sfortuna, uno invece usa i linear weights degli eventi. Hanno tutti qualche merito ed a seconda di ciò in cui si crede o si vuole indagare, è giusto soppesarli e considerarli tutti e 3. Come detto, io preferisco Baseball Reference in senso generale.