Questo post serve solo a descrivere come funzionino i diversi metodi valutativi per quanto riguarda la difesa, giusto perché sappiate a cosa ci si riferisca in generale, quando si cita un sistema o l’altro.

I sistemi in genere sono personalizzati, quindi i dettagli sono talvolta tenuti nascosti, ma solitamente viene spiegato (dagli ideatori) il meccanismo base che serve a farli funzionare. Qui trovate una descrizione delle varie statistiche. Se volete sapere perché sia meglio usare le statistiche avanzate, leggete qui.

Statistiche antiche

Anni fa le valutazioni venivano fatte semplicemente guardando gli errori e ricordandosi di qualche giocata spettacolare, ma adesso fortunatamente abbiamo a nostra disposizione strumenti molto più efficaci per misurare la bravura di un difensore. La Fielding Percentage naturalmente non è una buona misura perché ci dice quanti errori un difensore compia, ma non quante palle riesca a raggiungere e quante eliminazioni riesca a fare. Alla fine un errore cosa può cambiare se nell’arco della stagione un giocatore effettua 10 o 20 eliminazioni difensive più di un altro? Il primo a capire questo è stato Bill James, che di conseguenza ha inventato il Range Factor, usando il numero di out ed assistenze per determinare quante eliminazioni faccia un giocatore rispetto alla media del suo ruolo. Naturalmente il Range Factor soffre a sua volta di un difetto fondamentale perché dipende strettamente da quante palle vengano battute in una determinata direzione.

Fielding Runs

Successivamente, con un sistema molto simile, Clay Davenport ha creato le Fielding Runs (a volte chiamate DFT, Davenport Fielding Translations), ossia un sistema a sua volta basato sul numero degli out a cui un difensore partecipa, per poi convertire i dati in Runs. In poche parole, si determina quanti punti contribuisca a risparmiare difensivamente il giocatore, rispetto agli altri del suo ruolo. Su Baseball Prospectus sulla scheda di ogni giocatore è possibile trovare i dati FRAR (Fielding Runs Above Replacement) e FRAA (Fielding Runs Above Average). Ovviamente le FRAA determinano invece quante Runs rispetto alla media del ruolo un giocatore contribuisca a risparmiare. Se il numero è negativo, chiaramente il difensore è sotto media.

Il grande vantaggio delle Fielding Runs è che sia un sistema applicabile a qualsiasi epoca, visto che abbiamo a disposizione il genere di dati su cui si basano, anche per il passato. Gli svantaggi però sono molteplici:

  • E’ una “counting stat”, dunque premia chi gioca di più, e non è direttamente e semplicemente possibile vedere chi abbia le migliori “rate stats”.
  • Considera solo le giocate effettuate. Quindi se un giocatore sta fermo, ma la palla viene sempre battuta costantemente su di lui, avrà un rating migliore di uno che magari invece fa miracoli tuffandosi a destra ed a sinistra.
  • Considerando solo le giocate effettuate, “ignora” quante giocate vengano mancate. Se un interbase gioca dietro ad un pitching staff composto interamente da groundballers, avrà molte più possibilità di produrre out rispetto ad un interbase che gioca dietro a lanciatori flyballers. Magari il secondo è più forte ed efficace, ma il primo avrà più possibilità. Per capirci: è come se invece della media battuta, si valutasse il batting champion in base al numero di valide totali, che non prendono in considerazione le apparizioni al piatto ed il lineup in cui si batte.
  • Considerando le giocate effettuate, un difensore può aumentare artificialmente le proprie Fielding Runs magari andando a prendere tutti i popups sugli interni. Palle che chiunque potrebbe prendere e che dunque non dovrebbero avere un’importanza pari alle groundballs.

Ma come detto, i meriti non sono indifferenti. Permette di paragonare giocatori di diverse epoche e questo non è male, inoltre non dipende da un’eventuale cattiva qualità dell’input (ossia dei dati immessi). Negli anni sono stati però sviluppati dei sistemi molto più efficaci, che si basano su dati effettivi e su specifiche palle messe in gioco.

In realtà nel 2010 Baseball Prospectus ha iniziato a pubblicare una nuova versione, sempre col nome di FRAA, che in comune col vecchio sistema ha il fatto di utilizzare solo dati oggettivi, anche se, lavorando con relativamente pochi dati, come ammesso dal suo creatore Colin Wyers, è affidabile solo nel lungo o lunghissimo termine. Per sapere come funzioni il metodo, leggete qui.

Zone Rating

Questo è il metodo che per primo ha messo in gioco il concetto di “eliminazioni in base alle opportunità avute”. E’ giusto che un giocatore che non ha opportunità difensive venga penalizzato? Nelle Fielding Runs questo avviene, nello ZR no. Ma come funziona nel dettaglio?

Il campo viene diviso in una griglia. Per ogni settore di campo, viene valutata la percentuale di eliminazioni effettuata da un determinato difensore. Vengono inclusi nell’analisi tutti i settori in cui viene fatto almeno il 51% di eliminazioni da un determinato ruolo difensivo. Ad esempio, è stato sperimentalmente determinato che tutti i giocatori di prima base riescano a fare almeno il 51% di out nelle zone V, W ed X della griglia. Conseguentemente, tutte le groundballs battute in quelle zone vengono valutate nel giudizio dei prima base. Una groundball battuta nel settore U invece non viene contata come facente parte delle responsabilità del prima base, ad esempio. A questo punto, basta dividere le “giocate” (out o assist) fatte per le palle battute in quella zona, e si ha lo ZR del difensore per la sua zona di responsabilità. Se un giocatore vede 50 palle battute nella sua zona di responsabilità, e fa 40 eliminazioni, allora il suo ZR è 40/50, ossia .800. Per conoscere le zone di responsabilità di ciascun difensore, potete leggere questo articolo.

Bene, allora tutto risolto? Per niente. Il punto è che a volte un difensore va anche fuori dalla sua zona per effettuare una giocata, e lo ZR non gestisce bene queste situazioni. Se un prima base si spinge nel settore U a fare un out, gli verrà data un’eliminazione in più, sia nel numeratore che nel denominatore. A prima vista non sembra creare problemi, ma consideriamo questo esempio: il difensore A vede 20 palle battute nella propria direzione e fa 15 eliminazioni nella propria zona di responsabilità, ma non fa alcun out al di fuori di essa. Il difensore B invece su 20 palle nella propria zona di responsabilità fa 13 eliminazioni, ma riesce anche ad andare a prendere 5 palle fuori zona, sulle quali A non arriva. Il difensore A avrà .750 ZR (15/20), mentre B avrà .720 (18/25). B è riuscito a fare più eliminazioni utili ed è evidentemente il difensore migliore, ma lo ZR premia maggiormente A, ossia il difensore con meno range (copertura del territorio) e più sicurezza nella propria zona. Il difensore migliore invece è quello che riesce a completare più eliminazioni, ma da questa valutazione non traspare.

UZR

L’Ultimate Zone Rating è stato creato da MGL (Mitchel Lichtman), che per il suo lavoro anni fa è stato anche assunto dai St. Louis Cardinals. MGL usa i dati di STATS Inc. e Baseball Info Solutions (BIS) (a seconda del sito che cita i suoi dati), società che registrano tutto quello che accade sul campo da gioco: direzione delle palle battute, forza, tipo di palla, ecc. Il sistema stima quanti out dovrebbe effettuare un difensore ad una data posizione sulla base del tipo di palle battute che affronta. Prende in considerazione:

  • Il campo in cui gioca
  • La forza con cui viene colpita la palla
  • Il tipo di palla battuta (linea, popup, flyball, groundball, ecc)
  • La mano di lancio del lanciatore ed il lato in cui batte il battitore (mancino contro destro, destro contro destro, ecc)
  • Il tipo di lanciatore (groundballer, flyballer, ecc)
  • Configurazione difensiva (quanti out, quanti corridori sulle basi, ecc)

Lichtman ha calcolato questi dati per anni, e per anni il suo metodo è stato il migliore per valutare la difesa di un giocatore. In base a tutti quei dati, MGL stima il numero di eliminazioni che un giocatore avrebbe dovuto effettuare, e poi converte in Runs la differenza rispetto alla media del suo ruolo. Purtroppo l’impossibilità di verificare in dettaglio i suoi metodi (non ha mai mostrato i lavori matematici in dettaglio) può creare qualche incomprensione. Detto questo, l’ottima notizia è che Fangraphs mostri i dati UZR per ogni difensore dal 2002 ad oggi, usando come input i dati di BIS. Se volete i dati dell’UZR dal 2000 al 2003 potete trovarli qui (dati presi con STATS, però, quindi con input diversi). Dei lati negativi ci sono ugualmente:

  • Non viene valutato il braccio di tiro degli esterni
  • Non vengono valutati i ricevitori
  • Gli adeguamenti sul tipo di palla battuta possono avvantaggiare un difensore rispetto ad un altro se usa sempre la media per valutarli. Un giocatore abituato a difendere contro le linee verrà premiato se ne prende più della media, forse (e dico forse, perché la matematica non ci è concesso vederla) più di una groundball o flyball mancata. Questo non è necessariamente giusto, ma magari è semplicemente una differenza nello skillset.
  • La valutazione su “quanto bene sia stata colpita una palla” è effettuata da una persona, quindi in maniera assolutamente soggettiva. L’apporto umano, per quanto per certi versi integri la valutazione, può anche corromperla un po’ ed a seconda degli input (Stats o BIS) cambia anche la valutazione dei giocatori.
Fangraphs implementa una versione evoluta e recentemente migliorata dell’UZR. Se volete leggere tutti i dettagli, leggete qui.

PMR

Il Probabilistic Method of Range è stato inventato da David Pinto, ed i dati vengono pubblicati annualmente su Baseball Musings. Anche qui il sistema funziona in base alla probabilità che un out venga fatto. La differenza sostanziale è che mentre l’UZR si incentra sui difensori (e chiede: quante probabilità ha X di prendere la palla battuta e trasformarla in out?), il PMR si incentra sulla palla battuta (e chiede: quante probabilità ha ciascun difensore di trasformarla in out? Dando 0% ai difensori dall’altra parte del campo, ed una probabilità sempre crescente a quelli verso cui la palla viene battuta). Alla fine il concetto di base è lo stesso, e si basa su probabilità e possibilità. Per il resto prende in considerazione gli stessi effetti (campo di appartenenza, tipo di lanciatore, ecc) dell’UZR, ma il diverso approccio permette cose belle (valuta la difesa dei ricevitori, anche se lo fa in maniera molto discutibile) e crea cose brutte. Il difetto principale del PMR, infatti, è che ha bisogno di un sample size enorme, per poter creare un database di tutti i tipi di palle battute, e determinare probabilità accurate. Ma così facendo, prende in considerazione diversi anni (gli ultimi 4). Ma in 4 anni un difensore migliora, un altro peggiora, magari cambiano anche i materiali. Il fatto che le probabilità possano essere legate all’abilità di alcuni giocatori in campi diversi in “epoche” diverse della loro carriera, tende a creare qualche problema. D’altronde il PMR spesso fra gli esterni e ricevitori produce dei dati piuttosto “discutibili”.

Una delle cose più belle è che il PMR possa poi però produrre dei grafici specifici per ogni giocatore, determinando in cosa sia più bravo un difensore rispetto ad un altro. Ad esempio prendete questo grafico (il primo) di Chase Utley. Il grafico ha una linea verde. Quella indica, visivamente (infatti in basso ci sono le indicazioni di left-center field, 2B, right-center field), dove e come il 2B medio effettui le eliminazioni sulle groundballs. La linea rossa mostra invece l’abilità di Utley in ogni singolo punto. Possiamo vedere che sia nettamente sopra media, e decisamente spettacolare, quando deve andare verso la prima base. Sulla seconda base  un capello sotto media (la differenza è mostrata dalla linea blu tratteggiata, quando è sopra lo zero, Utley è sopra media), mentre per il resto è semplicemente un mostro. Questo ci consente di visualizzare graficamente in cosa sia più bravo (o meno bravo) Utley, invece di limitarci a dire “è un grande difensore” come affermazione generale. Ora sappiamo perché lo sia e dove lo sia. Graficamente possiamo vedere anche la sua abilità sugli altri tipi di palle battute.

TotalZone

Il metodo è stato inventato da Sean “Chone” Smith, e viene ora mostrato su Baseball-Reference. Smith ha calcolato per ogni campo di appartenenza e per ogni tipo di palla battuta (a seconda del tipo di lanciatore e di battitore) in media a chi appartengano le responsabilità delle valide. Ad esempio, una valida su una groundball verso l’esterno sinistro viene attribuita difensivamente in parte all’interbase ed in parte al terza base, con delle medie calcolate sperimentalmente. In generale il risultato è molto efficace, anche se ovviamente con questo sistema spesso un terza base (o un interbase) verrà penalizzato per una palla su cui non ha colpe. Analogamente, a volte verrà “salvato” parzialmente per una palla su cui ha tutte le colpe. In media, e nel lungo termine, è un calcolo che ha senso. E’ il metodo migliore che abbiamo per valutare la difesa “storica” per ogni epoca, anche se naturalmente a seconda delle epoche e con più dati a disposizione Smith ha avuto la possibilità di rifinire e migliorare il suo sistema.

Qui potete leggere altro sul metodo usato da Baseball Reference e di come vari a seconda delle epoche e dei dati a disposizione. Baseball Reference utilizza TotalZone anche per alcune stagioni di minor league.

Questi due sono i link alla creazione del metodo del TotalZone, che successivamente è stato migliorato fino all’inclusione su Baseball Reference, dove il metodo è completo ed aggiornato.

Negli ultimissimi tempi Sean Smith ha implementato una versione (con sigla TZL) che utilizza anche la location delle palle battute del Gameday. La statistica viene pubblicata su Fangraphs.

Plus/Minus e DRS

John Dewan ha pubblicato il suo metodo all’interno del libro “The Fielding Bible”. Ancora adesso pubblica annualmente i suoi dati nelle pubblicazioni di Bill James (ed i leader di quest’anno sono stati pubblicati sul sito di James stesso).

Anche qui, non siamo a conoscenza del sistema in dettaglio, anche se l’infrastruttura è apparentemente piuttosto semplice: prende in considerazione la zona di responsabilità di ciascun difensore, e da’ un “+” al difensore se effettua una giocata fuori zona, ed un “-” se non ne effettua una all’interno della sua zona. Alla fine paragona tutto alla media del ruolo e produce i suoi rankings. Fa analisi separate a seconda del tipo di palla battuta, ma di pubblico oltre a questo ci sono solo i dati. La semplicità del concetto comunque è lodevole, e spesso la correlazione è elevata col mio sistema (che funziona secondo lo stesso concetto base effettivamente).

Col tempo il sistema si è evoluto nel dare pesi specifici a ciascuna giocata, invece di +1 o -1, a seconda della probabilità di ottenere un out sulla giocata (come PMR ed UZR). Viene valutata anche la difesa dei ricevitori in base a WP, PB, SB e CS (le ultime 2 voci vengono calcolate sotto l’intestazione rSB di Fangraphs, ossia le Runs in più o in meno che un ricevitore concede rispetto alla media col suo saldo SB/CS). Nello specifico Fangraphs adesso pubblica i risultati dell’intero sistema DRS.

Su Fangraphs pubblicano le valutazioni sotto l’intestazione DRS (Defensive Runs Saved). Qui potete leggere di più.

FSR

Il Fans’ Scouting Report è il metodo meno scientifico ma forse più intrigante di misurare il valore di un difensore. Tom Tango annualmente chiede ai tifosi delle varie squadre di valutare le tools dei giocatori delle loro squadre. I valori raccolti vengono convertiti in runs rispetto alla media del ruolo e vengono poi pubblicati su Fangraphs. Si tratta di metodi volutamente non scientifici (infatti Tango chiede esplicitamente di fidarsi solo dei propri occhi senza consultare altre metriche difensive), ma forniscono le valutazioni dei tifosi sotto forma di scouting report.

Il mio metodo

Per qualche anno ho avuto un metodo tutto mio, usando i dati che forniva The Hardball Times (che poi ha smesso di pubblicare i dati, fondendosi con Fangraphs), anche se ho smesso di calcolarlo e pubblicarlo perché fondamentalmente i risultati non differivano molto da DRS ed UZR.

Il RZR è come lo ZR, ma prende in considerazione solo le palle in zona, eliminando l’anomalia delle palle fuori zona che ho descritto in precedenza. Le palle fuori zona sono considerate separatamente.

Il mio sistema analizzava quante palle vengano battute verso il difensore, rispetto alla media del suo ruolo. Se ha più palle, allora gli out fuori zona vengono normalizzati verso il basso, perché appare chiaro che il maggior numero di out sia anche frutto del fatto che abbia più palle da difendere. L’inverso ragionamento viene applicato a chi ha meno giocate da effettuare. Il sistema poi sviluppa sia una “rate stat” che una “counting stat”. La prima calcola in un ambiente asettico quante Runs avrebbe risparmiato il giocatore rispetto al difensore medio della sua posizione. Cosa intendo per ambiente asettico? A parità di opportunità difensive, a parità di partite giocate (150), e solo in base alla differenza di abilità. La “counting stat” invece riprende in considerazione non solo l’abilità del difensore, ma anche il contesto, ossia valutando quante partite abbia giocato in stagione, quante opportunità abbia avuto e via dicendo. Il giusto difensore nel giusto contesto, riesce ad avere dei numeri “gonfiati”, che non rappresentano necessariamente la sua abilità, ma che esaltano alcuni aspetti del suo gioco. E’ importante considerare entrambe le cose: il talento del giocatore (mostrato dalla rate stat) ed il suo effettivo contributo sul campo alla sua squadra (mostrato dalla counting stat).

Il vantaggio del mio sistema è che riesca a valutare i ricevitori secondo parametri oggettivi e che includa anche le braccia degli esterni. Il grande svantaggio è che non prenda in considerazione gli effetti del campo di appartenenza, ma è un problema più che altro per gli esterni.