I linear weights, o pesi lineari, sono i valori in termini di punti segnati di ciascun evento offensivo, come valide, basi su ball, o out. Uno dei difetti di OBP e SLG è la mancata distinzione degli eventi. Ad esempio: un triplo viene valutato alla stregua di 3 singoli per la SLG. Ma è veramente così? In realtà no, ma abbiamo bisogno di qualcosa di ben diverso rispetto ad OBP, SLG, OPS ed OPS+ per saperlo. Facciamo un esempio:

Due compagni nella stessa stagione battono come segue:

  • A: 10 singoli, 10 HR, 5 basi su ball, 25 out.
  • B: 25 doppi, 25 out.

Bene, hanno OBP e SLG identiche, quindi anche l’OPS+ sarà uguale fra loro, ma è giusto supporre che il loro contributo sia stato analogo, quando è arrivato in maniera così differente? Ovviamente no, ma come comprendere la relazione fra i diversi tipi di evento ed attribuire i giusti pesi?

Introduciamo il concetto di Run Expectancy (aspettativa di segnature, se vogliamo), che si basa su questa domanda: nello stato in cui ci troviamo, quanti punti possiamo aspettarci che vengano segnati in una situazione media? A questa domanda possiamo trovare una risposta analizzando tutti gli inning della stagione presa in considerazione. Ogni anno ci sono 2430 partite di Regular Season (nel 2011 “solo” 2429 a causa di un rainout, ma il discorso è comunque valido), che portano a circa 42-43mila inning offensivi (17 o 18 in una singola partita di 9 inning a seconda di chi vinca – di più in caso di extra-innings), sufficienti ad un’analisi approfondita.

Possiamo ad esempio sapere che in media, con 0 out e nessuno in base, nel 2011 le squadre MLB abbiano segnato 0.48 punti. Con un uomo in seconda e 0 out hanno segnato 1.0618 punti. Quindi sappiamo per esempio che un leadoff double valga 0.5818 punti in realtà (ossia la variazione nella run expectancy). Allo stesso tempo con 2 out e basi cariche, si segnano in media 0.693 punti, quindi se qualcuno pulisse le basi con un doppio, poi ci si ritroverebbe con 2 out e uomo in seconda (aspettativa di 0.314 punti) ma 3 punti dentro, ed il doppio avrebbe un valore di 3+0.314-0.693, ovvero 2.621 punti. Ha senso attribuire al doppio un valore inferiore ai 3 punti entrati, perché molto del valore della giocata viene dai giocatori che si sono messi in base in precedenza. Al contrario un fuoricampo non ha mai un valore inferiore ad 1, perché porta a casa sempre almeno un uomo.

I linear weights quindi vengono calcolati in base alla media di tutti gli eventi in tutte le situazioni: esistono 24 possibili combinazioni di uomini in base ed out (8 combinazioni di uomini in base, per 0 out, 1 out e 2 out, per un totale di 24). Tendenzialmente i pesi cambiano a seconda della stagione e del campo di appartenenza, ma in media tendono ad essere come segue (alcuni esempi):

  • 1B: 0.45
  • 2B: 0.75
  • 3B: 1.05
  • HR: 1.40
  • BB: 0.35

In questa maniera possiamo distinguere anche fra giocatori con OBP e SLG identiche ma stili molto diversi. Una domanda legittima da fare è: perché considerare i pesi medi, e non quelli esatti? Ovvero: perché considerare il valore medio di un doppio, e non di volta in volta il peso del doppio specifico (se è stato battuto a basi vuote o piene, con 0 out o 2 out)? La ragione è semplice: le cifre offensive dei giocatori tendono a normalizzarsi nel medio e nel lungo termine, ed andare al piatto con le basi cariche o vuote è indipendente dalle abilità di un giocatore. Può dipendere dalla sua posizione nel lineup, dall’abilità dei compagni o semplicemente dal caso. Ma se noi vogliamo valutare l’abilità di un singolo giocatore (magari perché vogliamo acquisirlo) dobbiamo scindere ciò che è nel suo potere da ciò che è nelle mani dei compagni, del manager o appunto del semplice caso.

Il campione statistico dei turni di battuta in determinate situazioni, nel breve termine, è molto ridotto. Questo porta a risultati sfalsati. Un anno un giocatore può battere come un pazzo con uomini in base, un anno il contrario, ma questo di solito è semplicemente figlio di quello che viene chiamato “small sample size”. Una proiezione migliore delle abilità di un giocatore prescinde da questi fattori, che devono essere presi in considerazione solo se anche nel lungo termine queste abilità del suddetto giocatore persistessero. Detto questo, Fangraphs nelle sue pagine sui giocatori fornisce entrambe le cose: wRAA (weighted Runs Above Average) basato sui valori medi degli eventi in MLB, e RE24 (Run Expectancy on the 24 base/out states) basato sui valori effettivi prodotti nei 24 diversi stati. Entrambi i valori sono calcolati in base alla media offensiva in MLB, quindi si possono anche avere valori negativi (se si è offensivamente sotto media).

Il valore di RE24 si allinea alla perfezione coi punti segnati dalle squadre. wRAA invece, usando i valori medi, non si allinea per forza, ma è più predittivo delle abilità vere di un giocatore nella maggioranza dei casi. Entrambi i valori alla fine devono essere adeguati al campo attraverso i park factors.

In questa maniera, attribuendo i pesi calcolati stagionalmente (e calcolando anche i Park Factors, appunto) possiamo stabilire con estrema efficacia il valore di ciascun evento. I valori vengono chiamati “run values” e possiamo stabilire ogni evento, incluse le basi rubate o persino un ball ed uno strike in un determinato momento. Qui ci sono le run values del 2006, ma a seconda di quanto si segni (quest’anno molto meno del 2006) le run values si alzano e si abbassano. E qui c’è la Run Expectancy di ogni stagione (potete scegliere l’annata dal menu a tendina) da cui è possibile risalire alle run values. Vi suggerisco anche di leggere questo pezzo, di circa 10 anni fa (e che, per semplicità, non distingue il numero di out, ma presente direttamente le medie) se siete interessati all’aspetto matematico.

C’è anche la wRC (weighted Runs Created), che è semplicemente la wRAA, ma rispetto al Replacement Level invece della media MLB.