Io parlo spesso di “small sample size” o campione statistico ridotto per analizzare i giocatori. E’ importante rendersi conto di come per esempio in 1 PA qualsiasi cosa possa accadere. Duane Kuiper ha battuto 1 HR in 3754 in carriera, ma se voi foste stati allo stadio il 29 agosto del 1977, non avreste potuto immaginare di aver visto un evento unico. DiMaggio subiva pochi K (solo 13 nel 1941!), ma è andato 0/4 con 3 K il 19 giugno del 1942. Naturalmente in questi casi parliamo di campione statistico quasi infinitesimale, ma la domanda è: dopo quante PA una determinata abilità inizia a mostrarsi con una certa affidabilità?

Questa domanda è stata analizzata da Russell Carleton, che attraverso una rigorosa analisi matematica, di cui potete leggere i dettagli, ha determinato i livelli di affidabilità di ogni statistica base per i position players. Ha definito come stabile una statistica una volta che ha raggiunto 0.70 come correlazione fra le apparizioni al piatto pari e quelle dispari. Per intenderci: se un’abilità è consolidata, allora dovrebbe mostrarsi in momenti assolutamente casuali. Le apparizioni al piatto pari e quelle dispari non hanno una differenza sistemica (come per esempio quelle nelle partite diurne e serali, o quelle contro i lanciatori destri e mancini) e quindi con l’aumento del campione statistico, la correlazione fra le pari e dispari aumenterà per le abilità reali di un giocatore.

Una correlazione di 0.70 vuol dire che il 70% di ciò che vedete sia vera abilità mostrata in stagione ed il 30% sia “rumore” o frutto di casualità (magari park factors particolari, magari una sproporzione di avversari forti in quel periodo, ecc).

Facciamo un esempio: dopo meno di 50 PA, la swing% è già consolidata. La swing% è la percentuale di lanci che un battitore gira. In poche parole, dopo solo 50 PA (o qualcosina meno) già potete farvi un’idea della selettività di un battitore. Gli esiti ancora non si vedranno, ma l’approccio sarà chiaro relativamente in fretta. Analogamente, ecco dopo quanto si stabilizzino altre statistiche comuni:

  • Contact% (ossia la percentuale di giri di mazza che risulta in un tipo di contatto, ossia non a vuoto): 100 PA
  • K%, LD%: 150 PA
  • BB%, GB%: 200 PA
  • FB%: 250 PA
  • HR/FB: 300 PA
  • OBP, SLG, OPS, IFFB%: 500 PA
  • ISO: 550 PA

Per altri indici, fate affidamento al link fornito. Mentre BA e BABIP non si stabilizzano mai in una singola stagione, per incredibile che sembri, proprio perché i battitori hanno un controllo molto relativo su di loro. Come dice lo studio linkato in alto, dopo 650 PA (fondamentalmente una stagione completa) la BA e la BABIP hanno una correlazione solo di .586 fra le PA pari e dispari, quindi l’abilità mostrata è di poco superiore alla casualità (59% contro 41%): si tratta di abilità che si vedono solo nel lungo termine, talmente lungo che serve più di una singola stagione.

Lo studio si può fare anche al contrario, ossia si può analizzare dopo X PA (Carleton ha usato 300 e 600 PA) che correlazione raggiungano le varie statistiche. Vediamo dopo 300 PA:

  • BA: .328
  • OBP: .596
  • SLG: .634
  • OPS: .624
  • ISO: .636
  • BABIP: .240
  • HR/FB: .752

Questo vuol dire che dopo 300 PA la BA mostrata è composta per un terzo da vera abilità e per due terzi da puro caso. Per la BABIP addirittura si parla di 24% abilità e 76% caso. Altre statistiche sono più affidabili, come si vede. Ed a 600 PA?

  • BA: .586
  • OBP: .779
  • SLG: .762
  • OPS: .773
  • ISO: .740
  • BABIP: .586
  • HR/FB: .879

Come si nota, l’affidabilità delle statistiche cresce notevolmente col passare del tempo, anche se è importante capirne le limitazioni e rendersi conto del significato del campione statistico limitato e di che parte invece mostri la vera abilità di un giocatore. Quando analizzate un giocatore, rendetevi conto del significato di ciò che vedete. Come se non bastasse, ricordatevi anche che l’abilità mostrata nel breve termine, per quanto realmente prodotta da un singolo giocatore, sia soggetta a variazione di stagione in stagione. Naturalmente le porzioni non dovute alla pura abilità varieranno con molta più facilità, non essendo controllabili dal giocatore.