IL PUNTO DELLA SITUAZIONE

Se è vero che l’annosa questione sulla nascita di uovo e gallina può essere senza dubbio risolta a favore del primo (molto prima dei polli esistevano specie che ne deponevano), ben più arduo ed intricato si presenta il compito a chi deve stabilire se sia nato prima il baseball o le rilevazioni statistiche che immancabilmente lo accompagnano.

Già sui giornali del 1844 e '45 compaiono infatti tabellini, non troppo diversi dagli attuali box-scores, che si riferiscono al baseball o a giochi che in qualche modo ne sono stati precursori; quando poi il baseball ha assunto la forma che è rimasta pressoché invariata fino ad oggi, le rilevazioni sono state condotte con crescente regolarità e ricchezza di informazioni.

Dati quali la media battuta e le vittorie dei lanciatori sono esistiti più o meno da quando il gioco ha visto la luce, mentre indicatori più sofisticati vi si sono progressivamente affiancati.

 

Allan Roth, sin dagli anni ’40, raccoglieva, per conto del grande GM Branch Rickey, una quantità di numeri, che poi rielaborava dando vita alle statistiche che oggi conosciamo come “Situational Hitting” (le medie in particolari situazioni di gioco: conto di ball e strike, lanciatore destro o mancino, uomini in base, etc.).

Nel ’56 appariva sulla nota rivista LIFE un articolo (a firma di Rickey, ma in gran parte dovuto a Roth), in cui si tentava per la prima volta di costruire un indicatore globale per l’abilità dei giocatori. L’importanza della media battuta, che tuttora è la statistica offensiva principe, era notevolmente ridimensionata a favore della slugging percentage, e di una voce che faceva la sua prima comparsa: l’on-base percentage.

 

L’articolo (GOODBY TO SOME BASEBALL IDEAS - by Branch Rickey,   LIFE '56) diede il via ad una serie di studi, mirati a valutare l’utilità delle statistiche classiche, nonché a costruirne di nuove. L’obiettivo di molti era di trovare un modo di attribuire ai giocatori la responsabilità dei punti segnati dalla squadra, dato che ciò che conta, nel baseball come negli altri sport, è segnare più punti dell’avversario; ovviamente né i punti segnati dai singoli giocatori, né gli RBI erano considerati una misura soddisfacente (vedere considerazioni in BRING IT ON HOME).

 

I nomi principali che delinearono questo nuovo scenario furono quelli di Pete Palmer e Bill James, e i mezzi con cui puntare all’obiettivo erano metodi statistici che variavano dalla regressione lineare alla simulazione (i computers che diventavano più affidabili ed economici erano di grande aiuto).

I prodotti finali erano in genere equazioni che assegnavano, ad ogni giocata offensiva, un valore in termine di contributo ai punti segnati. Così, ad esempio, secondo i calcoli di Palmer, un singolo valeva circa 0,47 punti, un fuoricampo 1,4, un eliminazione -0,5.

 

Per comprendere il significato di questi valori, l’idea è che l’autore di un homer è l’unico responsabile del punto che egli stesso segna, e contribuisce in parte a tutti gli altri che, eventualmente, entrano nell’azione; chi fa un singolo inizia a costruire un punto che dovrà essere ultimato da un compagno, mentre chi produce un out “demolisce” parte del lavoro.

 

Secondo tali statistiche, Babe Ruth poteva essere considerato responsabile di oltre 100 dei punti segnati dagli Yankees del ’27.

 

Nel contempo, negli Stati Uniti, le scienze statistiche, disciplina relativamente giovane, trovavano terreno fertile ed erano continuamente applicate in campo economico, sociale, demografico, sanitario ed altro ancora. Il matrimonio tra baseball e statistica non poteva che diventare sempre più fecondo, vuoi per il successo delle due discipline sullo stesso territorio, vuoi perché il baseball, con 162 partite all’anno per squadra, fornisce “i grandi numeri” di cui la statistica si ciba, più di qualsiasi altro sport.

 

Così nel ’61, sulla rivista (esclusivamente dedicata alle scienze statistiche) Journal of American Statistical Association, fece la sua comparsa il vecchio gioco, nell’articolo The Progress of The Score During A Baseball Game di G.R. Lindsey. Da allora il baseball trova regolarmente spazio sulle pagine di riviste quali Chance, Operation Research, The American Statistician e Journal of American Statistical Association.

Due anni dopo lo stesso Lindsey si cimentò nella ricerca dello strumento per la valutazione offensiva, anch’egli con lo scopo di attribuire ai battitori la responsabilità dei punti segnati dalla squadra.

 

La strada da lui intrapresa (e seguita successivamente da Albert, Bennett, Skoog e Ruane) si avvaleva della disponibilità del play-by-play di tutte le partite, e faceva uso del concetto di valore atteso, che è più o meno il primo argomento trattato in ogni corso di statistica.

 

Per chi non avesse familiarità con tale idea proponiamo un esempio che non esca dal diamante. Se la media dei punti segnati in un incontro da entrambe le squadre è circa uguale a 9, ci si aspetterà un punto ogni inning (valore atteso); ovviamente nella realtà la distribuzione delle segnature nell’arco delle 9 riprese è molto dismogenea, a causa della congiuntura di numerosi fattori quali la diversa ripartizione di talento nel line-up, le mutevoli condizioni del pitcher e della situazione atmosferica, ma anche il puro e semplice caso (proprio su tutto ciò verteva sostanzialmente il primo articolo citato).

 

Vediamo invece nello specifico come è costruito lo strumento.

Per prima cosa vengono definite 24 possibili situazioni di gioco (0,1 e 2 out per gli 8 possibili stati di occupazione delle basi) e per ciascuna di esse  si calcola il valore atteso di punti alla fine dell’inning.

Più esplicitamente. Situazione numero 1, all’inizio della ripresa, ovvero basi vuote e nessun eliminato: nel 1987, quando in un inning si è verificato tale stato (in questo particolare caso, lo stato si verifica in tutti gli inning), sono stati mediamente segnati 0,49 punti alla fine della ripresa.

Per lo stato basi piene e zero out, tale valore (atteso) è stato di 2,15 punti, che significa che se la nostra squadra si trova in tale situazione, possiamo aspettarci circa 2 punti entro la fine dell’attacco.

 

La tabella sottostante è trattata da “J.H.Albert – Using Play-By-Play Baseball Data to Develop a Better Measure of Batting Performance” (l’articolo completo si trova on-line; per chi fosse interessato a leggerlo, consiglio di effettuare una ricerca con google) e riporta i valori attesi per ciascuna delle 24 situazioni.

 

    corridori sulle basi
    basi vuote 1a 2a 3a 1a, 2a 1a, 3a 2a, 3a basi piene
numerodi outs 0 0.49 0.85 1.11 1.3 1.39 1.62 1.76 2.15
1 0.27 0.51 0.68 0.94 0.86 1.11 1.32 1.39
2 0.10 0.23 0.31 0.38 0.42 0.48 0.52 0.65

Tabella 1. - Valori attesi per situazione (NL 1987)

 

Per valutare il contributo di un battitore in una particolare azione basta determinare il differenziale di valore atteso tra la situazione che egli ha trovato entrando nel box e quella che ha lasciato al termine del proprio turno, e sommare ad esso i punti entrati durante la giocata.

 

Ad esempio: un uomo in prima e un out, il battitore colpisce un singolo che spinge il compagno in seconda; il contributo è misurato in 0,86-0,51=0,35 punti (si noti come una base su ball avrebbe sortito il medesimo effetto, pertanto ha in questo caso lo stesso valore del singolo).

Un grande slam vale 0,49-2,15+4=2,34 punti per il battitore se ottenuto con nessuno eliminato e 0,10-0,65+4=3,45 con due fuori.

 

In realtà c’è un 25° stato non incluso nella tabella, che corrisponde alla terza eliminazione e alla fine dell’inning (quando non sono possibili ulteriori segnature e pertanto il valore atteso dei punti è 0): sicché un battitore che innesca un doppio gioco nella situazione “basi piene e un out” costa alla propria squadra 1,39 punti (il suo contributo verrà misurato con un numero negativo).

 

Nell’articolo di Albert è presente anche una classifica dei migliori battitori della National League per il 1987, secondo la statistica descritta: al comando vi è Darryl Strawberry (con un contributo stimato in 64 punti), seguito da Jack Clark (57), Eric Davis (50) e Dale Murphy (48,2).

 

Tornando a dare uno sguardo alla tabella sopra: il passaggio da “uomo in prima e zero out” a “uomo in seconda e un out” porta alla perdita di 0,17 punti. Tale osservazione può indurre a pensare che il bunt spesso ordinato per ottenere la transizione considerata, sia una sorta di piccolo suicidio.

In realtà ci sono altri parametri da considerare quando, anziché valutare l’impatto di un battitore, si vuole determinare l’efficacia di una scelta strategica, e questi sono (quanto meno) l’inning in corso ed il punteggio (tratteremo prossimamente altri studi in merito).

Inoltre i valori attesi sono calcolati sulle performance di una intera lega, e quindi rispecchiano valori medi; invece un allenatore, quando ordina una smorzata, ha nel box un particolare battitore di cui conosce le caratteristiche (presumibilmente) meglio di chiunque altro, nel deck e nel dugout altri giocatori per i quali vale lo stesso discorso, e di fronte una squadra avversaria che deve decifrare al meglio.


Commenti all'articolo.