PERCENTAGE BASEBALL

 

Ecco un genere di foto che apprezzo molto.

 

Il lanciatore ha effettuato il pick-off e la palla è in viaggio verso il sacchetto di prima, ma l’appiattimento della dimensione profondità non permette di valutare il tragitto percorso dalla sfera; il corridore ha preso abbastanza da potere essere colto, ma è anche proteso per rientrare; un solo fotogramma è stato isolato e catturato: è impossibile avere un’idea della velocità di palla e corridore e, salvo ricorrere ad altre fonti, non siamo nelle condizioni di dedurre l’esito dell’azione.

 

Supponiamo che arrivi prima la palla. Quanto è costato, ai fini del risultato finale, l’eccessivo ardire del corridore alla squadra in attacco? Supponiamo che, però, al prima base sfugga per un momento la sfera. In che misura l’errore potrà contribuire ad una eventuale sconfitta dei giocatori attualmente impegnati in difesa? E assumendo che l’arbitro non noti la defaillance del difensore ed assegni comunque l’eliminazione, è possibile quantificare l’influenza di tale decisione errata sull’esito dell’incontro?

 

Forse sì. Converrete senz’altro che tutti gli avvenimenti ipotizzati incidono in misura diversa a seconda dello stato in cui si trova il match nel momento in cui si concretizza l’evento: tanto più decisiva risulterà l’azione quanto più equilibrata è la partita; inoltre nelle fasi finali di una gara testa a testa gli accadimenti hanno maggiore capacità di invertire il momento.

Un incontro di baseball è una continua transizione tra diversi stati: in ogni istante la partita si trova in uno ed un solo stato e, al termine di ogni azione, passerà ad uno stato diverso compreso in una rosa limitata di possibili stati. Cerchiamo di concretizzare il discorso.

 

Abbiamo già visto in Il punto della situazione che ci sono 24 possibili combinazioni date dalla situazione di uomini sulle basi e dal numero di outs; per determinare completamente lo stato dell’incontro basta aggiungere al mix un’altra manciata di parametri, ovvero l’inning, la squadra in attacco ed il punteggio.

 

Basi piene, uno fuori; squadra di casa in battuta, parte bassa del nono, sotto di uno. La palla è colpita violentemente, sembra incendiare il terreno tanta è la velocità con cui percorre il lungo-linea di sinistra; se resta in campo buono potrebbe essere un doppio che chiude l’incontro in favore dei locali. Ma il terza base si tuffa e, col guanto proteso arresta il proiettile; sollevato sulle ginocchia assiste al seconda base che completa il doppio gioco, facendo morire la rimonta e ricacciando in gola l’urlo di gioia che i tifosi stavano per esplodere. Il lanciatore è il primo a complimentarsi con il compagno, conscio del fatto che gli ha salvato la giornata: prima che la palla partisse dal monte le probabilità di vittoria erano del 44,5% per gli ospiti e del 55,5% per i padroni di casa; al termine dell’azione, ovviamente, 100 % contro 0 % (la partita è finita!); se la palla fosse passata sarebbero state 15,3% a 84,7% nel caso fosse entrato un punto, e 0% a 100 % se fossero arrivati a casa due corridori. Una candidatura a Play of the Game è il minimo.

 

Ora immagino di dovere rendere conto di tanto dettaglio nel quantificare le chances di vittoria delle due squadre nel corso dell’azione.

Ci sono almeno tre vie per tentare di determinare la probabilità di vincere in ogni stato dell’incontro.

 

La prima è abbastanza semplice: si prendono i play-by-play degli incontri reali e per ogni combinazione di inning, scarto nel punteggio, numero di out e situazione sulle basi, si va a contare quante volte è risultata, al termine dell’incontro, vincitrice la squadra di casa e quante volte quella ospite. Purtroppo, nonostante la MLB fornisca un materiale di studio di oltre 2100 incontri all’anno, il numero di combinazioni possibili è tale per cui alcuni stati possono verificarsi un numero esiguo di volte, e pertanto fornire valori non attendibili per quanto riguarda la possibilità di vittoria.

 

La seconda strada ovvia al problema della numerosità campionaria tramite la simulazione: un computer genera dati per milioni di incontri ed il gioco è fatto.

 

L’ultima soluzione è quella più elegante dal punto di vista formale, tanto da essersi guadagnata, in almeno un paio di occasioni, le pagine della rivista scientifica The American Statistician. La brillante idea di Jay Bennett è stata quella di combinare (le procedure tecniche si trovano negli articoli che citerò tra breve) dati provenienti da due diversi studi di George Lindsey: il primo (The Progress of the Score During a Baseball Game - Journal of the American Statistical Association - 1961) riportava le probabilità di vittoria al termine di ogni ripresa in base al punteggio; il secondo (An Investigation of Strategies in Baseball - Operation Research - 1963) le probabilità, data una delle 24 combinazioni base/out, di segnare un  numero n di punti entro il termine dell’attacco.

 

Il metodo, battezzato Player Game Percentage (PGP) dal suo inventore , ha esordito nel 1984 durante l’assemblea della Sezione Sport della American Statistical Association: Bennet lo propone anche come indicatore di performance individuale, mentre a mio avviso è soprattutto utile a valutare la crucialità delle situazioni. Proprio a questo proposito, nel 1993, Jay Bennet utilizzò la propria creazione in un articolo (Did Shoeless Joe Jackson Throw the 1919 World Series? - The American Statistician - 1993) nel quale valutava le prestazioni di Shoeless Joe Jackson nelle tristemente famose Series del 1919. Jackson, accusato di aver “venduto” la vittoria con altri sette compagni, sostenne sempre di aver giocato al massimo delle proprie capacità, adducendo come prova una media battuta di .375; i suoi detrattori d’altro canto ipotizzarono che Joe avesse “alzato” la propria media mettendo a segno le valide quando esse risultavano più innocue.

Analizzando in modo incrociato le statistiche “classiche” del baseball con l’innovativa PGP, Bennet, servendosi elegantemente di varie tecniche statistiche, prova la tesi di Shoeless, mostrando che egli produsse con eguale efficacia nei momenti cruciali degli incontri; al contrario i numeri degli altri Sox coinvolti nello scandalo, mostrano una sorprendente (non tanto, essendo a conoscenza dei fatti) inettitudine nelle situazioni clou.

 

Veniamo al baseball più recente. L’immagine è una rappresentazione grafica dell’incontro Oakland-Texas, disputato ad Arlington il 30-09-1990. L’asse x riporta lo scorrere della partita, mentre in ordinata abbiamo la probabilità di vittoria delle 2 squadre.

 

 

Consideriamo gli aspetti più salienti.

 

Nella parte bassa del secondo, i locali mettono in base il primo battitore: l’aumento della probabilità “gialla” dimostra che il comune pensiero dell’importanza del lead-off in base è tutt’altro che immotivato; le successive basi ball fanno aumentare ancora le chances dei locali che passano a condurre 1 a 0.

 

Nell’inning successivo gli ospiti alternano valide e basi a strikeout subiti (la linea va a zig-zag) fino a pareggiare; poi, nella parte bassa, i locali iniziano bene (base, singolo), ma 3 K consecutivi chiudono il primo terzo di gara (picco).

 

L’incontro rimane “stabile” fino all'8°, quando gli ospiti mettono a segno 3 punti (la linea scende vertiginosamente); si noti come il sacrificio di fatto favorisca leggermente i padroni di casa (l’avanzamento non compensa l’eliminazione), che però restituiscono il favore con una base intenzionale (d’altronde giustificata, visto che nel box c’è McGwire); prima del termine dell’inning, un doppio gioco a basi piene dà una piccola scossa all’“encefalogramma piatto” dei Rangers, che però non combinano nulla nella parte bassa.

 

Siamo all’ultima ripresa. La base e il doppio ottenuti da Oakland hanno effetti quasi impercettibili a questo punto dell’incontro (la vittoria è quasi al sicuro), ben diverso è l’impatto delle 3 valide di Texas, che mandano il rilievo Steve Chitren nelle docce.

Con il punteggio di 4 a 3 per gli A’s, i Texani sacrificano un out per mettere in terza il punto del pareggio, ma le eliminazioni a seguire di Franco e di Palmeiro annullano le speranze di ribaltare il match, che nel finale era stato nuovamente aperto (56,5% A’s, 43,5 % Rangers sul doppio).

 

Torniamo alla questione iniziale di valutare l’impatto di una prodezza, di un errore o di una svista arbitrale.

 

Se in gara sei delle finali per il titolo del 1986 (Boston vs NY Mets, vedi The Curse) la rimbalzante di Wilson fosse stata raccolta da Bill Buckner, il decimo si sarebbe concluso sul 5 pari con le probabilità di vincere di 49,5% per i Sox e 50,5 % per i Mets; l’errore del prima base, che ha concesso a Knight di segnare dalla seconda, ha portato i valori a 0% contro 100%, risultando in un drop del 49,5% (il lancio pazzo di Schiraldi che aveva precedentemente portato l’incontro in parità era costato 61,5 punti percentuali; prima dell’ultimo attacco New York, sul 5-3 per Boston, le Calze Rosse godevano del 90,9% dei favori ed erano salite, con i primi due out a 98,4%).

 

Nel ’55 i Dodgers ottennero l’unica World Series a Brooklyn. In una drammatica gara 7 allo Yankee Stadium, Berra era nel box con compagni in prima e seconda e zero fuori; l’inning era il sesto, ed i Bums conducevano 2-0. La volata di Yogi pareva destinata a dare il 3 a 2 ai padroni di casa (ed una chance di vittoria del 74,6%), ma la presa in salto di Sandy Amoros derubò di un fuoricampo gli Yankees; Amoros, in collaborazione con Reese ed Hodges, completò anche il doppio gioco, portando le probabilità di New York al 23,4%. Parte dei 51,2 punti percentuali dell’azione potrebbe anche essere assegnata a Walter Alston, manager di Brooklyn, che aveva appena spostato Amoros a sinistra al posto di Gilliam.

 

Gara 3, 1975; ancora World Series, ancora Boston contro la maledizione (e Cincinnati). Fine 10°, uomo in prima, nessun out. Ambrister dei Reds smorza, esita nella corsa intralciando il catcher Fisk, che tira male. I replays mostrano un chiaro caso di interferenza (Ambrister dovrebbe esser dichiarato eliminato), ma Larry Barnett, arbitro di casa, non cede alle proteste dei Red Sox, lasciando gli uomini di Cincinnati in seconda e terza (sempre senza out). La decisione arbitrale costa 22,7% di chances di successo ai Sox, che di lì a poco, in effetti, perdono l’incontro.

 

Tutte queste probabilità possono avere una qualche utilità a livello pratico? Considerate questa situazione. Siete in casa, all’ultimo attacco, sotto di tre, con basi piene e zero fuori. Il battitore colpisce un singolo: l’uomo in terza segna il meno 2; se state suggerendo in terza cosa fate col corridore proveniente dalla seconda? Al momento la vostra probabilità di vincere è del 54,7%; mandandolo a casa diventa del 61,8% in caso di arrivo, mentre scende al 29,4% in caso di eliminazione. Una persona con qualche conoscenza di analisi decisionale vi direbbe che per mandare l’uomo a casa dovreste confidare nel successo dell’azione con una probabilità intorno al 90%.

Un coach di terza, pur non avendo sott’occhio queste valutazioni, deve compiere una decisione in una frazione di secondo: cari managers, scegliete bene i vostri suggeritori!

 

Abbiamo visto, valutando passo passo l’incontro Oakland - Texas, che le smorzate in genere arrecano danno all’attacco, così come le basi intenzionali sfavoriscono chi le concede. Perché i managers, allora, si ostinano a far uso di tali strategie? I valori riportati in tutto l’articolo si riferiscono necessariamente ad una situazione “media”; come sempre il manager deve invece affrontare la dura realtà: in ogni momento può esserci a battere Barry Bonds, ma anche Pinco Pallino… Una smorzata può significare, oltre ad un avanzamento ed a una eliminazione, presentare nel box un forte battitore (avendone magari sacrificato uno debole); analogamente concedere la prima a Bonds ti porta ad affrontare un avversario più “terrestre”.

 

Con questo articolo è stato decisamente ampliato quanto espresso in Il punto della situazione; dalle ultime righe, però, si può intuire che c’è da compiere almeno un altro passo.

 

Restate sintonizzati.

 


 

Regalo finale per i lettori del Prof. Pepper. Cliccando sotto potete scaricare un applicazione (è necessario avere Access 2000, ma spero presto di creare una versione indipendente) che vi calcolerà automaticamente le probabilità di cui si è fatto menzione nell'articolo.

 

pctball.zip (80 Kb)

 


Leggete, direttamente dall'American Statistical Association i PGP delle ultime World Series.

 


Commenti all'articolo.