LA MINIERA NELLA RETE

Oltre quattro anni fa compariva su queste pagine Percentage Baseball. Il concetto permeante di quell'articolo, la possibilità di calcolare, in ogni istante di un incontro, la probabilità di vincere di ciascuna squadra, era affatto nuovo. Così come non era originale l'idea di totalizzare i cambiamenti di tali probabilità prodotti da ogni giocatore tramite prodezze o debacle.

In quella sede era stato dato giusto credito a Jay Bennett, che già nel 1984 (esordiva Roger Clemens!) aveva trattato di probabilità di vittoria; Bennett stesso, nei propri articoli dichiarava che alla base del proprio lavoro erano le ricerche dei fratelli Mills, che nel 1970 (giocava ancora Willie Mays!) pubblicarono "Player Win Averages: A Computer Guide To Winning Baseball Players", volumetto oggi introvabile.

 

Proporre argomenti "nuovi" al pubblico del baseball italiano può essere facile: la rete abbonda di aneddoti, analisi e tanto altro; spesso la parte più ardua consiste nello scegliere e nel sintetizzare le informazioni.

Per Percentage baseball non andò così.

Di quanto vi fu raccontato allora, nulla era reperibile sul world wide web. L'articolo fu frutto di un paio di mattinate trascorse nella biblioteca della Facoltà di Scienze Statistiche.

Oggi è diverso. Ciò che i Mills brothers definivano Player Win Average e Bennett Player Game Percentage (dicitura adottata allora anche da Prof Pepper), oggi è noto e diffuso, a seconda dei contesti, come Win Expectancy o Win Probability Added.

 

L'ottimo sito The Hardball Times propose per la prima volta on-line nel 2004 un grafico che disegnava l'andamento di un incontro di MLB secondo l'attesa di vittoria… oltre un anno dopo l'esemplificativo Texas - Oakland proposto da Prof Pepper nel già citato articolo, e comunque a metà strada tra le analisi delle finali scudetto 2003 (Modena - Bologna) e 2004 (Bologna - Grosseto).

Su THT si parlò sempre più spesso di Win Probability Added; altri seguirono: diversi bloggers riportavano i grafici delle partite recenti delle proprie squadre preferite; persino il Washington Post aprì una sezione dedicata all'argomento, regalando ai propri affezionati i grafici delle partite dei Nationals in tempo reale.

 

Poi fu la volta di David Appelman e del suo FanGraphs... Beh, se avete già cliccato, non c'è bisogno che proseguiate questa lettura.

FanGraphs ha cominciato nel 2006 ad avere i grafici di ogni partita MLB on-line nel giro di 24 ore dall'ultimo out; nel corso di una stagione, Appelman ha costruito un archivio che va indietro fino al 2002, ha aggiunto una serie di tabelle individuali incredibili e ha preparato il lancio, avvenuto nel 2007, dei WPA Charts Live!

Oggi, se volete, potete aprirvi su un lato dello schermo il Game Day di MLB.com e FanGraphs sull'altro, per vedere in diretta come ogni azione sposti il momento dell'incontro.

 

Già, il momento.

Prof Pepper introdusse, nell'off season 2005, esaminando l'abilità di Ortiz e Rodriguez nei momenti cruciali, l'idea di leverage, nella formula proposta pochi mesi prima da Keith Wooner su Baseball Prospectus.

FanGraphs accompagna ogni WPA-chart con un grafico a barre del leverage, ovvero il peso specifico che ha ogni istante sull'economia dell'incontro. La formula utilizzata è in questo caso dovuta a Tom Tango (più conosciuto nella rete con lo pseudonimo Tangotiger) ed è senz'altro più precisa di quella di Woolner.

 

Tutto questo potrebbe saziare un appassionato avido di numeri, ma Appelman non ha solo "Graphs", ma anche tabelle... e se i primi sono belli da vedere, le seconde danno la possibilità di ragionare.

Prendiamo per un attimo i dati WPA di squadra del 2006 (quelli attuali variano quotidianamente, dunque non si prestano a esempi duraturi).

 

Lo scorso anno, all'epoca degli spring training, gli Indians erano dati tra i favoriti per il titolo, pur giocando in una division molto competitiva: a giochi fatti la compagine di Cleveland era sei partite sotto quota .500, ben lontana dall'agguerrito trio Minnesota-Detroit-Chicago.

La colonna WPA nelle statistiche di Fangraphs dipinge un quadro di quanto accaduto.

La probabilità di vittoria aggiunta complessivamente dalle mazze indiane è di 3.68 (sarebbe 368%), ovvero - considerando che all'inizio di ogni partita una squadra ha il 50% di chance di vincere - l'attacco avrebbe piazzato Cleveland sette partite sopra quota .500 [1].

La rotazione non ha spostato l'ago della bilancia - nel complesso un quarto di vittoria sopra .500 - resta il bullpen… e tutti sappiamo come è andata!

Il manager Eric Wedge ha provato in tutti i modi a dare un buon assetto al proprio staff di rilievi, fallendo miseramente: l'album fotografico della stagione sono tre clamorose blown saves di Fausto Carmona, l'ennesimo closer improvvisato.

Il bull-pen dell'Ohio ha prodotto a livelli da 13 partite sotto quota .500!

Non ci volevano le WPA per dire che agli Indians nel 2006 è mancato il bull-pen: grazie a quei numeri, però, possiamo dare una quantificazione a tali miserie.

 

L'American League Central 2006 è stata appannaggio dei Twins, il cui attacco, a +4 (d'ora in avanti ometteremo la specificazione "partite sopra .500") è stato inferiore a quello degli Indians.

Sulla collina, però, nel Minnesota è andata meglio: una stagione di Santana e mezza di Liriano hanno più che riparato i danni prodotti da Silva e Lohsie, assestando la rotazione a +4; il bullpen, invece, è stato perfetto, a +22 e praticamente senza contributi individuali negativi.

Spostate i rilievi di Minneapolis al Jacob Field e una stagione da 78 a 85 diventa una cavalcata da 95 o 96 vittorie!

 

I Tigers hanno perso la division di una partita - entrando comunque nella post-season; ancora una volta le WPA rispecchiano le percezioni, quantificandole: attacco di poco spessore (+1), a cui per il 2007 è stato aggiunto Sheffield; rotazione straordinaria (+17) e bullpen affidabile (+9).

Vogliamo cercare la partita che è mancata ai Tigers per vincere la division?

Il leverage (colonna pLI) delle situazioni in cui si è trovato mediamente Todd Jones, il closer, è superiore a quello relativo a Zumaya e Rodney, i due set-up: ciò significa che, a parità di prestazioni, Jones avrebbe avuto - per il solo effetto dell'importanza delle proprie situazioni - una WPA più elevata degli altri due; la realtà esprime il contrario, segno che i due giovani sono stati più performanti.

Tornando alla pagina dei Twins, vediamo che WPA e pLI dei rilievi decrescono insieme: i ruoli definiti nel bullpen da Gardenhire sono stati ottimali, concedendo ai Twins il risicato vantaggio a spese di Jim Leyland, con la sua scelta appena inefficiente!

 

E' tutto con la roba vecchia: il 2006 ci serviva come strumento per imparare a interpretare le tabelle di FanGraphs; la possibilità di aggiungere commenti agli articoli, novità del ristrutturato Prof Pepper, sarà sfruttata per seguire la stagione in corso… sono gradite anche osservazioni dei lettori!

Non è tutto.

L'ultimo gioiello che ci ha regalato Appelman è il Play-Log di ogni giocatore: per ogni turno nel box (o battitore affrontato, per i pitcher) della stagione sono riportati la situazione dell'incontro - punteggio, inning, out, uomini in base - il leverage, la WPA generata e, ovviamente, una descrizione di quanto accaduto.

Ce ne serviremo per riparlare di clutch.


[1] Si tenga conto che, a differenza di quanto visto nei citati articoli di Prof Pepper, sono prese in considerazione 162 partite. Pertanto la somma delle WPA di tutti i giocatori totalizzerà il numero di partite sopra .500 della squadra diviso due (come detto nel testo, tale dimezzamento è dovuto al fatto che, in ogni partita una squadra parte con il 50% di probabilità di vincere; dunque deve conquistare "solo" un altro 50%).

Quindi, ad esempio, una formazione che chiude il campionato 8 partite sopra .500 avrà, distribuita tra tutti i propri giocatori, una WPA di 4. [torna alla lettura]


Commenti all'articolo.