|
Oggi si comincia con un ringraziamento.
Le semplici analisi delle prossime righe, e le più complicate e affascinanti che appariranno su Prof Pepper nelle settimane a venire, sono possibili grazie al lavoro -breve, sostiene lui - di una persona: per qualche giorno ha subito le mie mail, "non riesco a farlo funzionare!", "ma non si potrebbe aggiungere…", finché non mi ha messo nelle condizioni di poter avere a disposizione una quantità di dati che mai avrei osato sognare.
Se leggendo i prossimi articoli egli proverà un decimo del piacere, che è stato mio quando ho avuto tra le mani quei numeri e quando li ho visti dar vita ai grafici che presto saranno sotto i vostri occhi, mi considererò sdebitato.
Grazie Giorgio.
La provenienza dei numeri è il sito ufficiale MLB, in particolare i Gameday tramite i quali potete seguire ogni singolo lancio delle oltre duemila partite che si disputano ogni anno.
In questa prima occasione scalfiremo la superficie di quanto è possibile leggere tra le informazioni che MLB ci spara in diretta.
Cominceremo con le pitch location.
Per ogni lancio che viene recapitato a casa base, c'è qualcuno che segna su una griglia il punto in cui la palla ha attraversato la linea del piatto: il risultato immediato è la comparsa sul Gameday di una pallina colorata e numerata in corrispondenza della location.
Nella prima immagine vediamo dove lanciano con più frequenza i Major Leaguers: le zone a colorazione più intensa sono, ovviamente quelle attraversate dal maggior numero di lanci.

Figura 1 - Tutti i lanci registrati in MLB nel 2007 (metà giugno).
Dimenticavo di orientarvi.
Vi trovate sul monte, quindi immaginate un battitore destro posizionato sul lato destro del piatto e di fronte a voi.
Nel grafico successivo invece, l'intensità del colore indica la percentuale di palle - passate per ciascun punto - che l'arbitro ha chiamato strike.
Per creare l'immagine abbiamo ovviamente escluso ogni lancio in cui il battitore ha eseguito uno swing, fruttuoso o meno.

Figura 2 - Percentuale di lanci non sventolati risultati in uno strike.
E' evidente un rettangolo rosso, l'area di strike, contornato da una zona arancio-gialla, ovvero i fili che possono essere chiamati o meno.
I punti rossi sparsi sono ovviamente errori, più di chi registra i dati che degli arbitri direi; hanno come denominatore uno o due lanci ciascuno e, d'ora in avanti li ignoreremo.
Costruiamo ora una codifica artificiale.
Definiamo STRIKE ogni lancio che passa in zone rosse o, più precisamente in un'area in cui oltre l'80% delle palle è chiamato strike dall'arbitro; definiamo BALL ogni palla che passa in zone in cui la percentuale di chiamata è inferiore al 20%; infine definiamo BORDER tutto il resto.
Un'immagine vale più di mille parole.

Figura 3 - STRIKE, BALL e BORDER.
E' assolutamente ragionevole che l'area incerta spazi in altezza più che in larghezza: il piatto non si muove, come diceva Satchel Paige, mentre le dimensioni dei battitori sono piuttosto varie. Chiedere a chi affrontò Eddie Gaedel!
Una prima utilità della nostra codifica è di valutare chi sono i lanciatori che maggiormente "dipingono il nero".
Nella tabella sono mostrati i più e i meno efficaci in tali aree tra coloro che, alla data dell'analisi avevano effettuato almeno 300 lanci; vi aggiungo un file (xxx) contenente i valori di tutti i pitcher.
| Pitcher |
Pitches |
STRIKE |
BORDER |
BALL |
| Elarton, Scott |
634 |
41 |
16 |
43 |
| Springer, Russ |
471 |
42 |
15 |
43 |
| Saito, Takashi |
416 |
43 |
15 |
43 |
| Riske, David |
545 |
48 |
14 |
38 |
| Peralta, Joel |
713 |
48 |
14 |
38 |
| Buehrle, Mark |
1407 |
43 |
13 |
44 |
| Francisco, Frank |
456 |
47 |
13 |
40 |
| Wellemeyer, Todd |
837 |
43 |
13 |
44 |
| Sisco, Andrew |
316 |
41 |
13 |
46 |
| Shields, Scot |
571 |
47 |
12 |
41 |
| Reitsma, Chris |
343 |
45 |
12 |
43 |
| Duckworth, Brandon |
527 |
42 |
12 |
46 |
| Tejeda, Robinson |
1192 |
47 |
12 |
41 |
| Reyes, Anthony |
844 |
49 |
12 |
39 |
| Broxton, Jonathan |
580 |
45 |
12 |
43 |
| Colon, Bartolo |
913 |
48 |
11 |
41 |
| Isringhausen, Jason |
427 |
44 |
11 |
44 |
| Maddux, Greg |
1027 |
51 |
11 |
39 |
| Schmidt, Jason |
472 |
44 |
11 |
45 |
| Wells, David |
1029 |
47 |
11 |
42 |
...
| Hernandez, Roberto |
524 |
50 |
3 |
47 |
| White, Rick |
526 |
57 |
3 |
40 |
| Ortiz, Russ |
670 |
57 |
3 |
39 |
| Schoeneweis, Scott |
433 |
52 |
3 |
44 |
| Fultz, Aaron |
344 |
47 |
3 |
50 |
| Patterson, John |
651 |
51 |
3 |
46 |
| Feliciano, Pedro |
466 |
54 |
3 |
44 |
| Howell, J.P. |
405 |
56 |
3 |
41 |
| Rodriguez, Wandy |
1254 |
55 |
3 |
42 |
| Miller, Trever |
365 |
53 |
2 |
45 |
Tabella 1 - Percentuale di "Pittura".
Non è detto che dipingere i fili sia l'unico modo per aver successo, come mostra il 4% (tra i valori più bassi) di palle "border" di Josh Beckett, che non se la sta cavando male.
Parecchi closer li troviamo sopra quota 10%.
Carlos Silva ha sempre concesso pochissime basi su ball; il suo problema sono ogni anno i pochi strikeout e le molte valide: la sua suddivisione di lanci (57% STRIKE - tra le più alte -, 4% BORDER - tra le più basse -, e 39% BALL) racconta buona parte della storia.
La tabella che segue mostra il destino ultimo dei tre tipi di lancio.
BALL BORDER STRIKE
Automatic Ball 0 0 0
Ball 78 14 1
Ball In Dirt 4 0 0
Bunt Ground Out 0 0 1
Bunt Pop Out 0 0 0
Called Strike 1 18 31
Catcher Interference 0 0 0
Double 0 1 2
Field Error 0 0 0
Fly Out 0 4 7
Foul 4 30 24
Foul (Runner Going) 0 1 1
Foul Bunt 0 1 1
Foul Tip 0 1 1
Ground Out 1 6 11
Hit By Pitch 1 0 0
Home Run 0 1 1
Intent Ball 2 0 0
Line Out 0 1 2
Missed Bunt 0 0 0
Pitchout 0 0 0
Pop Out 0 2 2
Single 1 4 7
Swinging Pitchout 0 0 0
Swinging Strike 6 15 8
Swinging Strike (Blocked) 1 0 0
Triple 0 0 0
Unknown Strike 0 0 0
TOTAL 100 100 100
Tabella 2 - Esito dei lanci STRIKE, BALL e BORDER (valori percentuali).
Uno STRIKE è ovviamente di più facile lettura per i battitori: circa un 10% delle palle che passano sulla parte bianca del piatto diventano battute valide (attenzione il 10% di tutte le palle! Se considerassimo solo le palle sventolate, ovviamente avremmo valori più elevati); dei lanci BORDER, solo il 6% alza la media battuta.
Proseguiamo.
La tabella successiva ci dice che, in Major League, STRIKE e BORDER sono sventolati con eguale frequenza (due volte su tre); uno swing avviene invece nel 15% dei BALL.
| |
BALL |
BORDER |
STRIKE |
| MLB |
15% |
68% |
68% |
| Vladimir Guerrero |
27% |
72% |
84% |
| Scott Hatteberg |
8% |
49% |
59% |
Tabella 3 - Frequenza di swing sui tre tipi di lancio: confronto tra media MLB, Vladimir Guerrero e Scott Hatteberg.
Ovviamente non tutti i battitori si comportano nello stesso modo.
Vladimir Guerrero è un noto bad-ball bitter: i numeri confermano la sua fama.
Vlad gira la mazza oltre una volta su quattro per quanto riguarda i BALL, mentre pochi STRIKE non risultano essere di suo gradimento.
Come paragone prendiamo Scott Hatteberg, uno la cui pazienza si è meritata un capitolo di Moneyball: Hattie è il fante di bastoni per quanto riguarda le palle evidentemente in BALL; è inoltre molto più attendista della media (per non parlare di Guerrero) anche sugli STRIKE e sui BORDER.
Ora ci concentriamo sugli swing.
Quando un Major Leaguer gira la mazza su un BALL, nel 53% dei casi riesce a far contatto (qualsiasi tipo di contatto, anche un foulball); ovviamente le percentuali salgono sui BORDER e sugli STRIKE.
| |
BALL |
BORDER |
STRIKE |
| MLB |
53% |
78% |
88% |
| Vladimir Guerrero |
59% |
90% |
91% |
Tabella 4 - Percentuale di contatto sui lanci: Vlad e il resto del MLB.
Riprendendo in considerazione Guerrero, vediamo che l'asso degli Angels "trova la palla" più spesso della media dei suoi colleghi, in particolare sulle palle fuori dal cuore del piatto.
Non sono emerse in queste righe cose sensazionali; d'altro canto avevamo anticipato che, per ora, avremmo soltanto esplorato la superficie dei dati a nostra disposizione.
Quali altre informazioni del Gameday possono essere utilizzate?
Oltre le location dei lanci sono disponibili quelle delle battute: un'opportuna combinazione di entrambe può, ad esempio, rivelarci i "dead pull hitters" e coloro che battono la palla "where it's pitched".
Il vero filone d'oro, però, è nell'Enhanced Gameday.
Avrete notato che le partite disputate in una manciata di stadi presentano un Gameday più ricco: per ogni lancio potete conoscere la velocità al rilascio e sul piatto, il movimento orizzontale e verticale, e tanto altro.
In attesa che il sistema di rilevazione sia esteso a tutti i 30 ballparks, ci accontenteremo di analizzare i dati del Gameday Basic.
No, non è vero.
Pur limitandosi a poche partite, i dati dell'Enhanced Gameday sono troppo affascinanti per essere lasciati a fermentare.
A presto.
|