Storie Sportive e Scommesse: Normalizzazione Della Fortuna/Sfortuna Nel Baseball: FIP, BABIP, WPA, WAR

Il concetto che sta alla base della Sabermetrica nel Baseball si riferisce alla normalizzazione delle statistiche con il passare del tempo.
Se io lancio 6 volte una moneta in aria e mi esce 6 volte croce, la settima volta potrebbe uscire nuovamente croce ma all’infinito il tutto sarà normalizzato: la probabilità che esca "testa" o "croce" sarà simile al 50% (poco più o poco meno).
Vincere senza considerare le statistiche quindi andando a "senso" è possibile, infatti non tutti quelli che vincono lo fanno tramite la Sabermetrica, tuttavia il loro successo non è duraturo nel tempo.
La fortuna entra molto in gioco, ma solo nel breve termine.
A lungo termine avviene la normalizzazione.
E le normalizzazioni di solito sono spettacolari perchè prevedono esplosioni o crolli improvvisi (sbagliato parlare di "slump" perchè questo termine si usa per lunghe serie negative ma di giocatori forti, non certo sorprese).

FIP-ERA
Per avere una stima qualitativa nel tempo, il modo più semplice e diretto per analizzare il rendimento di un pitcher è guardare la differenza FIP-ERA.
L’ERA (Earned Run Average) sono i punti guadagnati sul pitcher, esclusi gli errori.
Si calcola moltiplicando i punti concessi dal proprio lanciatore per 9 (inning totali di una partita) diviso gli inning lanciati.
Come già detto gli errori (della difesa) non vengono conteggiati.
Banalmente più bassa è l’ERA, migliore è la prestazione del lanciatore.
La FIP (Fielding Independent Performance) invece comprende le statistiche non controllabili dalla difesa (cioè messa in gioco la palla, è compito della difesa quello che succede dopo).
Questa stat utilizza solo K, BB e HR e quindi stima l’ERA di un lanciatore con maggiore efficacia dell’ERA stessa (X è una costante posta a 3.20).

La formula è: (13*HR+3*(BB+HBP)-2*SO)/IP + X

Anche qui, ovviamente, minore è la FIP e migliore è stata la prestazione del lanciatore.
Quelli col differenziale positivo più alto tra FIP ed ERA hanno ottenuto risultati migliori rispetto a quanto abbiano lanciato, quelli in negativo pur avendo lanciato bene hanno ottenuto risultati sotto la media.
Generalmente un pitcher lancia tanto meglio quanto più sono gli Strikeout (K) e minori le basi ball concesse.

Facendo un esempio una FIP di 5.50 ed un’ERA di 3.50 denotano una differenza di ben 2 punti!
Il lanciatore sta lanciando peggio di quello che sembra, l’ERA rimane accettabile ma a lungo andare (continuando così) questa tenderà a normalizzarsi quindi le sue prestazioni a scendere di livello.
Una differenza accettabile è invece di circa 0.30 o minore: ciò vuol dire che i risultati ottenuti hanno ampiamente rispettato le performance offerte!
Se invece la differenza è negativa (FIP=6.00, ERA=6.50) ad esempio -0.50 ciò vuol dire che il lanciatore sta lanciando meglio di quello che ottiene e, a lungo andare, la sua ERA tenderà a normalizzarsi quindi a calare (migliorando le sue prestazioni reali).

BABIP (MEDIA SULLE PALLE IN GIOCO)
Per valutare i battitori, un metodo è guardare la BABIP.
Per le palla battute generalmente si tiene conto della velocità impressa alla palla, difese avversarie, fuoricampo (HR), Park Factors.
Una volta sottratti i fuoricampo (che sono le palle colpite con più forza, in genere), il gap fra i leader e gli ultimi si chiuderebbe ulteriormente. Quando poi includiamo l’influenza delle difese avversarie e dei Park Factors, ci rendiamo conto che la differenza di velocità della palla abbia un’influenza piuttosto ridotta sulla BABIP, più ridotta della velocità di corsa ad esempio.
Un altro fattore importante e non controllabile da lanciatori e battitori è la presenza di uomini in base. Con runners in base le difese non possono posizionarsi come vogliono ma sono soggette alla posizione degli avversari.
Uno stesso giocatore può avere un rendimento molto diverso nelle due situazioni, anche battendo con le medesime qualità e la stessa velocità di palla. Cioè la BABIP per uno stesso giocatore può essere diversa: a seconda dei giocatori presenti in base.
Quando si sommano tutte queste variabili (compresi Park Factors, fuoricampo e difese), ci rendiamo conto che i battitori hanno controllo nel lungo termine, ma quel controllo è comunque piuttosto limitato, inoltre è inibito se non addirittura cancellato dagli altri fattori nel breve termine. Insomma, per stimare l’abilità di un battitore, serve sempre un campione statistico molto ampio, ben superiore ad una singola stagione.
Riguardo i lanciatori si può dire che l’influenza dei lanciatori sulla velocità di una palla battuta valga per meno della metà degli effetti.
Cioè HR, Park Factors, qualità dei battitori affrontati e difesa hanno un impatto estremamente superiore rispetto all’abilità dei lanciatori. Chiaramente quest’abilità dei lanciatori esiste appunto, quindi nel lunghissimo periodo (molto più lungo dei battitori, circa il doppio del tempo) uscirà fuori.
All’interno di un matchup, l’influenza dei battitori conta il doppio di quella dei lanciatori.
Comprendere la natura della cosiddetta BABIP è importante per proiettare il rendimento dei giocatori, sia position players che pitchers.
Ma cosa vuol dire "media battuta sulle palle in gioco"?
Esclude dunque le basi su ball, gli strikeout ed i fuoricampo, ma include solo le palle che vengono messe in gioco da un battitore o contro un lanciatore (a seconda di chi venga analizzato).

La formula è: (H-HR)/(AB-(K+HR))

La BABIP è una componente della media battuta, quindi come OBP, SLG ed inevitabilmente OPS, delle variazioni sostanziali possono incidere molto nel rendimento offensivo.
Un hitter può migliorare il suo rendimento in diversi modi: battere più fuoricampo, ottenere più basi su ball, subire meno strikeout o migliorare la propria BABIP.
Mentre le prime 3 caratteristiche dipendono esclusivamente dal suo duello col lanciatore, la BABIP inserisce nel discorso una terza parte, ossia la difesa avversaria, e lo stesso vale in maniera opposta per un lanciatore.
Com’è intuitivo, ogni volta che si inserisce un nuovo fattore nella discussione, l’incidenza dell’abilità dei fattori pre-esistenti diminuisce. Una volta che la palla viene messa in gioco, lanciatore e battitore non possono controllare ciò che farà la difesa: le loro abilità si limitano appunto nel mettere o meno un certo tipo di palla in gioco.

Il problema fondamentale della BABIP è che è ottima a determinare la qualità delle prestazioni di lanciatori e battitori, ma non è altrettanto indicativa delle loro abilità e qualità.
Nel 2001 Voros McCracken ha pubblicato la sua DIPS (Defense-Indipendent Pitching Statistics) Theory, dimostrando che l’abilità di un lanciatore sia definita in maniera più efficace escludendo la BABIP dalle equazioni.
Sostanzialmente mentre c’è una forte correlazione di anno in anno fra le altre abilità di un lanciatore (BB, K, HR), non c’è nella BABIP, che è capace di variare notevolmente annualmente a dispetto degli altri indicatori, a volte in maniera palese.
Ad esempio è più facile prevedere l’ERA di un lanciatore nell’anno successivo usando statistiche DIPS piuttosto che l’ERA stessa dell’anno in corso, proprio perché una componente fondamentale dell’ERA è la BABIP (le statistiche controllate dall’abilità hanno una persistenza nel tempo, la BABIP non ce l’ha necessariamente).
Addirittura, come segnala McCracken, la BABIP dei position players quando lanciano non è dissimile dai lanciatori stessi (ma naturalmente i position players ottengono meno strikeout, concedono più basi su ball e più fuoricampo), e questo indica ulteriormente come sia poco indicativa dell’abilità inerente di un pitcher.
Ovviamente un lanciatore ha un certo controllo sul fatto di essere un groundballer o un flyballer (ossia uno che concede palle battute per terra o per aria), e la BABIP delle groundballs e delle flyballs è diversa ma non così diversa da coprire il disavanzo creato dai Park Factors o da un certo grado di casualità sul breve termine. Inoltre, i flyballers tenderanno a concedere un numero superiore di fuoricampo, riflettendo ugualmente le loro abilità senza dover ricorrere alla BABIP.
Chiaramente il tipo di palla battuta che aumenta la BABIP è quello delle linee.
Battere linee ha una predominanza per i battitori rispetto ai lanciatori, e siccome i lanciatori nel lungo termine tendono ad affrontare gruppi omogenei di battitori, le cifre tenderanno a normalizzarsi attorno alla media.
Come detto, l’influenza di un lanciatore sulla BABIP è minima, ma non inesistente.
Come può ridurla?
1) Essere un flyballer in un campo con un esterno molto ampio: questo permetterà di concedere tante flyballs senza aumentare necessariamente il numero di fuoricampo.
2) Essere un pitcher estremamente diverso dallo standard, come un knuckleballer.
Un lanciatore con l’80% di slider potrebbe ipoteticamente ottenere lo stesso risultato.
3) Essere un rilievo e mostrare dunque poco i propri lanci.

Come si evince, si tratta maggiormente di definizioni sulla “natura” di un pitcher rispetto alla sua abilità. Non è possibile controllare alcuni di questi fattori, che variano dal campo, al proprio ruolo, passando per il repertorio di determinati lanci che non tutti posseggono.
Per il resto l’influenza sulla BABIP di un lanciatore deriva dal campo, dalla difesa e dalla casualità (un numero particolare di bloop può cadere dentro il campo o nel guanto di un difensore).
In generale la BABIP di un lanciatore MLB sarà attorno a .290-.295.
Se un lanciatore differisce nettamente da questa media, è salutare avere un certo scetticismo nei confronti delle sue prestazioni, scetticismo che potrà essere confermato o meno solo dalla persistenza di una BABIP particolarmente bassa o alta.
Ad esempio possiamo considerare una BABIP minima di .270 e quella massima di .320.
Ciò potrebbe dipendere dal fatto che questi lanciatori abbiano la facoltà di controllare almeno in parte la loro BABIP (ad esempio esterno del campo o tipo di lanci), ma solo perché il campione statistico è sufficientemente ampio da poterlo affermare.
Se non ci sono i fattori menzionati prima come nel caso di Jeremy Hellickson, che nel 2011 da rookie ebbe .223, lo scetticismo era obbligatorio per non dire che la cifra fosse insostenibile, nonostante abbia disputato una buona stagione ed avesse ottimi difensori dietro.
In generale l’impatto della BABIP su un pitcher medio sarà inferiore a quella di K, BB e HR, anche nei casi estremi.
Un esempio dell’impatto di un ballpark su un lanciatore può essere portato da Dan Haren, che anni fa giocò per 3 anni con gli Athletics (in un campo che sopprime la BABIP) e per 2 e mezzo coi Diamondbacks (in un campo che la aumenta): la sua BABIP con gli A’s è stata di .278, coi DBacks è stata di .298.
Ad esempio Matt Cain al suo meglio (quando giocava con i San Francisco Giants) aveva .258 in casa, ma .281 fuori, dimostrando che la sua abilità nel controllare la BABIP, per quanto effettivamente esistente (è chiaramente migliore della media anche fuori casa) sia molto inferiore rispetto a quanto fatto dal campo di casa.
Il controllo dei lanciatori sulla BABIP è dunque particolarmente ridotto quando non inesistente.
Nel caso dei battitori il controllo è a sua volta limitato e soggetto a fattori diversi dall’abilità (come quelli citati per i lanciatori), ma è ben più ampio.
Ci sono giocatori che colpiscono la palla con particolare forza con regolarità (ad esempio Stanton), altri che battono linee con costanza (uno di questi era Jeter), ma quello che fa la differenza maggiore è l’abilità nell’ottenere infield hits.
Questa abilità è strettamente correlata con la velocità di corsa, quindi ad esempio Altuve essendo velocissimo è in grado di arrivare in prima base prima dell’assistenza degli interni molto più spesso della media, quindi tenderò ad avere una BABIP molto migliore della media.
Giocatori lenti e che battono la palla per aria molte volte, come era ad esempio Bengie Molina, avranno una BABIP molto peggiore.
Anche nel caso dei battitori però bisogna essere scettici per via di campioni statistici ridotti: se un giocatore vede la sua BABIP esplodere in una singola stagione, come accaduto a Jorge Posada nel 2007, è relativamente facile immaginare che sia stata una casualità che non si ripeterà più.
Fondamentalmente è importante rendersi conto del fatto che nel breve termine la BABIP possa variare anche semplicemente a causa di caso e fortuna. Nel breve termine ed in stagioni singole, il significato della BABIP è virtualmente nullo. Nel lungo termine non mentirà, ma sarà comunque soggetta alla grossa influenza dei Park Factors e difesa prima ancora che all’abilità dei lanciatori stessi.
I lanciatori non possono esercitare tanto controllo sulla BABIP.
I battitori invece posso farlo molto di più, ma anche loro sono soggetti a variazioni in stagioni singole che potrebbero non essere indicative del loro reale talento, ma in entrambi i casi i giocatori tenderanno a normalizzarsi secondo le medie in carriera nel medio e nel lungo periodo.
E’ importante studiare le caratteristiche dei giocatori e dei loro ballpark per analizzare cosa potrebbe contribuire a variazioni nella BABIP.
In generale se la BABIP e è troppo elevata, calerà, se è troppo bassa salirà.
Tende a convergere verso la media generale di .298 o verso la teorica media personale, ma giocatori che battono tante line drives riescono a stare poco sopra.

Generalmente:
- Quasi il 100% di popups sugli interni diventa un out.
- Oltre il 70% di groundballs è un out.
- Per le flyballs sugli esterni che diventino out la % è poco più alta.
- Il 25% di line drives è un out.

Se uno batte tante line drives, allora la sua media battuta dovrà alzarsi
Come può alzare la propria media battuta un hitter? Intanto evitando gli strikeouts (mettere la palla in gioco concede sempre la possibilità di arrivare in base, magari anche con battute scadenti per eventuali errori) e cercando di battere tante linee.
Chiaramente c'è un limite alle linee, e quindi l'altro modo è battere fuoricampo.

Cosa devono fare i pitchers allora per disinnescare gli hitters? Fare tanti strikeouts e tenere le palle per terra (o ottenere popups), visto che le groundballs non diventano HR.

Ovviamente però le groundballs, anche se hanno poche chances in più rispetto alle flyballs di diventare valide, permettono tanti DP.

Un pitcher che fa pochi K potrebbe sopravvivere con le groundballs, che al massimo si trasformano in singoli (le flyballs invece se non vengono prese possono diventare HR facilmente) e raramente in doppi, e che spesso gli danno dei doppi giochi.

Ad esempio BABIB oltre i .350 son destinare a crollare e a normalizzarsi sui .300

Valori molto elevati si normalizzeranno più lentamente (quindi le prestazioni continueranno a rimanere buone), nel caso un battitore realizzi appunto tante linee (o groundballs trasformate in infield singles).

Se la BABIB elevata è invece influenzata da flyballs che diventano tanti HR, il crollo di prestazioni sarà più veloce.

Se un giocatore (non molto veloce) ha una BABIP molto elevata con il 60% di groundballs, allora si normalizzerà subito verso il basso.

Togliendo per forza di cose, gli HR dalle considerazioni:

- Una flyball è valida il 17% di volte

- Una groundball lo è il 24% di volte

- Una linea il 72%

- Un popup il 2%

Ovviamente le flyballs, anche se producono meno valide, producono una SLG superiore rispetto alle GB.

Detto questo, il 7% di efficienza di differenza non viene coperto dalla differenza in SLG.

Le flyballs sono sempre migliori perchè possono finire fuori. Una volta inclusi gli HR, torniamo al fatto che le FB siano valide circa il 25% di volte, e chiaramente gli HR sono preferibili (ed è per questo che è preferibile avere un groundball pitcher).

Insomma, i groundball hitters sono preferibili, ma l'ideale è avere un flyball hitter dotato di potenza.

La BABIP può abbassarsi, battendo meno groundballs, ma è sempre da relazionare alle flyballs (quindi agli HR) ed ai popups.

Perdere in singoli ed aumentare in modo congruo gli HR rimane la BABIP inalterata.

Flyballs poco potenti di solito si trasformano in popups.

WPA

In ogni momento di una partita c'è una determinata probabilità di vittoria (Winning Probability).

Ogni giocata aumenta o diminuisce la probabilità, e quindi ogni giocata fornisce una WPA (Winning Probability Added) che può anche essere negativa.

E' chiaro che sul 9-0 nella parte alta del nono ci sia una possibilità di vittoria, mentre sullo 0-0 ce ne sarà un'altra.

E' dunque chiaro che una valida avrà un peso diverso in ciascuna delle due situazioni.

La WPA di una valida in situazione di pareggio sarà dunque maggiore.

Questa metrica evidenzia chi ha maggiormente contribuito, in quanto hitter, alle probabilità di vittoria della propria squadra.

Ogni AB ha una sua clutchness o una sua importanza.

Esiste la WPA+, ossia il contributo in positivo alle vittorie della propria squadra.

Esiste la WPA-, ossia il contributo in negativo.

Ed infine c'è la WPA, che è il saldo delle due cose.

Ad esempio una WPA+ di 3.80 di WPA+ e -4.40 di WPA-, ha un saldo di -0.60 di WPA.

In questo caso c'è un contributo negativo di -0.60 vittorie durante l'anno (o 0.60 sconfitte).

Questa metrica soppesa valide nei momenti chiave e K o comunque out in momenti altrettanto chiave, facendone una media per entrambi e poi il saldo.

Paradossalmente potrei avere una WPA+ alta ed una WPA- altrettanto alta (quindi negativa) ma il saldo totale è quello che conta.

Fangraphs pubblica anche la "clutchiness" in cui soppesa l'OPS basandosi sulla WPA perchè giustamente un singolo in un momento delicato è clutch.

Ma un doppio o triplo è meglio e quindi va considerato.

WAR

La sigla sta per "Wins Above Replacement", sostanzialmente questa stat riassume i contributi totali di un giocatore alla propria squadra in una statistica.

Cioè se perdo un giocatore per infortunio o lo metto in panchina, sostituendolo con un altro, quanto ci perdo?

Ad esempio potremmo dire che X giocatore vale +6 vittorie alla sua squadra, mentre il giocatore Y vale solo +3.5 vittorie.

Il confronto di stats offensive tra due giocatori è utile, ma riduce il contributo potenziale che un giocatore può ottenere salvando le esecuzioni in difesa con tuffi e in generale giocate difensivi.

La WAR è un semplice tentativo di combinare il contributo totale di un giocatore in un singolo valore.

Forse uno degli aspetti più controversi della sabermetrica è il modo in cui viene utilizzata la WAR. Data la natura del calcolo e gli eventuali errori di misurazione, la WAR dovrebbe essere usata come guida per separare i gruppi di giocatori e non come una stima generica.

Ad esempio, un giocatore con 6.3 WAR e uno con 6.1 non possono essere distinti: i valori sono troppo simili.

Tuttavia, un giocatore con 6.6 WAR e un giocatore di 4.3 WAR sono abbastanza diversi da poter dire con uno alto grado di sicurezza che il primo è stato sicuramente più prezioso del secondo.

Per i giocatori di posizione, il più grande punto interrogativo è il misurare la difesa e stimare il giusto posizionamento. Le misure di entrambi sono più incerte rispetto a quelle offensive, quindi buoni difensori hanno probabilmente una maggiore incertezza intorno al loro valore di WAR rispetto a giocatori che hanno un valore difensivo più vicino alla media.

Usare correttamente la WAR è difficile perché richiede di pensare in modo più astratto rispetto ad altri aspetti della vita. Il valore esatto è importante sino ad un certo punto: ciò che conta (come molte stats sabermetriche) è il valore di base (cioè la media).

La media WAR dipende anche dal ruolo.

Un giocatore medio vale circa 2 WAR, mentre i giocatori medi non titolari contribuiscono molto meno (tipicamente tra 0 e 1 WAR). Anche gli starters medi valgono circa 2, mentre i rilievi sono considerati superbi con +1 di WAR.

FORTUNA E SFORTUNA

Ovviamente ad un hitter non gli si può chiedere di battere valido. Gli si può chiedere di colpire bene la palla, di battere più linee. Poi magari batte una linea dritta nel guanto dell'esterno.

Il difensore magari la prende al volo con un gran tuffo, viene prodotto un out, il battitore dunque ha fallito? Ovviamente no.

Le linee diventano valide circa il 75% delle volte.

Le groundballs circa il 25% (1 su 4).

Le flyballs circa il 15% (quando non sono HR).

Questo significa che uno può essere sfortunato e battere delle linee che vengono prese al volo, mentre un altro è fortunato e batte un popup (che diventa valido il 2% delle volte) e questo cade tra 3 difensori. Ma nel lungo termine, se il primo continua a battere linee ed il secondo continua a battere popups, è evidente che qualsiasi statistica andrà a normalizzarsi.

Popups che cadono sono negativi per un lanciatore e positivi per un battitore ma paradossalmente, continuando su questa strada, il lanciatore vedrà migliorare le sue medie il battitore no.

Un pitcher deve fare strikeouts, per non mettersi nelle mani della fortuna.

Al di là della qualità del lancio però le palle messe in gioco, possono sempre trovare buchi nella difesa. Succede.

Ad esempio se un giocatore battesse 4 su 4 con 4 popups che hanno tutti la fortuna di cadere tra difensori accorrenti e su uno riesco ad ottenere un doppio perchè due difensori si scontrano, a fine giornata, avrò come rendimento 1.000/1.000/1.250 (AVG/OBP/SLG).

Questa riga descrive i risultati oggettivi che io ho ottenuto, perchè che piaccia o no ho battuto 3 singoli ed un doppio.

Le peripherals (statistiche periferiche) invece descrivono il rendimento di un giocatore, quindi permettono di capire meglio quanta fortuna/sfortuna il giocatore abbia avuto, e come si possa proiettare nel futuro, o cosa debba cambiare nel suo approccio.

Un giocatore di questo tipo (per altro con stats fenomenali, per quanto si tratti di una sola partita) che batte solo popups, denoterebbe una fortuna incredibile.

Una statistica periferica interessante per gli hitters è la LD%, ossia la % di palle colpite che si trasformano in line drives (come si sarà capito il tipo di battute che ha più possibilità di diventare valida). Se uno vuole alzare la propria media in battuta, deve aumentare le linee.

Se uno ha una alta BA (battering average) ma una bassissima LD%, allora è stato molto fortunato, e la sua BA si normalizzerà verso il basso.

In quel caso, le sue statistiche (la sua BA, nell'esempio) sono positive, ma le sue periferiche indicano che non abbia giocato tanto bene quanto il rendimento mostrerebbe.

Per i pitchers si può parlare della GB%, o del rapporto K/BB o anche (ma molto meno rispetto agli hitters) della LD% concessa.

T'interessano altri articoli su storie sportive(doping, scandali, suicidi, partite vendute, etc) e scommesse?
Qui trovi l'indice completo ed aggiornato del blog: Indice Storie Sportive(Doping, Suicidi, Partite Vendute, Stake, etc)

venerdì 5 ottobre 2018

Normalizzazione Della Fortuna/Sfortuna Nel Baseball: FIP, BABIP, WPA, WAR

Nessun commento:

Posta un commento