Visualizzazioni totali

Visualizzazione post con etichetta Sabermetrica. Mostra tutti i post
Visualizzazione post con etichetta Sabermetrica. Mostra tutti i post

venerdì 10 ottobre 2025

Intelligenza Artificiale In Premier League: Big Data, Scouting, Tattica

Intelligenza Artificiale ormai fa parte della vita di tutti noi e sta facilitando molti lavori. Anche in ambito sportivo, in particolare in Premier League, viene molto utilizzata sia per scouting che per statistiche che per pianificazione tattica. Parte dell’elaborazione avviene direttamente sui dispositivi (GPS unit, videocamere intelligenti) per ridurre latenza. Chiaramente AI suggerisce, ma la decisione finale resta a coach e analisti.


SCOUTING E RECLUTAMENTO
Il Brighton ha utilizzato una piattaforma proprietaria ("Starlizard") per analizzare milioni di dati su compatibilità tattica, rischio infortuni e performance, accorciando enormemente i tempi di scouting e ottimizzando l’individuazione di potenziali talenti. Anche l'Arsenal si affida a strumenti basati su IA (ad esempio PLAIER) per generare shortlist intelligenti (acquisti nella finestra estiva).


PIANIFICAZIONE TATTICA
I campioni inglesi del Liverpool utilizzano Google DeepMind su TacticAI, un sistema per ottimizzare schemi sui calci d’angolo. Le analisi di oltre 7.000 corner hanno portato a preferire le soluzioni suggerite dall’IA nel 90 % dei casi. Utilizzano anche scouting e analisi di neuroscienze.


PERFORMANCE E PIANIFICAZIONE INFORTUNI
L’IA è utilizzata per monitorare i carichi di lavoro, la fatica, la frequenza cardiaca e il recupero, aiutando i club a ridurre il rischio di infortuni. Vengono utilizzati strumenti come Zone7 (anche se applicati altrove) per anticipare/ipotizzare problemi muscolari in tempo reale. 


PSICOLOGIA
Sempre il Brighton collabora con Inside Out Analytics per analizzare migliaia di ore di video, valutando posture, gestualità e comportamento non verbale per classificare tratti come empatia, grinta o autocontrollo.


TIFOSI E BIGLIETTI
La Premier League ha siglato una partnership quinquennale con Microsoft. La piattaforma Premier League Companion, alimentata da Azure OpenAI, offre ai tifosi personalizzazioni sui club, partite, statistiche e video, su un archivio vastissimo di contenuti digitali. 


INNOVAZIONE STRUTTURALE
Il Manchester City ha una partnership IA con Google Research e ha introdotto sistemi intelligenti per il flusso dei tifosi allo stadio (crowd intelligence), oltre a video highlights personalizzati in base alle preferenze dei fan. 


SABERMETRICA E AI
Il Brentford adotta un vero approccio "Moneyball" (diventato noto in MLB grazie agli Oakland Athletics), grazie alla guida del proprietario Matthew Benham, un fisico di Oxford con background finanziario, che ha introdotto una cultura basata sui modelli analitici per reclutare giocatori sottovalutati. Utilizzano modelli statistici (come xG, qualità dei tiri, lavoro senza palla) per comparare giocatori e identificare opportunità di mercato, coniugando "numeri freddi" e scouting visivo. Grazie a questo approccio, hanno scoperto talenti come Watkins, Maupay e Toney, acquistati a basso costo e rivenduti con grande guadagno. Dal 2024, Brentford ha operato una partnership con Genius Sports per fornire alla propria tifoseria, sia allo stadio che sui social, highlight in tempo reale arricchiti da dati visivi (velocità dei tiri, traiettorie, mappe del campo, nomi dei giocatori). Il sistema "Dragon" rileva 10.000 punti corporei per giocatore, 200 volte al secondo.
Inoltre il Brentford ha progressivamente abbandonato il modello tradizionale dell’accademia giovanile (nel 2016), sostituendola con un team B potenziato da scouting esterno, ottimizzando lo sviluppo dei giovani talenti. 


RACCOLTA DATI (DATA ACQUISITION LAYER)
-Sensori GPS indossati dai giocatori in allenamento (10–20 Hz, tracking di velocità, accelerazione, distanza percorsa, decelerazioni, high intensity runs).

-Computer Vision da telecamere multi-angolo, come sistemi TRACAB o Second Spectrum, che rilevano 20–25 coordinate 3D per giocatore 25 volte al secondo in partita.

-Wearable biometrici (HRV, saturazione O₂, temperatura corporea, dati del sonno).

-Input esterni: dati di mercato, statistiche Opta, informazioni mediche, social sentiment analysis.


ELABORAZIONE E MODELLAZIONE (AI/ML LAYER)
-Algoritmi di Machine Learning supervisionati (XGBoost, Random Forest) per predire eventuale infortunio o performance future.

-Reti neurali convoluzionali (CNN) per analizzare pattern video (posture, tempi di reazione).

-Reti neurali ricorrenti (LSTM/GRU) per prevedere sequenze di gioco o schemi avversari.

-Modelli di Reinforcement Learning per ottimizzare tattiche (simulazioni "what-if" in scenari di pressing, posizionamento su corner, etc).

-AI generativa per creare "set-piece design" come nel caso di Liverpool con TacticAI.


RISULTATI E DECISION MAKING (DECISION LAYER)
-Dashboard interattive in tempo reale (Tableau, Power BI, piattaforme custom).

-Suggerimenti in linguaggio naturale (NLP) per allenatori e analisti.

-Integrazione con sistemi di video-tagging per revisioni rapide.

-Alert predittivi ("Probabilità infortunio muscolare >70% → ridurre carico allenamento").



ESEMPIO TACTIC AI
Dataset: XXXX corner analizzati.
Input: posizione iniziale giocatori, pattern di corsa, esito azione.

Modello: CNN + GNN (Graph Neural Networks) per capire relazioni spaziali.
Output: raccomandazione su disposizione ottimale e traiettoria cross.


ESEMPIO RECRUITMENT AI
Sistema: motore di ranking multi-criterio.
Variabili: xG creato/subito, pressing effectiveness, infortuni passati, adattabilità tattica.

Tecnica: Analytic Hierarchy Process (AHP) + ML per pesare criteri in base al contesto di mercato.
Uso: trovare giocatori in campionati meno seguiti con profilo simile a target di mercato.

ESEMPIO GENIUS SPORTS DRAGON
Tracking: 10.000 punti corpo per giocatore, 200 Hz.
AI: modelli di riconoscimento movimento per calcolare velocità tiri, traiettorie, distanze.

Output: highlight in-game con overlay dati per tifosi allo stadio e social.


ESEMPIO CROWD INTELLIGENCE E TACTICAL SIMULATION
AI basata su agent-based modeling per simulare movimenti dei tifosi nello stadio e ottimizzare uscite e servizi.

Tattiche: simulazioni Monte Carlo di possibili sviluppi d’azione in base a posizionamento iniziale.


METRICHE AVANZATE
-xG (Expected Goals) e xA (Expected Assists): calcolati con modelli di regressione logistica su migliaia di tiri.

-EPV (Expected Possession Value): valuta quanto un’azione aumenta la probabilità di segnare.

-PPDA (Passes per Defensive Action): misura l’intensità del pressing.

-Load Index: combinazione di accelerazioni, decelerazioni, impatti, durata sforzo ad alta intensità.

-Recovery Time Prediction: ML per stimare tempi di recupero infortunio, usando dati biometrici e di allenamento.

-Psychometric AI Profiling: analisi di video-interviste e comportamento non verbale per valutare resilienza, empatia, leadership.


T'interessano altri articoli su storie sportive(doping, scandali, suicidi, partite vendute, etc) e scommesse?
Qui trovi l'indice completo ed aggiornato del blog:  Indice Storie Sportive(Doping, Suicidi, Partite Vendute, Stake, etc)

giovedì 27 aprile 2023

Migliori Statistiche Di Sabermetrica (MLB)

In questo articolo vedremo le migliori stats sabemetriche inerenti la MLB. Premettendo che per un pitcher le statistiche che danno un quadro generale sono ERA, ER (punti subiti non considerando gli errori della difesa), WHIP, K/9, IP/GS, CG, QS (quality start), SHO (se un pitcher non subisce punti) e per un battitore R, RBI, HR, AVG (solo valide), OBP (valide e basi ball ottenute), SLG (considera la potenza della battuta), OPS (somma OBP e SLG), SB (basi rubate), queste sono le stats più importanti inerenti la sabemetrica.


-wRC+ 
Le Run ponderate create sono una buona misura complessiva della battuta di un giocatore. Il plus significa che la statistica viene mostrata come rapporto rispetto alla media del campionato (100). Ad esempio, un 120 wRC+ significa che le corse create dal giocatore erano il 20% sopra la media e 70 significa il 30% sotto la media. Tieni presente che questo si basa sulla media di tutti i giocatori di posizione e non si basa sulla media di una singola posizione. Questa statistica è corretta anche per il ballpark. Le corse create, come la statistica wOBA, si basano sulla ponderazione degli eventi offensivi (ad esempio walk, hit, singolo, doppio, triplo, HR) in base alla loro relazione con le corse segnate. 


-wOBA 
wOBA è una versione modificata dell'OBP che tiene conto di come un giocatore ha raggiunto la base, invece di considerare semplicemente se un giocatore ha raggiunto la base. Il valore di ogni metodo per raggiungere la base è determinato da quanto vale quell'evento in relazione ai punti segnati previsti (ad esempio un triplo vale più di un doppio che a sua volta vale più di un singolo).


-OPS+
On Base % Plus Slugging % (OPS) era una delle prime statistiche avanzate per gli hitters, ma il suo utilizzo nella ricerca sabermetrica è diminuito con l'avvento di wRC+ e wOBA. L'aggiunta di OBP e SLG insieme è in qualche modo arbitraria, a differenza delle ponderazioni più precise delle statistiche più recenti. Detto questo, l'OPS è una buona approssimazione delle prestazioni offensive nella maggior parte dei casi. Per la maggior parte dei giocatori, OPS+ è quasi uguale alla wRC+. Tuttavia, i giocatori il cui valore è sproporzionatamente correlato solo a OBP o SLG avranno deviazioni maggiori rispetto ad OPS+ e wRC+. OPS+ può essere confrontato tra epoche diverse.


-WAR
Le vittorie rispetto ad un sostituto del giocatore considerato sono un'utile misura del contributo complessivo alle W di un battitore o di un lanciatore. WAR comprende la difesa, il colpire e la corsa di base di un battitore. WAR per i lanciatori si basa sui lanci indipendenti dalla difesa e sull'effetto della leva sul bullpen. Le vittorie sono espresse rispetto ad un giocatore di sostituzione teorico, ovvero giocatori di lega minore che sarebbero chiamati a sostituire quel giocatore nel roster. B-Ref utilizza DRS (Defensive Run Saved) e Fangraphs utilizza UZR (Ultimate Zone Rating) per misurare la difesa. Il pitching tende a mostrare la più grande deviazione tra bWAR e fWAR.


-BABIP
La media di battuta sulle palle in gioco è una statistica utile per misurare la sostenibilità delle prestazioni di un battitore o di un lanciatore. BABIP include le palle battute buone ma esclude gli HR; il denominatore esclude le battute che terminano con strikeout, walk, HR e hit by pitch. BABIP richiede un periodo di tempo molto lungo per stabilizzarsi come statistica. Di conseguenza, il BABIP sia per i lanciatori che per i battitori tende ad essere volatile (cioè soggetto a sostanziali variazioni casuali di anno in anno). Il BABIP medio per i lanciatori è concentrato in un intervallo relativamente ristretto tra .290 e .300. In genere ci si aspetta che i lanciatori regrediscano nella direzione del BABIP medio della lega. La gamma di BABIP sostenibili per i battitori è più ampia di quella per i lanciatori. Questo perché i battitori hanno un livello più personalizzato di BABIP sostenibile, basato sulle loro caratteristiche di palla battuta e abilità nel colpire. Varie formule x-BABIP (expected BABIP) vengono utilizzate per stimare la probabilità di regressione di un battitore. In alternativa, se un battitore ha una lunga storia di BABIP, il suo BABIP medio di carriera può essere utilizzato come target di regressione.


-FIP e x-FIP 
Queste statistiche di lancio, indipendenti dalla difesa, sono utilizzate da Fangraphs. Fielding Independent Pitching (FIP) e x-FIP sono intesi come una misura della prestazione di un lanciatore non influenzata dalla difesa dietro di lui (in realtà viene considerata una difesa "media", livellando le prestazioni). FIP si basa su K%, BB% e HR per 9 inning. Ciò riflette i risultati del lancio che sono maggiormente sotto il controllo del lanciatore. x-FIP normalizza i tassi effettivi per le flyball, ciò riflette la convinzione che i fuoricampo di un lanciatore per palla al volo regrediranno alla media del campionato. La FIP si basa sul fatto che sia nel campo interno che esterno eventuali tuffi e velocità dei difensori possono influenzare tanto, forse troppo, l'ERA di un giocatore (a parità di lancio e battuta effettuata).
ERA-, FIP- e xFIP- con il segno meno indicano che la statistica è aggiustata per ballpark e campionato, il che significa che 100 è la media del campionato in un ballpark neutrale e ogni punto in meno è un punto percentuale migliore della media del campionato. Quindi un lanciatore con un FIP di 90 ha un FIP che è di 10 punti percentuali migliore della media.


-SIERA 
Questa è un' ERA inerente le abilità di un pitcher. SIERA utilizza una formula più complessa rispetto a FIP e x-FIP. Essa riflette sia le caratteristiche indipendenti dalla difesa della x-FIP sia le caratteristiche aggiuntive delle palle battute. In molti casi, il SIERA di un lanciatore è quasi uguale al suo x-FIP. Tuttavia, SIERA è una metrica migliore per alcuni lanciatori che fanno affidamento sull'eliminazione sopprimendo o inducendo determinati tipi di palle battute. SIERA è più predittivo dell'ERA sul futuro anno rispetto a FIP o x-FIP.


-RE24 
Questa statistica appartiene a quelle inerenti la probabilità di vincita e sta per Run Expectancy24. Ci sono 24 possibilità di base ed out (ad esempio, corridore in 1a e 3d con 2 outs è uno stato di base out). Per il risultato di ciascuna apparizione al piatto, RE 24 calcola la variazione risultante nella probabilità di segnare uno o più punti nell'inning. RE 24 riassume l'impatto del giocatore sul punteggio previsto nel corso di una stagione e riflette una Run superiore al valore medio. RE24 può essere utilizzato per esaminare i contributi forniti sia dai battitori che dai lanciatori. A differenza di altre statistiche avanzate sulle battute, questa statistica riconosce il valore degli out produttivi. REW è uguale a RE24, tranne per il fatto che è espresso come vittorie invece che punti.


-ISO 
Questa stat è una misura della potenza di base extra di un battitore. L'ISO è calcolato come SLG% meno la media di battuta.


-DRS, UZR, TZ 
Queste sono le tre statistiche difensive avanzate più utilizzate. DRS è corse difensive salvate, UZR è l'ultimo rating di zona e TZ è la zona totale. DRS e UZR probabilmente sono più precisi di TZ, in quanto misurano per ogni zona quanto bene i difensori convertono le palle battute in eliminati. TZ ha il vantaggio di fornire stime difensive per l'era precedente al 2002.


Per approfondire:



T'interessano altri articoli su storie sportive(doping, scandali, suicidi, partite vendute, etc) e scommesse?
Qui trovi l'indice completo ed aggiornato del blog:  Indice Storie Sportive(Doping, Suicidi, Partite Vendute, Stake, etc)

giovedì 3 settembre 2020

Cosa Sono Gli Expected Goal (xG)? Il Modello Di Paul Riley e Michael Caley

Il parametro xG (o "gol attesi"), studiando eventi e caratteristiche di un tiro, indica la probabilità che si trasformi in un gol. Gli Expected Goals permettono di valutare il livello di performance determinando se una squadra (o un singolo calciatore) sta andando oltre le aspettative (over-performing: leggi fortuna) oppure sta viaggiando al di sotto delle aspettative (under-performing: leggi sfortuna), semplicemente calcolando la differenza tra gol segnati (o subiti) e gol attesi.
Il modello è ovviamente quello utilizzato negli sport americani e soprattutto nel Baseball MLB: La Sabermetrica

Esso considera:
1) Posizione del tiratore, ovvero la sua distanza dalla rete e l'angolazione sul terreno di gioco
2) La parte del corpo utilizzata (colpo di testa o di piede)
3) Tipo di passaggio, ovvero tramite possesso palla, cross o azione
4) Tipologia di attacco (se scaturito dal possesso palla, da un rimpallo, con la difesa schierata o a seguito di un dribbling)

Ogni tiro viene messo a confronto con migliaia di altri tiri dalle caratteristiche simili, per determinare le probabilità che tale tiro si trasformi in un gol. Tale probabilità rappresenta il totale dei gol previsti. Un xG pari a 0 indica certamente un gol mancato, mentre un xG pari a 1 indica un gol certo. Un xG di 0,5 indica che su 10 tiri identici è previsto che il 50% diventino gol (5 su 10).
Ad esempio, mettiamo che da un determinato punto siano stati effettuati 20.000 tiri dello stesso tipo e di questi 2.000 sono diventati goal: avremo un 10% di possibilità di successo e un conseguente 0,1 xG, indipendentemente dal fatto che il tiro abbia inquadrato la porta oppure no, sia terminato in rete oppure no. Se il tiro va in goal, avrò un goal rapportato allo 0,1 xG.
Il valore è sempre compreso tra 0 e 1, nel caso di una posizione da cui si segna sempre: se il tiro parte dalla linea di porta avremo 0,99 xG, perchè comunque son capitati errori a porta vuota, quasi sulla linea di porta e ciò abbassa la media. Un altro esempio sono i calci di rigore, analizzati su un vastissimo campione di dati, perchè la posizione (e la situazione di gioco) da cui vengono calciati è sempre la stessa: la media di realizzazione è di poco più di 3 su 4, quindi l'Expected Goal (xG) sui calci di rigore si aggira sempre intorno allo 0,79.
Per fare un ulteriore esempio, ipotizziamo un'azione che porti al gol:
-il primo tiro partito da x distanza viene parato dal portiere vale 0,37 xG
-il secondo tiro con il portiere spiazzato, ma con il difensore pronto a intercettarlo, vale 0,68 xG
-il tiro quasi a porta vuota che porta al gol vale 0,81 xG
La somma di questi 3 tiri restituisce un risultato di 1,86 gol previsti, anche se è ovviamente impossibile segnare più di un gol con una singola mossa. Per risolvere questo problema, troviamo la probabilità con cui la squadra in difesa non conceda un gol in questo scenario di possesso palla e si andrà a sottrarre la % di probabilità dal coefficiente 1 (portando il valore complessivo dell'azione sotto 1).
Esistono tantissimi modelli di xG che utilizzano tecniche e variabili simili, tentando di raggiungere la medesima conclusione.


MODELLO DI PAUL RILEY
Tra i maggiori studiosi di questo sistema c'è Paul Riley che ha elaborato un modello di Expected Goals unicamente per la Premier League. Riley ha abbandonato l’idea di considerare tutti i tiri, ma ha preso in esame solo i tiri in porta (se un tiro non finisce nello specchio della porta non può nemmeno trasformarsi in un gol).
Gli altri fattori determinanti nel modello di Riley sono la posizione e la tipologia del tiro. La posizione è fondamentale nel calcolo in quanto Riley esaminando un campione di 13.000 tiri in porta, ha diviso il campo in 46 differenti settori, calcolando per ognuno di essi la probabilità che ha un tiro in porta scagliato da quel determinato settore di terminare in rete. Infine la tipologia del tiro, distingue tra tiro su azione, su punizione diretta o su calcio di rigore.
La pubblicità del modello di Riley consiste nel fatto che chiunque può verificare i risultati (aggiornati periodicamente) del modello e verificare i dati sugli Expected Goals di tutte le squadre di Premier League e di tutti  i calciatori con almeno un tiro in porta in stagione, semplicemente consultando dei grafici interattivi.
Per ogni calciatore (e squadra) vengono stimati gli xG "virtuali" (se gli xG virtuali sono minori dei reali, vuol dire che quel calciatore sta andando oltre le sue possibilità quindi nel tempo potrebbe calare. In poche parole: prende tiri difficili e li sta realizzando).


MODELLO DI MICHAEL CALEY
Un altro modello è quello di Michael Caley. Nel corso degli anni Caley ha aggiornato costantemente il suo modello, modificandolo e perfezionandolo.
Rispetto a Riley, Caley considera tutti i tiri, senza distinzione tra quelli fuori e nello specchio della porta, suddividendoli a secondo della tipologia,  ma senza tenere conto di rigori e, come del resto anche Riley, autoreti. Il suo modello distingue tra 6 tipologie di tiro e a ciascuna di esse corrisponde una differente equazione:

1) Tiri da punizione diretta
2) Tiri conseguenti ad un dribbling sul portiere
3) Tiri di testa assistiti da un cross
4) Tiri di testa non assistiti da un cross
5) Tiri non di testa assistiti da un cross
6) Tiri non di testa non assistiti da un cross

Viene preso in considerazione: la distanza dalla porta e l’angolo di tiro (sotto forma di "angolo relativo di tiro").
Nei suoi studi Caley ha dimostrato la superiorità delle palle filtranti e della danger zone come componenti determinanti della qualità dell’assist, in termini di probabilità di conversione dell’occasione creata.
Le ricerche di Caley hanno dimostrato matematicamente e statisticamente tutta l’inefficienza dei cross.
Un'altra differenza risiede nella tipologia di azione offensiva (ad esempio contropiede o possessi consolidati) che anche una misura indiretta della pressione difensiva, uno dei più importanti fattori che allo stato attuale sono tenuti in considerazione solo indirettamente dai modelli pubblici di Expected Goals. Invece le "big chances" sono le occasioni che ci si aspetta vengano convertite, il dribbling prima del tiro e gli errori difensivi tutti fattori che solitamente incrementano la probabilità di segnatura. Infine Caley prende anche in considerazione l’abilità di finalizzazione del singolo giocatore, misurata tramite una regressione.
A causa della regressione verso la media, possiamo quindi dire, in base a quanto la performance attesa si discosta da quella osservata, se la squadra in esame subirà realisticamente gli effetti della regressione e valutare quanto e in quale direzione essi potrebbero influire.
Tuttavia va considerato che durante una partita, non tutte le azioni pericolose si traducono in un tiro e che quindi i gol attesi tendano a sottovalutare la pericolosità complessiva delle occasioni create. Per via di questo sono stati quindi creati modelli in grado di integrare i modelli basati sui tiri calcolando la pericolosità dei passaggi in termini di xG, oppure veri e propri indice di progressione della palla nel campo da gioco (quindi anche tramite dribbling e conduzione del pallone), come nel caso del BPI ideato da Daniel Altman.


PREMIER LEAGUE 2019/2020
Come sappiamo dopo 30 anni, il Liverpool è ritornato campione d'Inghilterra, grazie al Chelsea che ha battuto il Manchester City terminando la corsa al titolo.
Secondo la classifica dei gol atteso (xG), i Reds non sarebbero campioni, malgrado i 18 punti di distacco sulla seconda con cui hanno dominato il campionato inglese.
Come si può vedere, secondo le statistiche, il Manchester City avrebbe dovuto diventare campione della Premier League.
Non è cambiata solo la corsa al titolo. Il Newcastle figura ultimo in classifica malgrado invece nella realtà abbia chiuso appena sotto la metà classifica.
Invece il Bournemouth secondo xG si sarebbe salvato.
Per maggiori info: UnderStat (EPL)


T'interessano altri articoli su storie sportive(doping, scandali, suicidi, partite vendute, etc) e scommesse?
Qui trovi l'indice completo ed aggiornato del blog:  Indice Storie Sportive(Doping, Suicidi, Partite Vendute, Stake, etc)

venerdì 5 ottobre 2018

Normalizzazione Della Fortuna/Sfortuna Nel Baseball: FIP, BABIP, WPA, WAR

Il concetto che sta alla base della Sabermetrica nel Baseball si riferisce alla normalizzazione delle statistiche con il passare del tempo.
Se io lancio 6 volte una moneta in aria e mi esce 6 volte croce, la settima volta potrebbe uscire nuovamente croce ma all’infinito il tutto sarà normalizzato: la probabilità che esca "testa" o "croce" sarà simile al 50% (poco più o poco meno).
Vincere senza considerare le statistiche quindi andando a "senso" è possibile, infatti non tutti quelli che vincono lo fanno tramite la Sabermetrica, tuttavia  il loro successo non è duraturo nel tempo.
La fortuna entra molto in gioco, ma solo nel breve termine.
A lungo termine avviene la normalizzazione.
E le normalizzazioni di solito sono spettacolari perchè prevedono esplosioni o crolli improvvisi (sbagliato parlare di "slump" perchè questo termine si usa per lunghe serie negative ma di giocatori forti, non certo sorprese).


FIP-ERA
Per avere una stima qualitativa nel tempo, il modo più semplice e diretto per analizzare il rendimento di un pitcher è guardare la differenza FIP-ERA.
L’ERA (Earned Run Average) sono i punti guadagnati sul pitcher, esclusi gli errori.
Si calcola moltiplicando i punti concessi dal proprio lanciatore per 9 (inning totali di una partita) diviso gli inning lanciati.
Come già detto gli errori (della difesa) non vengono conteggiati.
Banalmente più bassa è l’ERA, migliore è la prestazione del lanciatore.
La FIP (Fielding Independent Performance) invece comprende le statistiche non controllabili dalla difesa (cioè messa in gioco la palla, è compito della difesa quello che succede dopo).
Questa stat utilizza solo K, BB e HR e quindi stima l’ERA di un lanciatore con maggiore efficacia dell’ERA stessa (X è una costante posta a 3.20).

La formula è:  (13*HR+3*(BB+HBP)-2*SO)/IP + X

Anche qui, ovviamente, minore è la FIP e migliore è stata la prestazione del lanciatore.
Quelli col differenziale positivo più alto tra FIP ed ERA hanno ottenuto risultati migliori rispetto a quanto abbiano lanciato, quelli in negativo pur avendo lanciato bene hanno ottenuto risultati sotto la media.
Generalmente un pitcher lancia tanto meglio quanto più sono gli Strikeout (K) e minori le basi ball concesse.
Facendo un esempio una FIP di 5.50 ed un’ERA di 3.50 denotano una differenza di ben 2 punti!
Il lanciatore sta lanciando peggio  di quello che sembra, l’ERA rimane accettabile ma a lungo andare (continuando così) questa tenderà a normalizzarsi quindi le sue prestazioni a scendere di livello.
Una differenza accettabile è invece di circa 0.30 o minore: ciò vuol dire che i risultati ottenuti hanno ampiamente rispettato le performance offerte!
Se invece la differenza è negativa (FIP=6.00, ERA=6.50) ad esempio -0.50 ciò vuol dire che il lanciatore sta lanciando meglio di quello che ottiene e, a lungo andare, la sua ERA tenderà a normalizzarsi quindi a calare (migliorando le sue prestazioni reali).


BABIP (MEDIA SULLE PALLE IN GIOCO)
Per valutare i battitori, un metodo è guardare la BABIP.
Per le palla battute generalmente si  tiene conto della velocità impressa alla palla, difese  avversarie, fuoricampo (HR), Park Factors.
Una volta sottratti i fuoricampo (che sono le palle colpite con più forza, in genere), il gap fra i leader e gli ultimi si chiuderebbe ulteriormente. Quando poi includiamo l’influenza delle difese avversarie e dei Park Factors, ci rendiamo conto che la differenza di velocità della palla abbia un’influenza piuttosto ridotta sulla BABIP, più ridotta della velocità di corsa ad esempio.
Un altro fattore importante e non controllabile da lanciatori e battitori è la presenza di uomini in base. Con runners in base le difese non possono posizionarsi come vogliono ma sono soggette alla posizione degli avversari.
Uno stesso giocatore può avere un rendimento molto diverso nelle due situazioni, anche battendo con le medesime qualità e la stessa velocità di palla. Cioè la BABIP per uno stesso giocatore può essere diversa: a seconda dei giocatori presenti in base.
Quando si sommano tutte queste variabili (compresi Park Factors, fuoricampo e difese), ci rendiamo conto che i battitori hanno controllo nel lungo termine, ma quel controllo è comunque piuttosto limitato, inoltre è inibito se non addirittura cancellato dagli altri fattori nel breve termine. Insomma, per stimare l’abilità di un battitore, serve sempre un campione statistico molto ampio, ben superiore ad una singola stagione.
Riguardo i lanciatori si può dire che l’influenza dei lanciatori sulla velocità di una palla battuta valga per meno della metà degli effetti.
Cioè HR, Park Factors, qualità dei battitori affrontati e difesa hanno un impatto estremamente superiore rispetto all’abilità dei lanciatori. Chiaramente quest’abilità dei lanciatori esiste appunto, quindi nel lunghissimo periodo (molto più lungo dei battitori, circa il doppio del tempo) uscirà fuori.
All’interno di un matchup, l’influenza dei battitori conta il doppio di quella dei lanciatori.
Comprendere la natura della cosiddetta BABIP è importante per proiettare il rendimento dei giocatori, sia position players che pitchers.
Ma cosa vuol dire "media battuta sulle palle in gioco"?
Esclude dunque le basi su ball, gli strikeout ed i fuoricampo, ma include solo le palle che vengono messe in gioco da un battitore o contro un lanciatore (a seconda di chi venga analizzato).

La formula è: (H-HR)/(AB-(K+HR))

La BABIP è una componente della media battuta, quindi come OBP, SLG ed inevitabilmente OPS, delle variazioni sostanziali possono incidere molto nel rendimento offensivo.
Un hitter può migliorare il suo rendimento in diversi modi: battere più fuoricampo, ottenere più basi su ball, subire meno strikeout o migliorare la propria BABIP.
Mentre le prime 3 caratteristiche dipendono esclusivamente dal suo duello col lanciatore, la BABIP inserisce nel discorso una terza parte, ossia la difesa avversaria, e lo stesso vale in maniera opposta per un lanciatore.
Com’è intuitivo, ogni volta che si inserisce un nuovo fattore nella discussione, l’incidenza dell’abilità dei fattori pre-esistenti diminuisce. Una volta che la palla viene messa in gioco, lanciatore e battitore non possono controllare ciò che farà la difesa: le loro abilità si limitano appunto nel mettere o meno un certo tipo di palla in gioco.
Il problema fondamentale della BABIP è che è ottima a determinare la qualità delle prestazioni di lanciatori e battitori, ma non è altrettanto indicativa delle loro abilità e qualità.
Nel 2001 Voros McCracken ha pubblicato la sua DIPS (Defense-Indipendent Pitching Statistics) Theory, dimostrando che l’abilità di un lanciatore sia definita in maniera più efficace escludendo la BABIP dalle equazioni.
Sostanzialmente mentre c’è una forte correlazione di anno in anno fra le altre abilità di un lanciatore (BB, K, HR), non c’è nella BABIP, che è capace di variare notevolmente annualmente a dispetto degli altri indicatori, a volte in maniera palese.
Ad esempio è più facile prevedere l’ERA di un lanciatore nell’anno successivo usando statistiche DIPS piuttosto che l’ERA stessa dell’anno in corso, proprio perché una componente fondamentale dell’ERA è la BABIP (le statistiche controllate dall’abilità hanno una persistenza nel tempo, la BABIP non ce l’ha necessariamente).
Addirittura, come segnala McCracken, la BABIP dei position players quando lanciano non è dissimile dai lanciatori stessi (ma naturalmente i position players ottengono meno strikeout, concedono più basi su ball e più fuoricampo), e questo indica ulteriormente come sia poco indicativa dell’abilità inerente di un pitcher.
Ovviamente un lanciatore ha un certo controllo sul fatto di essere un groundballer o un flyballer (ossia uno che concede palle battute per terra o per aria), e la BABIP delle groundballs e delle flyballs è diversa ma non così diversa da coprire il disavanzo creato dai Park Factors o da un certo grado di casualità sul breve termine. Inoltre, i flyballers tenderanno a concedere un numero superiore di fuoricampo, riflettendo ugualmente le loro abilità senza dover ricorrere alla BABIP.
Chiaramente il tipo di palla battuta che aumenta la BABIP è quello delle linee.
Battere linee ha una predominanza per i battitori rispetto ai lanciatori, e siccome i lanciatori nel lungo termine tendono ad affrontare gruppi omogenei di battitori, le cifre tenderanno a normalizzarsi attorno alla media.
Come detto, l’influenza di un lanciatore sulla BABIP è minima, ma non inesistente.
Come può ridurla?
1) Essere un flyballer in un campo con un esterno molto ampio: questo permetterà di concedere tante flyballs senza aumentare necessariamente il numero di fuoricampo.
2) Essere un pitcher estremamente diverso dallo standard, come un knuckleballer.
Un lanciatore con l’80% di slider potrebbe ipoteticamente ottenere lo stesso risultato.
3) Essere un rilievo e mostrare dunque poco i propri lanci.

Come si evince, si tratta maggiormente di definizioni sulla “natura” di un pitcher rispetto alla sua abilità. Non è possibile controllare alcuni di questi fattori, che variano dal campo, al proprio ruolo, passando per il repertorio di determinati lanci che non tutti posseggono.
Per il resto l’influenza sulla BABIP di un lanciatore deriva dal campo, dalla difesa e dalla casualità (un numero particolare di bloop può cadere dentro il campo o nel guanto di un difensore).
In generale la BABIP di un lanciatore MLB sarà attorno a .290-.295.
Se un lanciatore differisce nettamente da questa media, è salutare avere un certo scetticismo nei confronti delle sue prestazioni, scetticismo che potrà essere confermato o meno solo dalla persistenza di una BABIP particolarmente bassa o alta.
Ad esempio possiamo considerare una BABIP minima di .270 e quella massima di .320.
Ciò potrebbe dipendere dal fatto che questi lanciatori abbiano la facoltà di controllare almeno in parte la loro BABIP (ad esempio esterno del campo o tipo di lanci), ma solo perché il campione statistico è sufficientemente ampio da poterlo affermare.
Se non ci sono i fattori menzionati prima come nel caso di Jeremy Hellickson, che nel 2011 da rookie ebbe .223, lo scetticismo era obbligatorio per non dire che la cifra fosse insostenibile, nonostante abbia disputato una buona stagione ed avesse ottimi difensori dietro.
In generale l’impatto della BABIP su un pitcher medio sarà inferiore a quella di K, BB e HR, anche nei casi estremi.
Un esempio dell’impatto di un ballpark su un lanciatore può essere portato da Dan Haren, che anni fa giocò per 3 anni con gli Athletics (in un campo che sopprime la BABIP) e per 2 e mezzo coi Diamondbacks (in un campo che la aumenta): la sua BABIP con gli A’s è stata di .278, coi DBacks è stata di .298.
Ad esempio Matt Cain al suo meglio (quando giocava con i San Francisco Giants) aveva .258 in casa, ma .281 fuori, dimostrando che la sua abilità nel controllare la BABIP, per quanto effettivamente esistente (è chiaramente migliore della media anche fuori casa) sia molto inferiore rispetto a quanto fatto dal campo di casa.
Il controllo dei lanciatori sulla BABIP è dunque particolarmente ridotto quando non inesistente.
Nel caso dei battitori il controllo è a sua volta limitato e soggetto a fattori diversi dall’abilità (come quelli citati per i lanciatori), ma è ben più ampio.
Ci sono giocatori che colpiscono la palla con particolare forza con regolarità (ad esempio Stanton), altri che battono linee con costanza (uno di questi era Jeter), ma quello che fa la differenza maggiore è l’abilità nell’ottenere infield hits.
Questa abilità è strettamente correlata con la velocità di corsa, quindi ad esempio Altuve essendo velocissimo è in grado di arrivare in prima base prima dell’assistenza degli interni molto più spesso della media, quindi tenderò ad avere una BABIP molto migliore della media.
Giocatori lenti e che battono la palla per aria molte volte, come era ad esempio Bengie Molina, avranno una BABIP molto peggiore.
Anche nel caso dei battitori però bisogna essere scettici per via di campioni statistici ridotti: se un giocatore vede la sua BABIP esplodere in una singola stagione, come accaduto a Jorge Posada nel 2007, è relativamente facile immaginare che sia stata una casualità che non si ripeterà più.
Fondamentalmente è importante rendersi conto del fatto che nel breve termine la BABIP possa variare anche semplicemente a causa di caso e fortuna. Nel breve termine ed in stagioni singole, il significato della BABIP è virtualmente nullo. Nel lungo termine non mentirà, ma sarà comunque soggetta alla grossa influenza dei Park Factors e difesa prima ancora che all’abilità dei lanciatori stessi.
I lanciatori non possono esercitare tanto controllo sulla BABIP.
I battitori invece posso farlo molto di più, ma anche loro sono soggetti a variazioni in stagioni singole che potrebbero non essere indicative del loro reale talento, ma in entrambi i casi i giocatori tenderanno a normalizzarsi secondo le medie in carriera nel medio e nel lungo periodo.
E’ importante studiare le caratteristiche dei giocatori e dei loro ballpark per analizzare cosa potrebbe contribuire a variazioni nella BABIP.
In generale se la BABIP e è troppo elevata, calerà, se è troppo bassa salirà.
Tende a convergere verso la media generale di .298 o verso la teorica media personale, ma giocatori che battono tante  line drives riescono a stare poco sopra.

Generalmente:
- Quasi il 100% di popups sugli interni diventa un out.
- Oltre il 70% di groundballs è un out.
- Per le flyballs sugli esterni che diventino out la % è poco più alta.
- Il 25% di line drives è un out.

Se uno batte tante line drives, allora la sua media battuta dovrà alzarsi
Come può alzare la propria media battuta un hitter? Intanto evitando gli strikeouts (mettere la palla in gioco concede sempre la possibilità di arrivare in base, magari anche con battute scadenti per eventuali errori) e cercando di battere tante linee.
Chiaramente c'è un limite alle linee, e quindi l'altro modo è battere fuoricampo.
Cosa devono fare i pitchers allora per disinnescare gli hitters? Fare tanti strikeouts e tenere le palle per terra (o ottenere popups), visto che le groundballs non diventano HR. 
Ovviamente però le groundballs, anche se hanno poche chances in più rispetto alle flyballs di diventare valide, permettono tanti DP. 
Un pitcher che fa pochi K potrebbe sopravvivere con le groundballs, che al massimo si trasformano in singoli (le flyballs invece se non vengono prese possono diventare HR facilmente) e raramente in doppi, e che spesso gli danno dei doppi giochi.
Ad esempio BABIB  oltre i .350 son destinare a crollare e a normalizzarsi sui .300
Valori molto elevati si normalizzeranno più lentamente (quindi le prestazioni continueranno a rimanere buone), nel caso un battitore realizzi appunto tante linee (o groundballs trasformate in infield singles).
Se la BABIB elevata è invece influenzata da flyballs che diventano tanti HR, il crollo di prestazioni sarà più veloce.
Se un giocatore (non molto veloce) ha una BABIP molto elevata con il 60% di groundballs, allora si normalizzerà subito verso il basso.
Togliendo per forza di cose, gli HR dalle considerazioni:
- Una flyball è valida il 17% di volte
- Una groundball lo è il 24% di volte
- Una linea il 72%
- Un popup il 2%

Ovviamente le flyballs, anche se producono meno valide, producono una SLG superiore rispetto alle GB. 
Detto questo, il 7% di efficienza di differenza non viene coperto dalla differenza in SLG. 
Le flyballs sono sempre migliori perchè possono finire fuori. Una volta inclusi gli HR, torniamo al fatto che le FB siano valide circa il 25% di volte, e chiaramente gli HR sono preferibili (ed è per questo che è preferibile avere un groundball pitcher).
Insomma, i groundball hitters sono preferibili, ma l'ideale è avere un flyball hitter dotato di potenza.
La BABIP può abbassarsi, battendo meno groundballs, ma è sempre da relazionare alle flyballs (quindi agli HR) ed ai popups.
Perdere in singoli ed aumentare in modo congruo gli HR rimane la BABIP inalterata.
Flyballs poco potenti di solito si trasformano in popups. 


WPA
In ogni momento di una partita c'è una determinata probabilità di vittoria (Winning Probability). 
Ogni giocata aumenta o diminuisce la probabilità, e quindi ogni giocata fornisce una WPA (Winning Probability Added) che può anche essere negativa. 
E' chiaro che sul 9-0 nella parte alta del nono ci sia una possibilità di vittoria, mentre sullo 0-0 ce ne sarà un'altra. 
E' dunque chiaro che una valida avrà un peso diverso in ciascuna delle due situazioni.
La WPA di una valida in situazione di pareggio sarà dunque maggiore.
Questa metrica evidenzia chi ha maggiormente contribuito, in quanto hitter, alle probabilità di vittoria della propria squadra. 
Ogni AB ha una sua clutchness o una sua importanza.
Esiste la WPA+, ossia il contributo in positivo alle vittorie della propria squadra.
Esiste la WPA-, ossia il contributo in negativo.
Ed infine c'è la WPA, che è il saldo delle due cose.
Ad esempio una WPA+ di 3.80 di WPA+ e -4.40 di WPA-, ha un saldo di -0.60 di WPA. 
In questo caso c'è un contributo negativo di -0.60 vittorie durante l'anno (o 0.60 sconfitte).
Questa metrica soppesa valide nei momenti chiave e K o comunque out in momenti altrettanto chiave, facendone una media per entrambi e poi il saldo. 
Paradossalmente potrei avere una WPA+ alta ed una WPA- altrettanto alta (quindi negativa) ma il saldo totale è quello che conta.
Fangraphs pubblica anche la "clutchiness" in cui soppesa l'OPS basandosi sulla WPA perchè giustamente un singolo in un momento delicato è clutch. 
Ma un doppio o triplo è meglio e quindi va considerato.


WAR
La sigla sta per "Wins Above Replacement", sostanzialmente questa stat riassume i contributi totali di un giocatore alla propria squadra in una statistica. 
Cioè se perdo un giocatore per infortunio o lo metto in panchina, sostituendolo con un altro, quanto ci perdo? 
Ad esempio potremmo dire che X giocatore vale +6 vittorie alla sua squadra, mentre il giocatore Y vale solo +3.5 vittorie.
Il confronto di stats offensive tra due giocatori è utile, ma riduce il contributo potenziale che un giocatore può ottenere salvando le esecuzioni in difesa con tuffi e in generale giocate difensivi. 
La WAR è un semplice tentativo di combinare il contributo totale di un giocatore in un singolo valore.
Forse uno degli aspetti più controversi della sabermetrica è il modo in cui viene utilizzata la WAR. Data la natura del calcolo e gli eventuali errori di misurazione, la WAR dovrebbe essere usata come guida per separare i gruppi di giocatori e non come una stima generica. 
Ad esempio, un giocatore con 6.3 WAR e uno con 6.1 non possono essere distinti: i valori sono troppo simili.
Tuttavia, un giocatore con 6.6 WAR e un giocatore di 4.3 WAR sono abbastanza diversi da poter dire con uno alto grado di sicurezza che il primo è stato sicuramente più prezioso del secondo.
Per i giocatori di posizione, il più grande punto interrogativo è il misurare la difesa e stimare il giusto posizionamento. Le misure di entrambi sono più incerte rispetto a quelle offensive, quindi buoni difensori hanno probabilmente una maggiore incertezza intorno al loro valore di WAR rispetto a giocatori che hanno un valore difensivo più vicino alla media. 
Usare correttamente la WAR è difficile perché richiede di pensare in modo più astratto rispetto ad altri aspetti della vita. Il valore esatto è importante sino ad un certo punto: ciò che conta (come molte stats sabermetriche) è il valore di base (cioè la media). 
La media WAR dipende anche dal ruolo.
Un giocatore medio vale circa 2 WAR, mentre i giocatori medi non titolari contribuiscono molto meno (tipicamente tra 0 e 1 WAR). Anche gli starters medi valgono circa 2, mentre i rilievi sono considerati superbi con +1 di WAR.



FORTUNA E SFORTUNA
Ovviamente ad un hitter non gli si può chiedere di battere valido. Gli si può chiedere di colpire bene la palla, di battere più linee. Poi magari batte una linea dritta nel guanto dell'esterno. 
Il difensore magari la prende al volo con un gran tuffo, viene prodotto un out, il battitore dunque ha fallito? Ovviamente no. 
Le linee diventano valide circa il 75% delle volte. 
Le groundballs circa il 25% (1 su 4). 
Le flyballs circa il 15% (quando non sono HR). 
Questo significa che uno può essere sfortunato e battere delle linee che vengono prese al volo, mentre un altro è fortunato e batte un popup (che diventa valido il 2% delle volte) e questo cade tra 3 difensori. Ma nel lungo termine, se il primo continua a battere linee ed il secondo continua a battere popups, è evidente che qualsiasi statistica andrà a normalizzarsi.
Popups che cadono sono negativi per un lanciatore e positivi per un battitore ma paradossalmente, continuando su questa strada, il lanciatore vedrà migliorare le sue medie il battitore no.  
Un pitcher deve fare strikeouts, per non mettersi nelle mani della fortuna. 
Al di là della qualità del lancio però le palle messe in gioco, possono sempre trovare buchi nella difesa. Succede. 
Ad esempio se un giocatore battesse 4 su 4 con 4 popups che hanno tutti la fortuna di cadere tra difensori accorrenti e su uno riesco ad ottenere un doppio perchè due difensori si scontrano, a fine giornata, avrò come rendimento 1.000/1.000/1.250 (AVG/OBP/SLG). 
Questa riga descrive i risultati oggettivi che io ho ottenuto, perchè che piaccia o no ho battuto 3 singoli ed un doppio.
Le peripherals (statistiche periferiche) invece descrivono il rendimento di un giocatore, quindi permettono di capire meglio quanta fortuna/sfortuna il giocatore abbia avuto, e come si possa proiettare nel futuro, o cosa debba cambiare nel suo approccio. 
Un giocatore di questo tipo (per altro con stats fenomenali, per quanto si tratti di una sola partita) che batte solo popups, denoterebbe una fortuna incredibile. 
Una statistica periferica interessante per gli hitters è la LD%, ossia la % di palle colpite che si trasformano in line drives (come si sarà capito il tipo di battute che ha più possibilità di diventare valida). Se uno vuole alzare la propria media in battuta, deve aumentare le linee. 
Se uno ha una alta BA (battering average) ma una bassissima LD%, allora è stato molto fortunato, e la sua BA si normalizzerà verso il basso. 
In quel caso, le sue statistiche (la sua BA, nell'esempio) sono positive, ma le sue periferiche indicano che non abbia giocato tanto bene quanto il rendimento mostrerebbe.
Per i pitchers si può parlare della GB%, o del rapporto K/BB o anche (ma molto meno rispetto agli hitters) della LD% concessa.


T'interessano altri articoli su storie sportive(doping, scandali, suicidi, partite vendute, etc) e scommesse?
Qui trovi l'indice completo ed aggiornato del blog:  Indice Storie Sportive(Doping, Suicidi, Partite Vendute, Stake, etc)

giovedì 10 maggio 2018

Daryl Morey e Le Statistiche Avanzate In NBA: Moreyball

"Someone created the box score and he should be shot"

Daryl Morey, informatico, ha preso le redine degli Houston Rockets dal 2007.
Laureato in informatica e specializzato in statistica, Daryl Morey è un innovatore per quanto riguarda le statistiche avanzate in NBA (Advanced Stats).
Le sue squadre si costruiscono con metodi analitici e statistici.
Nel mondo del Basket ha creato la % reale che dà maggior peso al tiro da 3 rispetto al tiro da 2 e ha sempre visto di cattivo occhio tiri poco remunerativi come i "Long Two".
Cioè niente tiri dal perimetro: o da 3 o penetrazioni.
Il suo stile di gioco è stato soprannominato “Moreyball” gioco di parole con Moneyball (di Billy Beane e degli Oakland Ahtletics, siamo in MLB).
Non a caso le squadre costruite da Morey sono sempre incentrate sul tiro da 3.
Va sottolineato però che Dean Smith, leggendario coach di North Caroline, già negli anni 50 parlava di punti e possessi.
Tra le mansioni di Smith c’era quella di comunicare ai giocatori due informazioni, all’intervallo e alla fine di ogni incontro: i punti segnati e quelli subiti, in relazione ai possessi giocati.

Charles Barkley (telecronista ed ex campione dei Rockets): "Morey è uno di quegli idioti che pensano solo alle statistiche. Ho sempre pensato che le statistiche siano merda.
Se Morey entrasse in questa stanza non saprei riconoscerlo.
Non ho mai messo i Rockets tra le contender per il titolo perché non lo sono, avere buone statistiche difensive non vuol dire essere una buona difesa, hanno concesso 118 punti (contro i Suns) e nessuna buona difesa concede 118 punti.
Sono stati una squadra mediocre per anni, poi hanno preso Harden e Howard pagandoli molti soldi. Ora parlano di statistiche, analytics e cose simili, ma se si basano solo su questo è chiaro che non hanno mai giocato a Basket e non hanno mai rimorchiato una ragazza all’high school"

Comunque PER (Player Efficiency Rating), Offensive Rating, Defensive Rating, etc sono molto utili per analizzare un team o un giocatore a 360 gradi, mettendo in luce dati inimmaginabili se portati all’estremo nel loro utilizzo.


PLAYER EFFICIENCY RATING (PER)
Il PER è una versione più sofisticata della classica Valutazione.
Tiene infatti conto di quasi tutti i parametri della Valutazione, ma, attraverso una serie di fattori e l’introduzione del Pace (Ritmo) di squadra e di Lega, permette di avere un valore univoco di riferimento, posto pari a 15.00 (valore oltre 25.00 è da MVP); in questo modo è possibile confrontare l’efficienza di tutti i giocatori, dato che il loro apporto statistico è normalizzato su una scala comune.
I contributi difensivi sono limitati a palle rubate, stoppate e falli commessi: quindi il classico giocatore 3&D che produce poco in attacco avrà maggiori difficoltà a raggiungere alti valori PER, ma questo non significa che non sia utile quando è in campo.


OFFENSIVE RATING
Il valore dell'Offensive Rating di una squadra (o di un singolo giocatore) equivale ai punti segnati da questa su una base di 100 possessi.
L'Offensive Rating rappresenta meglio l'efficienza offensiva di una squadra rispetto alla più semplice " Punti segnati per Partita ".
Questo perchè, a seconda del tipo di gioco e del ritmo, una squadra può giocare più o meno possessi a partita.
Una squadra che gioca con un ritmo più alto tenderà a segnare sempre più punti di una squadra con un ritmo più basso, ma ciò non vuol dire che questa abbia un attacco migliore.


DEFENSIVE RATING
Numero di punti concessi da una squadra o da un giocatore agli avversari ogni 100 possessi.
Si ipotizza che i cinque difensori in campo siano equamente bravi a forzare palle perse e ostacolare tiri e si suddividono quindi i tiri sbagliati e le palle perse degli avversari in base ai minuti in campo dei singoli difensori.


POINTS PRODUCTED PER SCORING POSSESSION PER GAME
Sono i punti che il singolo giocatore riesce a produrre in base ai suoi possessi che si concludono con un tiro realizzato o tentato (da 1, 2 o 3 punti) o con una palla persa.
Trovato questo valore di punti lo si media per il numero di partite per ottenere la produzione di punti del giocatore a partita.


TRUE SHOOT PERCENTAGE
Percentuale al tiro che tiene conto solo dei tiri da 3 e dei liberi.


ADVANCED DEFENSIVE METRICS FOR NBA
Questo è il primo fondato e strutturato tentativo di quantificare l’impatto difensivo individuale di un giocatore.
La definizione di Counterpoints? «La media ponderata dei punti segnati contro uno specifico difensore, per 100 possessi».
Per comprendere l’impatto di questo studio basti sapere che si stima che solo il 10% del totale dei dati statistici attualmente disponibili riguarda la metà campo difensiva.


TIRI DAL CAMPO E PERCENTUALI
Le statistiche “Tiro da 2” e “Totale tiri” sono inutili e fuorvianti perchè tirare da 40 cm è diverso da tirare da 6 metri.
E lo stesso vale per i tiri totali dove vengono considerati anche i tiri da 3.
Vanno comparate solo conclusioni che ha senso comparare.
Dal punto di vista della percentuale, l’unico dato da fornire è quello della cosiddetta percentuale “reale”, cioè quella che dà maggior valore ad un canestro realizzato da 3 rispetto ad uno da 2 e permette di comparare davvero le percentuali di un tiratore con quelle di un centro che segna solo da sotto il canestro.
Accanto a questo dato, sarebbe opportuno fornire la cosiddetta “True Shooting Percentage”, cioè quella che mette nel conto anche i tiri liberi (con valore naturalmente inferiore ai canestri dal campo).


ASSIST
L'occhio elettronico dovrebbe determinare cosa sia o meno un assist sulla base del tempo che intercorre tra passaggio, ricezione e tiro.
Dire che ogni passaggio che produce un tiro entro “x” decimi di secondo è un assist è un dato oggettivo.
Inoltre, sarebbe il caso di tenere conto di chi riceve quel passaggio, in modo da stabilire quali sono le intese più produttive all’interno di una squadra o una lega.


RIMBALZI DIFENSIVI ED OFFENSIVI
Divisione netta tra rimbalzi offensivi e difensivi, che non hanno alcuna relazione tra di loro.
Vero che alcune doti fisiche e tecniche sono utili per catturare sia gli uni che gli altri, ma finisce lì. Quello che davvero ci interessa è invece sapere in che zona del campo i rimbalzi vengono catturati, oltre che da chi.
Le telecamere di cui abbiamo parlato ci possono anche fornire quanti rimbalzi vengono presi da un determinato giocatore quando ha una possibilità oggettiva di catturare il pallone.


PALLE PERSE E RECUPERI
Non si può mischiare un brutto passaggio, una violazione di passi ed un fallo in attacco.
Non si possono considerare identiche palle perse che conducono ad un immediato contrattacco (Live Ball Turnovers) e situazioni in cui il tempo si ferma.
E’ ora di creare una tabella palle perse molto più utile rispetto ad un dato aggregato che lascia il tempo che trova.
Idem per i recuperi, naturalmente.


VALUTAZIONE E PLUS/MINUS
Un punto segnato ed un fallo subito (magari perché l’avversario lo spende volontariamente) non possono avere, mai e poi mai, lo stesso valore.


PLAYER TRACKING
Qui si raggruppano le statistiche analizzate dal sistema Sport VU, composto da sei telecamere piazzate sui soffitti di ogni arena NBA, che permette di monitorare dall’alto il movimento di ogni singolo atleta presente sul parquet di gioco.
Tutte le informazioni vengono incluse in questa categoria, che abbonda di un enorme quantità di dati utili per definire meglio le prestazioni dei giocatori, come ad esempio i tiri presi in situazioni di "Catch And Shoot" o la velocità media con cui si muovono, insieme alla distanza percorsa a partita.
Per "Drives" si intende quante volte un giocatore si avvicina a canestro all’interno dei 3 metri partendo da una distanza maggiore di 6 metri.
Sono esclusi i contropiedi ma si tiene conto di quanti punti vengono segnati ogni volta che ci si avvicina al ferro.
Spostandoci nella metà campo difensiva, invece, una statistica interessante è quella denominata "Rebounding Opportunities": cioè numero di volte che un giocatore si trova a circa 1 metro dalla zona di un rimbalzo.
Misura il numero di rimbalzi catturati da un giocatore rispetto al numero di quelli disponibili, sia se il rimbalzo è contestato da un avversario sia se è stato deviato verso un compagno.


PLAY TYPE
Questa è un'altra categoria importante delle Advanced Stats.
Qui si analizza quello che avviene in ogni giocata all’interno di una partita per produrre ciò che si è prefissati, che può essere una transizione offensiva ad esempio.
Synergy Sports cataloga tutte le azioni che prendono parte appunto in ogni situazione di gioco di ogni gara, per dare a tutti una visione maggiore su come giocatori e squadre eseguono attacco e difesa.


I 13 RUOLI
L’ingegnere Muthu Alagappan, dell’università di Stanford, ha sviluppato un modello che riconosce 13 ruoli di gioco, anziché i 5 tradizionali (il che gli è valso un premio della MIT Sloan Sports Analytic Conference); tra questi, ci sono definizioni come “Scoring Rebounder” o “Jump-shooting Ball-handlers”.

Alagappan: "Molto spesso ottengo dei risultati che, secondo me, non hanno senso da un punto di vista cestistico. Sono logici da un punto di vista matematico, ma quel che mi chiedo è dove sto sbagliando, in termini di scelta dei dati o di metriche, che porta il software a non capire quel che gli viene chiesto. Il gradino è tutto lì, il software lavorerà sempre in modo corretto, ma tutto sta nell’affidargli il compito giusto, e per farlo ricorro all’intuito"


L'ENTROPIA DELL'ATTACCO E IL TRIANGOLO DEI LAKERS
Jennifer Fewel e Dieter Armbruster, hanno condotto uno studio interessante relativo ai Playoffs 2010; creando una mappa dei passaggi, dimostrando, cifre alla mano, che il Triangolo dei Lakers (che vinsero il titolo) è il sistema migliore per distribuire il pallone, spiegando, da un punto di vista matematico, quel che Tex Winter ha sempre saputo: se ci sono cinque passatori in campo, la difesa deve prendere in considerazione un numero maggiore di potenziali minacce.
Maggiore è l’entropia dell’attacco (ossia l’apparente casualità) e maggiori saranno le chance di vittoria.


T'interessano altri articoli su storie sportive(doping, scandali, suicidi, partite vendute, etc) e scommesse?
Qui trovi l'indice completo ed aggiornato del blog:  Indice Storie Sportive(Doping, Suicidi, Partite Vendute, Stake, etc)

mercoledì 14 giugno 2017

La Sabermetrica Degli Houston Astros: Dal Tanking Al Ground Control (MLB)

Nati nel 1962 gli Houston Astros non hanno mai vinto una World Series.
Non solo, l'unica finale giocata risale al 2005, quando vennero travolti 4-0 dai White Sox.
Sono la franchigia più vecchia a non aver mai vinto un titolo.
Eppure da circa 2 anni le cose sembrano essere cambiate.
Nel 2013 chiudono con 51-111, nettamente ultimi..
L'anno successivo le cose migliorano con 70-92 ma i playoff rimangono una chimera (quarti nella loro division).
L'86-76 del 2015 li manda ai playoff, dove nelle division series perdono solo da Kansas per 3-2 (i Royals poi battendo i Mets, vinceranno le World Series).
Scorsa stagione potrebbe parlarsi di un piccolo passo indietro: l'84-78 non basta per la postseason.
Il 2017, stagione in corso, li vede guidare la West Division con un impressionante 43-18.
L'autore della trasformazione della franchigia è Jeff Luhnow, una laurea alla University Of Pennsylvania e un master alla Northwestern, studia «i mercati, le tendenze e le best practice emergenti, in ogni settore e regione, localmente e globalmente».


SABERMETRICA E VIVAIO AI ST.LOUIS CARDINALS
Sull’onda delle teorie sabermetriche, William DeWitt, Jr, proprietario dei St.Louis Cardinals, decise che era giunto il momento di cambiare l’approccio del proprio team aprendo alla nuova frontiera dei big data.
Per saperne di più vi rimando a questi articoli: La Storia Della Sabermetrica (Billy Beane e Gli Oakland Athletics) e L'Aspettativa Pitagorica Di Bill James: Proj W e Proj L
La scelta comunque cadde su Luhnow appunto.
Luhnow cominciò a lavorare sui giovani per farli crescere nei team satelliti.
Negli anni della gestione Luhnow nessuna squadra di MLB ha fatto esordire tanti ragazzi provenienti dal draft come la squadra del Missouri.
Addirittura nelle World Series del 2013 ben 16 dei 25 giocatori del roster dei Cardinals erano giocatori del progetto Luhnow.
Si aggiunse a Luhnow, Sig Mejdal, un ingegnere della NASA dedicatosi, durante la permanenza nell’ente aerospaziale, a studiare i modelli di riposo degli astronauti in modo da ottimizzare i loro periodi di sonno.
Secondo Mejdal un pilota ubriaco volava meglio di uno sobrio alla cloche (quattro ore dopo il normale orario in cui andava a letto).
Formatosi durante le estati passate a dare le carte a un tavolo del blackjack in un casino del lago Tahoe: «Chiedere carta con un 17 contro il 7 del banco non sembra giusto. Con centinaia di dollari sul tavolo sembra ancora meno giusto. Ma ciò non vuol dire che sia sbagliato».
Secondo Luhnow è l’uomo giusto con cui cominciare a lavorare su un database utile per valutare le prestazioni dei giocatori.
Tuttavia per diatribe con la dirigenza lascia la squadra del Missouri.


HOUSTON ASTROS E IL TANKING
L’occasione gli viene offerta da Jim Crane, che alla fine del 2011 ha appena rilevato gli Astros.
«Se hai informazioni migliori e più veloci dei tuoi avversari li puoi stracciare» è il credo di Crane, che in questo modo ha fatto fortuna nel settore della logistica.
A Luhnow e Mejdal non sembra vero: hanno piede libero e possono fare ciò che vogliono.
Bene, adesso perdiamole tutte
Come detto, l'ultima stagione d’oro degli Astros risaliva al 2005, con la sconfitta alle World Series contro i White Sox, che culminava un periodo in cui i texani avevano raggiunto i playoff 6 volte in 9 stagioni.
All’arrivo della nuova proprietà nel 2011 gli Astros avevano appena messo insieme la peggiore stagione di sempre, con 56 vittorie e 106 sconfitte, la quarta perdente nelle ultime cinque.
Luhnow e Crane dovevano progettare qualcosa che permettesse di accorciare i tempi, per portare la franchigia al top.
La soluzione proposta da Lunhow era di quelle che fanno venire i brividi: finora siamo andati male; bene, d’ora in poi dobbiamo andare anche peggio.
Il piano era più o meno lo stesso di quello attuato ai Cardinals: pescare a piene mani dal draft, utilizzando chiamate alte proprio in virtù dell'ultima posizione dell'anno precedente, pensando al futuro senza curarsi minimamente del presente.

«Nel 2017 non interesserà a nessuno sapere se nel 2012 abbiamo perso 98 o 107 partite. Interesserà sapere quanto saremo vicino a vincere il titolo» ribadiva Luhnow.

Ed effettivamente oggi è proprio così.
Un presente che si tradusse in 107 sconfitte nel 2012 e addirittura 111 nel 2013, l’anno che segnò anche il passaggio dalla National League Central all' American League West.
Intanto Luhnow faceva piazza pulita di qualunque giocatore avesse ancora un minimo di valore e un minimo di appeal sul mercato.
Soltanto i Mets del 1962-64, persero più partite nella storia del Baseball rispetto agli Astros nel triennio 2011-13.


GROUND CONTROL
Non si trattava solo di valutare statistiche e prestazioni sul campo, ma anche una serie di informazioni qualitative: caratteristiche meccaniche di lancio o dello swing, fisicità, salute, personalità, situazione familiare; il tutto all’interno di un database che raccoglie milioni di giocatori utili per confrontare stats e tutto il resto.
Era nato il Ground Control, situato nel cuore pulsante dell’organizzazione, la “Nerd Cave”, l’ufficio in cui Mejdal e i suoi assistenti, tra cui un ex economista della Barclays specializzato nel valutare l’andamento delle obbligazioni, rendono reale il progetto.
La progettazione ha richiesto un anno di tempo, ma ora, in linea con i desideri di Jim Crane, permette al management degli Astros di aver in tempo reale su PC e portatili una miniera di notizie sull’intero sistema Baseball, tanto da far dire a Luhnow che se prima aveva bisogno di ore per poter imbastire una trattativa di mercato adesso gli basta una rapida occhiata al Ground Control (i Cardinals furono indagati per aver hackerato questo database nel 2015).
Il sistema suggerisce lo schieramento della difesa, i match-up Pitcher-Battitore, etc.
Da qui proviene l’estremo uso dei defensive shift da parte degli Astros.
Il tanking (cioè perdere di proposito) portò per tre anni consecutivi la prima scelta al draft, più una marea di chiamate nei giri successivi.
Anche in questo caso gli Astros hanno operato tenendo fede ai propri principi, ovvero facendo cose che normalmente sembrano strane, alcune rivelatesi azzeccate, altre meno.
Nel 2012 hanno pescato Carlos Correa, un interbase portoricano di 17 anni, la cui scelta ha stupito molti.
Nonostante Correa si sia rotto praticamente subito una caviglia nel 2015 ha esordito, peraltro molto bene, in MLB proponendosi come candidato al titolo di rookie dell’anno.
Nel 2013 la prima scelta è ricaduta su Mark Appel, ad oggi, non ancora pervenuto.
Nel 2014 selezionano Brady Aiken, un lanciatore mancino proveniente dall’high school.
Dopo aver negoziato con il giocatore un contratto di 6,5 milioni di dollari lo staff medico rileva una anomalia nei legamenti del suo gomito.
Da questo momento il management comincia con Aiken un’asta al ribasso, ma il giovane lanciatore, infuriatosi per il trattamento subito, rifiuta tutte le offerte del club, non firmando l’accordo e facendo così perdere agli Astros la prima scelta.
Luhnow però si consola, perché la MLB gli offre in compensazione la seconda chiamata nel 2015 (arriverà un altro interbase, Alex Bregman da Louisiana State).
Il sistema delle Minors degli Astros diventa uno dei più importanti del Paese, ricco di giocatori e di talento, tanto che Sports Illustrated decide a giugno 2014 di uscire con una copertina forte: “I vostri vincitori delle World Series del 2017”.
Trainati da Collin McHugh, un sinkerballer rilasciato da Colorado dopo una stagione assolutamente da dimenticare (0 vinte e 3 sconfitte con 9,95 di Era), McHugh viene pescato perché qualcuno nella Nerd Cave ha notato che la sua curveball ha una velocità di rotazione superiore rispetto alla media.
Quando Brent Strom, l’allenatore dei lanciatori, glielo spiega i risultati sono pazzeschi: chiude la stagione 2014 con 11 vittorie e 2.73 di Era.
Dallas Keuchel, un altro giocatore sottostimato, il cui arrivo agli Astros è precedente alla gestione Luhnow.
Keuchel possiede una fastball piuttosto lenta, in genere sotto le 90 miglia orarie, ma sa benissimo dove piazzarla: bassa e laterale.
L’arrivo in panchina di A.J. Hinch, insieme a giocatori come Luke Gregerson e Pat Neshek, gente come José Altuve, il già citato Carlos Correa, George Springer, il fenomenale pitcher Lance McCullers Jr. porta i texani nell'olimpo del Baseball e tra le favorite per le World Series 2017.




T'interessano altri articoli su storie sportive(doping, scandali, suicidi, partite vendute, etc) e scommesse?
Qui trovi l'indice completo ed aggiornato del blog:  Indice Storie Sportive(Doping, Suicidi, Partite Vendute, Stake, etc)

sabato 14 maggio 2016

L'Aspettativa Pitagorica Di Bill James: Proj W e Proj L (MLB)

L'aspettativa pitagorica è una formula messa a punto da Bill James per stimare quante partite una squadra di Baseball "dovrebbe" vincere in base al numero di Run segnate e concesse.
Confrontando, in seguito, la %  di vittorie reali e quelle pitagoriche di una squadra si può valutare quanto fortunata sia stata una certa squadra (analizzando appunto la variazione tra le due % di W).
Insomma tramite questa formulazione si cerca di eliminare il concetto di fortuna, sfiga, caso.
E’ lo stesso Bill James ad aver inventato il termine “Sabermetrica”, ovvero l’impiego di equazioni rigorose per l’analisi di quanto accade nei campi a forma di diamante, come raccontato nel film Moneyball. James si rese conto che nello sport che amava il numero di vittorie di una squadra in una stagione poteva essere previsto con ottima approssimazione attraverso una formula che un po’ ricorda quella del celebre teorema che tutti abbiamo studiato a scuola, ovvero: il quadrato del numero di Runs messi a segno da una formazione diviso per la somma degli stessi punti e di quelli concessi, il tutto sempre rigorosamente al quadrato.
La differenza tra W “pitagoriche” ed effettive indica quali formazioni stanno ottenendo di più o di meno rispetto a quanto dovrebbero in base alle Run realizzate e concesse.
Questa discrepanza può suggerire, di volta in volta, chi può ragionevolmente lamentarsi contro il destino avverso e chi invece dovrebbero toccare ferro sperando che continui così.
Più semplicemente, la formula di Pitagora con esponente 2 è generata da due presupposti: che le squadre di Baseball vincono in proporzione alla loro "qualità", e che la loro "qualità" è misurata dal rapporto tra corse segnate e concesse. Per esempio, se la squadra A ha segnato 50 Run  e ne ha concesse 40, la sua misura di qualità sarebbe 50/40 o 1.25.
La misura di qualità per il suo avversario (squadra B), nelle partite giocate contro A, sarebbe 40/50 o 0.8. Se ogni squadra vincesse in proporzione alla sua qualità, la probabilità di vittoria sarebbe 1.25 / (1.25 + 0.8), che è uguale a 50 ^ 2 / (50 ^ 2 + 40 ^ 2), la formula di Pitagora.
L'ipotesi che le squadre di Baseball vincano in proporzione alla loro qualità non è naturale, ma è plausibile. Non è naturale perché nello sport appunto incide anche il caso/fortuna/sfortuna.
L'esponente "2" è utilizzato nel Baseball, invece adottando questa formula al Basket si sceglierà un esponente prossimo a 14, visto il ruolo minore che il caso/la fortuna gioca nel Basket.
Versioni più moderne ed accurate della formula usano 1.81 o 1.83 come esponente per il Baseball (da sostituire alla potenza 2 quindi). Usando la formula si otterrà quindi il totale di W-L (moltiplicando W in % per il numero totale delle partite giocate dalla squadra).
Salvo questioni relative ad infortuni, sospensioni e quant'altro, sarà il record di W-L di una squadra ad avvicinarsi (nel tempo) al W-L Pitagorico e non viceversa. La differenza media tra il reale e l'atteso W-L è di circa 3 partite. Le deviazioni dal previsto W-L sono spesso attribuiti alla qualità del Bullpen di una squadra. Se una squadra ha un record 40-25, ma una % di vincita di Pitagora pari o inferiore a .500, non dovrebbe essere sorprendente se il record della stessa squadra crollerà nella seconda parte di stagione. Nel 2005 i Washington Nationals avevano vinto 19 partite oltre la media .500 ma avevano un pitagorico W% di esattamente .500 Andarono 30-49 il resto della stagione per finire a .500 (quattro partite prima della loro definitiva W-L previsto). In breve, una squadra che va oltre la propria aspettativa pitagorica può essere considerata "fortunata" e una che non la soddisfa "sfortunata", ma nessuno di questi due stati perdurerà di sicuro sino alla fine.
Statistiche del 2014:





T'interessano altri articoli su storie sportive(doping, scandali, suicidi, partite vendute, etc) e scommesse?
Qui trovi l'indice completo ed aggiornato del blog:  Indice Storie Sportive(Doping, Suicidi, Partite Vendute, Stake, etc)

domenica 22 febbraio 2015

Sabermetrica In Premier League? L'Approccio Brentford


"Tra i 20.000 giocatori che vale la pena di valutare credo ci sia una squadra da titolo di 25 giocatori che ci possiamo permettere… una specie di isola dei giocattoli difettosi"

Questa è una delle frasi più celebri del film "Moneyball" di Bennet Miller (dal libro di Michael Lewis "Moneyball: The Art Of Winning an Unfair Game").
L'Arte di Vincere è un film che racconta le vicende della squadra di baseball Oakland Athletics e del suo manager Beane.
Lo svolgimento del film racconta l'assemblamento di una squadra con a disposizione un budget ridotto, basato sulle statistiche relative ai giocatori.
La scelta più difficile che Billy Beane ha dovuto fare quando ha lasciato il liceo era scegliere in quale sport fare carriera.
Scelse il Baseball e poi i New York Mets scelsero lui.
Purtroppo per tutti gli interessati, Beane avrebbe trascorso il resto del decennio, come l'operaio finale, un giocatore po-parte con un grande futuro alle spalle e un esempio tangibile di quanto sia difficile mettere un valore sul talento.
Beane trascorsa la sua carriera da giocatore, entrò nella dirigenza degli Oakland Athletics e a fine anni 90 divenne general manager proseguendo il suo lavoro e reclutando giocatori con la Sabermetrica.


SABERMETRICA NEL CALCIO?
Cosa il Calcio può imparare da Beane?
Moneyball non è, come alcuni pensano, l'acquisto di giocatori giovani con valore di rivendita.
La novità di Beane è che si rese conto che il Baseball era "nato" con le statistiche sbagliate.
Se fosse riuscito a trovare quelle giuste, avrebbe potuto trarre un vantaggio competitivo nel suo lavoro come general manager degli Oakland Athletics per compensare il suo piccolo budget a disposizione.
Il tentativo è quello di sovvertire l'ordine naturale delle cose perchè è ovvio che i migliori giocatori se li possono permettere solo le squadre più ricche.
Ciò che è importante notare è che Beane è stato in grado di trovare giocatori scartati da altre squadre e riuniti in una squadra vincente.
Il Santo Graal dello sport professionistico.

"Ci sono le metriche per ogni azienda e sport: identificarli è il trucco. E avere fiducia in loro è il prossimo passo"
"Nel Calcio c'è forte correlazione con le statistiche come c'è nel Baseball? Forse non è così forte, ma ci sono sicuramente alcune cose su un campo di calcio che hanno più valore di altre cose.
"Non sono così arrogante da andare in qualcun altro sport e dire loro come si fa"

E a questo punto in ogni discussione di Moneyball che i critici normalmente sottolineano a Beane il fatto che non abbia vinto "l'ultima partita della stagione".


DIFFERENZE
Tuttavia il Calcio non è il Baseball.
Come il Basket o l'Hockey, il Calcio è un gioco in cui ogni squadra prova ad invadere la metà-campo avversaria, al fine di segnare gol o punti.
Essi sono, per loro natura, più fluidi e i dati necessari sono più difficile da raccogliere.
L'Università di Leeds ha cercato di trovare un approccio maggiormente basato sull'oggettività per valutare i giocatori di Calcio a partire dalla metà degli anni 1990.
Questo lavoro ha attirato l'interesse della Premier League ma l'esperienza di Gerrard(professore dell'Università di Leeds) di trattare con il Calcio professionistico era simile a "sbattere la testa contro un muro di mattoni".
"Non c'era alcun tentativo di stabilire un vero dialogo e gli allenatori non erano interessati" ha detto.
"Mi hanno voluto dare loro alcuni strumenti per trovare i giocatori, ma non c'era alcuna relazione. Ero a una conferenza di recente e un analista prestazioni da un top club in realtà presentato il mio lavoro a me senza sapere da dove proviene."
Gerrard ha collaborato con Beane su alcune analisi statistiche delle partite della Major League Soccer.
Gerrard dice che il Calcio inglese è stato lento ad abbracciare le tecniche di Moneyball, ma ammette che ci sono segni di cambiamento.
Egli si servì dei Bolton Wanderers per sviluppare un sistema di screening elettronico per trovare giocatori di talento all'estero, mentre numerose altre squadre stanno espandendo le loro operazioni di analisi delle prestazioni.
Nel 2012 il Manchester City, nella persona di Gavin Fleig (direttore della Performance Analysis), ha lanciato una specie di concorso denominato MCFC Analytics, che incoraggiava i giovani analisti a sviluppare studi innovativi.
Il premio sarebbe stata l’assunzione da parte della società.
Sono nate anche compagnie che forniscono o analizzano i dati per le squadre, come Prozone (fra i suoi clienti: Arsenal, Chelsea, Bayern Monaco) o Match Analysis ma la più famosa è indubbiamente Opta, che vanta una lista infinita di clienti.


BRENTFORD
L'arteficie di tutto è Matthew Benham.
Quando furono acquisiti da lui, il club militava da anni in League One (terza serie).
Ma l'imprenditore ha da subito deciso di stanziare sostanziosi investimenti nell'intento di cambiare totalmente la dimensione del club: è stato modernizzato il centro d'allenamento e iniziata la costruzione del nuovo stadio che dalla stagione 2016/17.
Basi fondamentali del progetto è il rinnovo dell'intero settore giovanile tramite un nuovo sistema di scouting.
Il tutto, non solo giocatori ma anche risultati ed avversari sono calcolati in base all'analisi statistica dei dati. Dalla gestione societaria alla scelta dei giocatori, dallo staff tecnico alla tattica da adoperare in campo.
I risultati sono stati subito buoni.
Eliminazione nel play-off promozione al primo anno, secondo posto e conseguente accesso alla Championship (seconda serie) l'anno successivo.
L'anno scorso il Brentford, sotto Warburton (in carica da qualche anno), ha raggiunto un inaspettato quinto posto, giocando (e perdendo) la semifinale play-off contro il più quotato Middlesbrough.
Risultato che diventa ancora più prestigioso se si considera il valore della squadra stimato sui 14 milioni di sterline.
Il 'Boro per esempio ne vale 43, per non parlare del retrocesso Wigan (70).
Quest'anno sono arrivate due novità:  l'inserimento nello staff tecnico di Bartek Sylwestrzak e Gianni Vio, considerati maestri delle palle inattive.
Sylwestrzak cura molto il modo in cui vengono battuti i calci piazzati, cercando di trovare la migliore fisionomia di calcio per ogni singolo battitore.
In una squadra così attenta all'analisi statistica della partita avere la possibilità di individuare e successivamente colpire i punti deboli degli avversari su situazioni di gioco fermo è di vitale importanza, essendo questo un momento di possibile grande vulnerabilità.
L'altra novità riguarda l'assetto societario, perché è sbarcato a Londra in veste di co-direttore col compito di continuare la crescita del club, Rasmus Arkensen, uomo fidato di Benham e vero autore del miracolo Midtjylland.
Da alcune interviste è possibile capire gli elementi fondamentali della filosofia Brentford.
L'ex manager Warburton aveva il compito di ridurre il numero di adolescenti di talento che si perdono e vengono scartati nelle giovanili.
Nel mese di settembre 2013 l'accademia del club ha iniziato una collaborazione con il liceo Uxbridge che permette loro di monitorare i ragazzi tutti i giorni, sia fisicamente che con la loro istruzione.
L'obiettivo dichiarato è quello di plasmarli più come "individui" che giocatori e quindi di avere quattro o più ragazzi in prima squadra nei prossimi anni.
Verranno presi in considerazione giocatori sottovalutati da altri club, identificati da scouting e tramite analisi di alcune statistiche.
Questo sotto certi versi sarà il Moneyball del calcio e sarà supervisionato appunto da Benham e il nuovo direttore sportivo del Brentford, Frank McParland, ex direttore della Accademia di Liverpool(colui, per intenderci che scoprì Raheem Sterling, giocatore del Liverpool e della nazionale inglese).
Il tutto tramite particolari algoritmi gestiti da Benham.
Il Brentford sotto Benham ha un certo modo d'intendere il Calcio e un piano a lungo termine, già prestabilito, su come evolverà la squadra in futuro.
Anche se avessero potuto avere le finanze di Chelsea e Manchester City o José Mourinho come loro manager, si sospetta che non avrebbero voluto nè una cosa nè l'altra.
Dunque acquisto di giocatori sottovalutati a basso costo, salari bassi, metodi innovativi per quanto riguarda la battuta di corner e punizioni: questo, in poche parole, è la Sabermetrica.



T'interessano altri articoli su storie sportive(doping, scandali, suicidi, partite vendute, etc) e scommesse?
Qui trovi l'indice completo ed aggiornato del blog:  Indice Storie Sportive(Doping, Suicidi, Partite Vendute, Stake, etc)