Abbiamo problemi con la gente.
By Roberto Salerno Posted in spotting on 15 Luglio 2017 11 min read
L’indovinello che chiudeva la terza parte della serie era abbastanza semplice e infatti non avete avuto problemi a risolverlo. Il confronto riguardava le migliori annate dei sei giocatori considerati nell’analisi. È il momento di svelare il secondo segreto. In realtà tutta la terza parte non aveva solo lo scopo di presentare i dati; ne aveva uno più subdolo, meno dichiarato, perfettamente – speriamo – rappresentato proprio dalla tabella finale. Se avete seguito i singoli ragionamenti giocatore per giocatore i casi sono due: o avete trovato ragionevole l’identificazione del “miglior anno”, “miglior triennio”, “miglior quinquennio”, “miglior novennio” del singolo giocatore oppure avete delle obiezioni. Nel secondo caso le obiezioni andrebbero esplicitate prima di leggere la quarta parte. È importante che questo avvenga in quel momento, proprio per evitare il bias che è sicuramente rappresentato dalla nostra personale preferenza per questo o quel giocatore. Nel momento in cui si ragiona su quelle tabelle noi non compariamo giocatori diversi ma sempre lo stesso giocatore in momenti diversi della propria carriera. Mentre possiamo essere indotti da simpatie o antipatie a sopravvalutare il dato di uno a scapito di quello di un altro ci sembra decisamente più complicato ritenere che preferiamo un momento della carriera di un giocatore rispetto ad un altro momento per le stesse ragioni sentimentali. Potremmo certamente essere maggiormente legati al Nadal giovane o al Federer vecchio ma ci sembra ragionevole supporre – anche se quello che sta accadendo in questi giorni con lo svizzero non può che far crescere la cautela – che, soprattutto quando i clamori si saranno sopiti, si potrà guardare la tabella di Federer o di Nadal con serena obiettività. E sapremo senza particolari problemi se il 2008 di Nadal è migliore o no del 2013 e se il 2006 di Federer è migliore di questa straordinaria annata.
Insomma, si è descritto il primo caso, quello in cui le considerazione sulle singole carriere dei giocatori siano parsi convincenti. Nel momento in cui spariscono i nomi dei giocatori, lasciando solo i numeri, finiamo col fare la stessa cosa. L’ultima tabella della terza parte va dunque considerata come la tabella di un giocatore che ha avuto nel corso dei sei anni della sua carriera quei risultati. Rivediamola, aggiungendo gli anni nella prima colonna a sinistra.
Tabella 1:
[table id=1 /]
Ci troviamo di fronte quindi ad un giocatore alfa che ha giocato gli anni A, B, C, D, E, F. Qual è stato il suo anno migliore? Cominciamo dal risultato negli Slam. I risultati sono perfettamente identici – due vittorie ed una finale – tranne che nel caso F. L’anno E ha un maggior numero di tornei di rilievo (Master 1000 o equivalenti) e il maggior numero di titoli. Rispetto all’anno C, l’anno E ha meno finali ma – oltre ad un maggior numero di tornei di rilievo – ha anche un 14-1 rispetto ai top 5 e una percentuale di partite vinte più alta (96,47% rispetto a 92, 86%). Sembra si possa tranquillamente dire che l’annata migliore tra queste sei è proprio la E.
La seconda qual è? La percentuale di vittorie degli “anni” C e D è la stessa (92,86%); in “C” abbiamo più partite e più tornei vinti ma “D” si lascia preferire per i migliori risultati contro i top5 e il maggior numero di tornei di rilievo vinti. Guardiamo il dato dell’annata A. Una percentuale di vittorie inferiore (91,11%) ma lo stesso numero di tornei di rilievo vinti in D e un risultato migliore di C con i top 5. Anche scegliere tra A e C sembra complicato ma non lo è scegliere tra A e D, visto che D è migliore in quasi tutti i parametri. Ne consegue che se c’è difficoltà tra A e C, D oltre a essere migliore di A è anche migliore di C.
Lasciamo comunque le tre annate A, C e D indefinite, ci torniamo tra un momento e guardiamo le due annate peggiori, B e F. F ha un risultato peggiore nel terzo Slam (quarto di finale contro finale) ma ha tutti gli altri parametri migliori: tornei rilevanti, tornei in generale, scontri con i top 5, percentuale di vittorie.
Possiamo concludere che i sei anni della carriera di alfa possano essere così classificati
Se la conclusione non pare convincente – soprattutto per i dubbi relativi a seconda, terza e quarta annata – è possibile far ricorso alla nostra base dati per “verificarla”. Si tratta semplicemente di passare al setaccio le varie annate per aumentare i parametri considerati. Il risultato del quarto Slam, degli altri tornei rilevanti, degli scontri con i top 10, delle partite vinte con i top 5 negli Slam. Questi ulteriori parametri non hanno la rilevanza di quelli inseriti in tabella ma possono risolvere dei dubbi. Fatelo, vedrete che la classifica non muterà.
Passiamo alla seconda tabella misteriosa.
Tabella 2. I migliori trienni
[table id=2 /]
Il nostro giocatore ha fatto un’ottima annata A negli Slam. Otto volte è arrivato in finale, sei volte ha vinto. Andata bene anche nell’annata C, anche se ha perso una finale in più. Nell’anno A ha vinto ben 13 tornei equiparabili ai “1000” contro i 9 dell’annata C, che però ha tre Master in più. L’anno A però si stacca nel numero dei titoli (32 a 28), perde un paio di partite in meno con i top 5 ha un percentuale di vittorie migliore (92,43 a 91,6). Di poco, ma alla fine sembra che l’annata A sia effettivamente la migliore. Non è male neanche l’annata B, che ha un numero maggiore di titoli, ma meno “pesanti” ed un risultato meno buono sia con i top 5 che complessivamente, anche se ha giocato più partite. Questo significa che il nostro giocatore alfa nell’anno C ha giocato più tornei ma ha raggiunto picchi meno rilevanti.
Se si guardano le altre tre annate (D, E, F) si può facilmente notare come siano tutte peggiori di quelle di A, C e B. Meno Slam, meno tornei importanti vinti, per D e E meno titoli e finali complessivi, bilancio meno buon con i top 5, percentuale di vittorie meno alta. Nello specifico l’anno meno buono è stato D, mentre tra E e F è una bella lotta perché l’annata E ha meno partite, una percentuale complessiva di vittorie più bassa dell’annata F (84,6 contro 90,4) e meno titoli, ma ha uno Slam in più e una vittoria rilevante in più. Di nuovo, come nel caso tra B e C, si tratta di due “annate” in cui i risultati diversi sono spiegabili con il fatto di aver giocato di più. A differenza che tra B e C, in questo caso propendiamo leggermente per E.
Concludendo, il nostro giocatore alfa ha disputato la sua miglior stagione nell’anno A, la seconda nell’anno C, la terza nell’anno B, la quarta nell’anno F, la quinta nell’anno E, la sesta nell’anno D.
Avrete capito di cosa tratta la tabella 2, e quindi la terza tabella ormai dovrebbe essere facilmente comprensibile.
Tabella 3. I migliori quinquenni
[table id=3 /]
* il dato del 1982 non c’è
L’annata C – che, attenzione, NON è la stessa annata C vista in precedenza – è quella con il miglior risultato negli Slam (di poco rispetto all’annata A); col maggior numero di successi rilevanti (precede di poco l’annata B); con il secondo risultato di vittorie nei tornei complessivi (dietro all’annata D); con la migliore percentuale di vittorie con i top 5 (anche se il dato del 1982 è incompleto); la miglior percentuale di vittorie complessive (91,6 contro l’89,2 di E). Insomma, è quella migliore. Possiamo anche dire che l’annata F è la peggiore. Percentuale complessiva di vittorie più bassa, risultati poco buoni, rispetto alle altre annate, con i top 5, un minor numero di tornei vinti, anche rilevanti. L’unico dato migliore di un’altra annata (la B) è quello degli Slam, seppur di poco, visto che la differenza è una finale vinta in più.
Il problema sono le annate dalla seconda alla quinta. L’annata A ha un alto numero di Slam vinti ma pochi tornei rilevanti. Confrontata all’annata E ha ben 4 finali Slam in meno, 5 titoli rilevanti in meno, 12 finali in meno, è messa un po’ meglio con i top 5 e molto peggio complessivamente. La comparazione con l’annata B è praticamente la stessa, ma il numero di Slam in meno diventa rilevante. Con l’annata D la differenza Slam è anche qui in una sola finale vinta a favore delll’annata A, il resto è tutto a favore dell’annata D.
In ossequio sia all’idea Slam centrica che a quella dei picchi B diventa la quinta annata, mentre la quarta è A. Tra annata D e annata E è quest’ultima a prevalere, sia come Slam che come titoli rilevanti e anche come percentuale complessiva. Ricapitolando il giocatore alfa ha C come sua migliore stagione; E come seconda, D come terza, A come quarta, B come quinta e F come sesta.
Inutile nasconderci ancora. L’ultima tabella riguarda la famosa “reductio a Borg”: il novennio. Di nuovo, le annate non corrispondono. O, come ormai è chiaro, il giocatore A non è lo stesso del giocatore A del quinquennio, così come il giocatore B non è lo stesso eccetera. Osserviamo la tabella 4.
Tabella 4. I migliori novenni
[table id=4 /]
* il dato del 1982 non c’è
È facile qui individuare il novennio peggiore: decisamente quello di E, che rispetto ai rivali ha meno Slam, meno tornei rilevanti vinti, meno titoli in generale e la percentuale più bassa di vittorie. I suoi 11 tra vittorie Slam e finali sono gli stessi 11 di B, che però ha vinto tre master e 22 grandi tornei, ha 70 titoli a 42 e insomma è messo meglio. C’è da domandarsi se B non possa fare partita con D, che ha “solo” due finali Slam in più ma ma meno tornei rilevanti. Il punto è che D di tornei ne ha vinti più di tutti nel periodo (86) e ha la terza percentuale di vittorie complessive. Quindi se il sesto è sicuramente E il quinto è B. D è davvero quarto? Non è certo davanti ad A che si trova con 4 finali Slam in più e con una decina di titoli rilevanti (e 4 master) in più. E neanche davanti a F che ha 4 Slam in più, più titoli rilevanti, la migliore percentuale di partite vinte in assoluto e un bilancio migliore con i top 5. Rimane C. Migliore nelle finali Slam e nei Master ha vinto meno tornei, ha una percentuale di vittorie inferiore rispetto a D ma va meglio con i top 5. Anche se il novennio tende a premiare la regolarità sembra evidente che i picchi di C siano migliori di quelli di D (in percentuale è migliore anche nel rapporto tra finali giocate e finali vinte).
Abbiamo detto che A e F erano fuori portata per D, ne consegue che, nonostante C abbia vinto il maggior numero di Slam nel periodo che per quanto il risultato sia rilevante il resto lo posiziona dietro appunto ad A e F. A ha un maggior numero di Master, più del doppio di grandi tornei vinti, una percentuale di partite vinte migliore e anche se, per quanto il dato risenta del problema dell’anno 1982, va meno bene con i top 5 la differenza non è poi così alta. Meno dubbi il raffronto con F, che ha un solo Slam in meno ma tutti gli altri dati migliori, dai tornei rilevanti, al numero di titoli complessivi, al dato con i top 5 alle percentuali di vittorie complessive. Questo significa che C è terzo ma anche che il secondo è A e il primo F.
Concludendo la classifica del novennio è F; A; C, D; B; E.
Chi si nasconde dietro queste sigle? Il giocatore che ha il triennio migliore è lo stesso che quinquennio o del novennio? O è quello dell’annata migliore? Nella prossima puntata vedremo come si sono posizionati i cinque giocatori presi in considerazione. Cinque? Non erano sei? Già, ma purtroppo per lui il giocatore che ha fatto la peggiore annata, il peggior triennio, il peggior quinquennio, il peggior novennio è uno solo: forse il risultato non è in sintonia con il sentimento di molti, ma i numeri a volte non sono freddi, sono crudeli. E hanno stabilito che potrà occupare e occuperà sempre un posto particolare nei nostri cuori, ma Andreino Agassi proprio non è il GOAT. Il suo 1999 è l’annata migliore meno buona tra quelle dei sei; il triennio 1995-1999-2001 è quello “D” della nostra tabella 2; il quinquennio 1992-1995-1999-2001-2003 è l’anno F della tabella 3; infine il novennio 1988-1990- 1992-1995-1998-1999-2001-2002-2003 è proprio il novennio E.