DIEGO TOMÉ CAMOIRA
Big data, scouting y estadística avanzada son algunas de las definiciones con las que el público futbolero se ha tenido que ir familiarizando durante los últimos años.
En un contexto en el que absolutamente todo es medible y el poder de los datos se ha vuelto indisociable de cualquier faceta de nuestro día a día, el fútbol tampoco ha sido una excepción, y los departamentos de scouting se han convertido en un área esencial en cualquier club de élite.
“Ahora son todos números, de fútbol hablamos poco. Hablamos de cuánto han corrido, cuánto han tirado, la velocidad de los tiros… ¡Vamos a hablar de fútbol! Es más fácil hablar de estadísticas que del juego…”, mencionaba recientemente José Luis Mendilíbar, al respecto en una charla que mantuvo junto a Vicente Del Bosque para El País.
Y es que, tal y como mencionaba el entrenador de la SD Eibar en conversación con Del Bosque, los mapas de calor de un futbolista se han convertido en un aspecto esencial en la retransmisión de cualquier partido, dejando cada vez más de lado ciertos intangibles que, siendo también cuantificables, quedan en un segundo u tercer plano a la hora de realizar un análisis táctico de un encuentro.
En el otro lado de la balanza nos encontramos a Ian Graham, director de análisis de datos del Liverpool y el encargado del departamento de Big Data del conjunto red, uno de los más importantes en el mundo del balompié mundial.
Más allá de analizar los datos de cada encuentro, la relación de Graham con el fútbol es nula. Algoritmos y estadísticas sin necesidad de ver un solo partido. Así es como se trabaja en el departamento del Liverpool y de esta forma se gestaron fichajes claves como los de Mohamed Salah o Virgil Van Dijk.
De hecho, fue un método matemático y no un ojeador quien le dijo a Jürgen Klopp que pagar 84 millones de euros por un jugador como Van Dijk no sólo no era disparatado, sino que era un precio bastante inferior al que los algoritmos daban como justo en relación a las estadísticas del futbolista holandés.
La veracidad de los ‘Expected Goals’
En esta fase primigenia de la estadística avanzada aplicada al fútbol hay un indicador que ha destacado por encima del resto a la hora de medir el buen o el mal hacer de los clubes: los denominados ‘expected goals’ o goles esperados en su forma castellanizada.
Atendiendo al número de disparos efectuados, jugadas de peligro, regates y diferentes factores computados a lo largo de un encuentro, se extrae un dato que alude al número de goles que un equipo debería materializar en situaciones normales.
Si este indicador fuese infalible, el número de goles efectivos marcados por un club a lo largo de una temporada y el número de goles esperados según los modelos matemáticos que sigue la estadística avanzada deberían coincidir año a año.
Como vemos en la serie de gráficas que añadimos a continuación, no sólo es que en contadas ocasiones a lo largo de las últimas cinco temporadas se hayan igualado los valores entre goles esperados y goles efectivos entre los clubes de La Liga, sino que la dispersión entre ambos datos, en algunas ocasiones, ha superado los 30 goles de diferencia, como ocurrió con el Fútbol Club Barcelona en la temporada 2016-17, cuando el club blaugrana materializó 116 tantos por los 84,21 goles esperados.
Bien sea por arriba o por abajo, lo cierto es que una tónica bastante habitual que podemos vislumbrar en los datos y estadísticas extraídos de la plataforma WyScout, es que los guarismos efectivos de una buena parte de los clubes de La Liga suelen estar rondando los 10 goles de diferencia con respecto a los ‘expected goals’.
Si bien en casos en los que la estadística avanzada ya espera una gran cifra de goles 10 tantos arriba o abajo puede no parecer un dato excesivamente relevante, en otros equipos para los que los métodos matemáticos apenas conceden 30 goles por temporada, suponen una diferencia de más de un tercio de los goles totales materializados, como ocurrió en el caso del Espanyol en la campaña 2016-17, con una diferencia entre goles esperados y efectivos de casi 16.
La estadística avanzada da un vuelco a la clasificación
Otro de los aspectos esenciales asociados a la estadística avanzada macro, y que refleja el devenir de los clubes en toda una temporada, es el de los ‘expected points’ o —de nuevo en su forma castellanizada— puntos esperados.
Siguiendo los mismos modelos que en el caso de los goles, y teniendo en cuenta tanto los tantos anotados como encajados que se espera de un conjunto, desde WyScout se realiza una tabla clasificatoria ficticia en torno a cómo debería acabar la temporada liguera en caso de fijarnos únicamente en las estadísticas esperables.
Lo cierto es que, si bien en los puestos altos de la clasificación apenas hay sorpresas para el período comprendido entre las temporadas 15-16 y 19-20, en lo relativo a los puestos de descenso la fiabilidad cae en picado.
Los algoritmos dieron la victoria liguera al Real Madrid en la campaña 17-18 en un campeonato que acabó ganando el Barça con gran autoridad, sacando una diferencia a los blancos de 17 puntos.
Salvo este contratiempo matemático, el resto de equipos que se han acabado llevando el alirón coincidían con los pronósticos dados por la estadística avanzada.
Si miramos hacia abajo, la situación es bien diferente. Sólo en la temporada 2016-17, coincidiendo con el descenso a Segunda de Osasuna, Sporting de Gijón y Granada, el algoritmo hizo pleno.
El resto de temporadas, en el mejor de los casos, apenas se acertó con uno de los tres conjuntos que acabaron probando las hieles del descenso, siendo el caso más curioso el de la temporada 2018-19, cuando el modelo matemático daba a Celta, Valladolid y Levante como clubes de Segunda División y quienes acabaron descendiendo esa misma campaña fueron Girona, Huesca y Rayo Vallecano.
Con sus virtudes y defectos, la realidad es que la estadística avanzada, tan presente en otras prácticas deportivas desde hace años, parece haber llegado al fútbol para quedarse, aunque aún esté en una fase primitiva y tengamos que ver qué variables son fiables y cuáles no tanto para medir lo que ocurre sobre el terreno de juego.