El fútbol resiste la predicción como pocos deportes. Un balón que bota mal, una expulsión en el minuto 30, un penalti en el descuento: las variables impredecibles son tantas que incluso los modelos de inteligencia artificial más sofisticados operan con márgenes de incertidumbre amplios. Y, sin embargo, la industria de la predicción algorítmica aplicada a la Champions League no deja de crecer. Empresas de datos como Opta, plataformas analíticas herederas de FiveThirtyEight y laboratorios de machine learning universitarios generan cada temporada pronósticos que combinan estadísticas históricas, métricas avanzadas y simulaciones computacionales para intentar responder la pregunta que todos quieren resolver: cuando los datos predicen al campeón, ¿aciertan?
Este artículo explica cómo funcionan esos modelos, evalúa su precisión histórica y resume lo que los algoritmos proyectan para la Champions League 2025-26.
Cómo funcionan los modelos predictivos: de Opta a las redes neuronales
Los modelos de predicción para la Champions League se apoyan en tres pilares técnicos: datos de entrada, algoritmo de procesamiento y simulación de resultados.
Los datos de entrada incluyen estadísticas convencionales (goles, asistencias, posesión, tiros a puerta) y métricas avanzadas como los expected goals (xG), los expected assists (xA), los índices de presión alta (PPDA) y los modelos de valoración de jugadores. La métrica xG, desarrollada originalmente por Opta y refinada por múltiples proveedores, estima la probabilidad de que un disparo termine en gol según su posición, ángulo, tipo de jugada precedente y presión defensiva. Un ejemplo revelador de las limitaciones del xG lo ofreció el Barcelona en la fase de liga 2024/25: según UEFA.com, el equipo anotó 28 goles con un xG acumulado de solo 15,27, lo que significa que casi duplicó las expectativas estadísticas. Ese tipo de desviaciones es precisamente lo que los modelos intentan incorporar y lo que, a menudo, se les escapa.
El segundo componente es el algoritmo. Los modelos más simples utilizan regresión logística para estimar probabilidades de victoria, empate o derrota en cada partido. Los más avanzados emplean redes neuronales, bosques aleatorios (random forests) o gradient boosting, técnicas de machine learning capaces de detectar patrones no lineales en los datos. Un modelo de red neuronal, por ejemplo, puede aprender que la combinación de alta presión defensiva, eficiencia en transiciones y experiencia previa en eliminatorias correlaciona con un rendimiento superior en cuartos de final, sin necesidad de que un analista humano le indique explícitamente esa relación.
El tercer pilar es la simulación. Una vez que el modelo asigna probabilidades a cada enfrentamiento, se ejecutan miles —a veces millones— de simulaciones Monte Carlo que reproducen todos los escenarios posibles del torneo. Si el Real Madrid tiene un 55% de probabilidades de ganar su partido de octavos, la simulación genera miles de versiones del campeonato donde a veces gana y a veces pierde, y cuenta cuántas veces cada equipo termina levantando el trofeo. El resultado es una distribución de probabilidades: «Real Madrid, 18% de probabilidades de campeón; Manchester City, 14%; PSG, 11%», y así sucesivamente. Esas cifras no son predicciones absolutas sino estimaciones probabilísticas, y entender esa diferencia es clave para interpretar los modelos sin sobrevalorlos.
¿Aciertan las máquinas? Precisión histórica de los pronósticos algorítmicos
La respuesta corta es: aciertan más que el azar, pero mucho menos de lo que su sofisticación sugiere. Los estudios sobre la precisión de modelos predictivos en fútbol muestran que los mejores algoritmos logran asignar al eventual campeón una probabilidad previa del 15-25%, lo que suena modesto pero es significativamente superior al 2-3% que correspondería a una distribución uniforme entre 36 participantes.
El problema es que el fútbol es un deporte de muestra pequeña. Una final se decide en noventa minutos (o ciento veinte, o en penaltis), y en ese intervalo un evento de baja probabilidad puede determinar el resultado. Los modelos pueden estimar correctamente que el Real Madrid era el equipo con mayores probabilidades de ganar la Champions en 2024 y, al mismo tiempo, acertar solo porque la competición de ese año particular terminó como la probabilidad más alta sugería. Si se repitiera esa temporada cien veces, el Madrid no ganaría en todas: las simulaciones lo dicen con claridad.
Un caso paradigmático de los límites de la predicción fue la Champions 2020/21, cuando el Chelsea de Tuchel —que ni siquiera lideraba la Premier League y había cambiado de entrenador a mitad de temporada— ganó el torneo partiendo con probabilidades inferiores al 5% en la mayoría de modelos. Ningún algoritmo lo vio venir. De forma similar, el PSG era un outsider relativo en los modelos predictivos al inicio de la temporada 2024/25 (la mayoría le asignaban entre un 8% y un 12% de probabilidades), y acabó ganando la final con un 5-0 que ninguna simulación había contemplado como escenario probable.
La limitación es estructural. El fútbol, a diferencia del béisbol o el baloncesto, genera un número de eventos por partido demasiado bajo para que los modelos estadísticos eliminen el ruido. Un partido de Champions contiene entre 20 y 30 acciones de gol relevantes; un partido de la NBA, más de 200 posesiones. Esa diferencia en el tamaño de la muestra significa que el margen para el azar es mucho mayor en el fútbol, y ningún avance en potencia computacional resolverá esa limitación inherente al deporte. Los modelos pueden mejorar su calibración —asignar probabilidades más precisas al rango de resultados posibles—, pero nunca eliminarán la incertidumbre que hace del fútbol un espectáculo donde lo improbable ocurre con frecuencia suficiente como para desafiar cualquier algoritmo.
Lo que dicen los modelos para la Champions 2025-26
Para la temporada 2025-26, los principales modelos predictivos públicos sitúan al Real Madrid y al Manchester City como los dos equipos con mayor probabilidad de levantar el trofeo, seguidos del PSG, el Arsenal y el Bayern Múnich. El porcentaje exacto varía según el proveedor, pero el patrón es consistente: los modelos valoran la combinación de profundidad de plantilla, experiencia en eliminatorias y capacidad económica sostenida.
El Real Madrid, con unos ingresos que según Deloitte superan los 1.200 millones de euros, aparece como favorito en prácticamente todos los modelos, lo que refleja tanto su historial reciente como la calidad de su plantilla actual. La UEFA ha fijado el umbral de ingresos para 2025/26 en 4.400 millones de euros, con un bonus de 6,5 millones para el campeón, un incentivo que los modelos incorporan como factor motivacional marginal pero estadísticamente registrable.
Sin embargo, si algo demuestran los modelos es que la Champions League es un torneo donde la probabilidad más alta rara vez supera el 20-25%, lo que significa que el favorito pierde al menos tres de cada cuatro veces. Cuando los datos predicen al campeón, lo hacen con la humildad de quien sabe que el fútbol siempre reserva la última palabra para el césped.
