Modelo estadístico
El Modelo Dixon-Coles:
cómo predecir fútbol con matemáticas
El modelo que usa POISSON FC es una extensión del trabajo publicado en 1997 por Mark Dixon y Stuart Coles en la revista Journal of the Royal Statistical Society. Es el estándar de referencia en predicción cuantitativa de fútbol y la base de muchos sistemas de betting profesional.
Por qué el fútbol es difícil de predecir
A diferencia del baloncesto o el béisbol, en fútbol se marcan muy pocos goles por partido (media de 2.6 en Europa). Eso hace que el azar tenga un papel enorme: un equipo puede controlar el 70% del juego y perder 0-1 por un disparo fuera del área en el minuto 88.
Los modelos estadísticos no eliminan esa incertidumbre — la cuantifican. En lugar de decir "gana el Manchester City", calculan que el City tiene un 61% de probabilidad de ganar, que hay un 22% de probabilidad de empate y un 17% de que gane el visitante. Esas tres cifras siempre suman 100%.
La distribución de Poisson
El punto de partida es asumir que los goles de cada equipo siguen una distribución de Poisson: una distribución matemática que describe el número de eventos que ocurren en un intervalo de tiempo, cuando cada evento es independiente y tiene una tasa media constante.
Para un partido concreto, el modelo estima dos parámetros:
- λ (lambda) — goles esperados del equipo local. Depende del ataque local, la defensa visitante y la ventaja de jugar en casa.
- μ (mu) — goles esperados del equipo visitante. Depende del ataque visitante y la defensa local.
Con λ y μ, el modelo calcula la probabilidad de cada marcador posible (0-0, 1-0, 1-1, 2-1...) y suma todas las probabilidades de victoria, empate o derrota.
La corrección de Dixon-Coles: el parámetro ρ
El modelo de Poisson puro comete un error sistemático: subestima la frecuencia de los marcadores bajos. En la realidad, los resultados 0-0, 1-0, 0-1 y 1-1 ocurren más de lo que predice Poisson.
Dixon y Coles introdujeron un parámetro ρ (rho) que ajusta específicamente esos cuatro marcadores. Es la "corrección de baja puntuación" y es lo que diferencia al modelo Dixon-Coles del Poisson doble básico. En POISSON FC, ρ se calibra por separado para cada liga.
Parámetros de ataque y defensa por equipo
Para cada equipo, el modelo estima dos parámetros mediante máxima verosimilitud sobre el historial de partidos:
α — Fuerza de ataque
Cuántos goles genera un equipo por encima o por debajo de la media de la liga. Un α de 1.4 significa que el equipo marca un 40% más que la media.
δ — Fuerza defensiva
Cuántos goles permite un equipo respecto a la media. Un δ bajo (ej: 0.7) indica una defensa sólida que concede un 30% menos que la media.
POISSON FC añade además una ventaja de local individual por equipo — no todos los equipos se benefician igual de jugar en casa.
El decay temporal: los partidos recientes pesan más
Un gol que marcó el Manchester City hace tres temporadas no dice tanto sobre su fuerza actual como el que marcó la semana pasada. Por eso POISSON FC aplica un peso exponencial a cada partido:
El parámetro ξ (xi) controla qué tan rápido "olvida" el modelo. Un ξ alto significa que solo importa la forma reciente; un ξ bajo da más peso a la historia. POISSON FC calibra ξ por separado para cada liga mediante un grid search walk-forward:
| Liga | ξ calibrado | Interpretación |
|---|---|---|
| Premier League | 0.002 | Historia larga |
| La Liga | 0.0005 | Historia muy larga |
| Bundesliga | 0.0015 | Equilibrado |
| Serie A | 0.0005 | Historia muy larga |
| Ligue 1 | 0.0005 | Historia muy larga |
| Championship | 0.004 | Forma reciente |
| Brasileirao | 0.0015 | Equilibrado |
Calibración por temperatura
Después del entrenamiento, el modelo aplica una calibración por temperatura sobre un conjunto de validación temporal (el 20% más reciente de la temporada). Esto corrige sesgos sistemáticos: por ejemplo, el modelo base tiende a sobreestimar la probabilidad de empate en ligas de alta velocidad como la Bundesliga.
El resultado es que las probabilidades de POISSON FC están calibradas: cuando el modelo dice 60%, ese resultado ocurre aproximadamente el 60% de las veces.
¿Cómo de preciso es el modelo?
POISSON FC evalúa su rendimiento con metodología walk-forward: nunca se mide sobre datos que el modelo ya vio. Las métricas clave son:
- Accuracy 1X2: porcentaje de partidos donde el resultado más probable fue el correcto.
- Brier Score: error cuadrático medio de las probabilidades. El modelo ronda 0.200; el mercado de Pinnacle (bookmaker de referencia) ronda 0.183.
Explora las predicciones
Cada día POISSON FC genera predicciones para todas las ligas activas usando este modelo. Puedes ver las probabilidades, el marcador más probable y la comparativa con el mercado.