Modelo estadístico

El Modelo Dixon-Coles:
cómo predecir fútbol con matemáticas

El modelo que usa POISSON FC es una extensión del trabajo publicado en 1997 por Mark Dixon y Stuart Coles en la revista Journal of the Royal Statistical Society. Es el estándar de referencia en predicción cuantitativa de fútbol y la base de muchos sistemas de betting profesional.

Por qué el fútbol es difícil de predecir

A diferencia del baloncesto o el béisbol, en fútbol se marcan muy pocos goles por partido (media de 2.6 en Europa). Eso hace que el azar tenga un papel enorme: un equipo puede controlar el 70% del juego y perder 0-1 por un disparo fuera del área en el minuto 88.

Los modelos estadísticos no eliminan esa incertidumbre — la cuantifican. En lugar de decir "gana el Manchester City", calculan que el City tiene un 61% de probabilidad de ganar, que hay un 22% de probabilidad de empate y un 17% de que gane el visitante. Esas tres cifras siempre suman 100%.

La distribución de Poisson

El punto de partida es asumir que los goles de cada equipo siguen una distribución de Poisson: una distribución matemática que describe el número de eventos que ocurren en un intervalo de tiempo, cuando cada evento es independiente y tiene una tasa media constante.

Para un partido concreto, el modelo estima dos parámetros:

  • λ (lambda) — goles esperados del equipo local. Depende del ataque local, la defensa visitante y la ventaja de jugar en casa.
  • μ (mu) — goles esperados del equipo visitante. Depende del ataque visitante y la defensa local.

Con λ y μ, el modelo calcula la probabilidad de cada marcador posible (0-0, 1-0, 1-1, 2-1...) y suma todas las probabilidades de victoria, empate o derrota.

La corrección de Dixon-Coles: el parámetro ρ

El modelo de Poisson puro comete un error sistemático: subestima la frecuencia de los marcadores bajos. En la realidad, los resultados 0-0, 1-0, 0-1 y 1-1 ocurren más de lo que predice Poisson.

Dixon y Coles introdujeron un parámetro ρ (rho) que ajusta específicamente esos cuatro marcadores. Es la "corrección de baja puntuación" y es lo que diferencia al modelo Dixon-Coles del Poisson doble básico. En POISSON FC, ρ se calibra por separado para cada liga.

Parámetros de ataque y defensa por equipo

Para cada equipo, el modelo estima dos parámetros mediante máxima verosimilitud sobre el historial de partidos:

α — Fuerza de ataque

Cuántos goles genera un equipo por encima o por debajo de la media de la liga. Un α de 1.4 significa que el equipo marca un 40% más que la media.

δ — Fuerza defensiva

Cuántos goles permite un equipo respecto a la media. Un δ bajo (ej: 0.7) indica una defensa sólida que concede un 30% menos que la media.

POISSON FC añade además una ventaja de local individual por equipo — no todos los equipos se benefician igual de jugar en casa.

El decay temporal: los partidos recientes pesan más

Un gol que marcó el Manchester City hace tres temporadas no dice tanto sobre su fuerza actual como el que marcó la semana pasada. Por eso POISSON FC aplica un peso exponencial a cada partido:

w(t) = e−ξ · días_desde_el_partido

El parámetro ξ (xi) controla qué tan rápido "olvida" el modelo. Un ξ alto significa que solo importa la forma reciente; un ξ bajo da más peso a la historia. POISSON FC calibra ξ por separado para cada liga mediante un grid search walk-forward:

Ligaξ calibradoInterpretación
Premier League0.002Historia larga
La Liga0.0005Historia muy larga
Bundesliga0.0015Equilibrado
Serie A0.0005Historia muy larga
Ligue 10.0005Historia muy larga
Championship0.004Forma reciente
Brasileirao0.0015Equilibrado

Calibración por temperatura

Después del entrenamiento, el modelo aplica una calibración por temperatura sobre un conjunto de validación temporal (el 20% más reciente de la temporada). Esto corrige sesgos sistemáticos: por ejemplo, el modelo base tiende a sobreestimar la probabilidad de empate en ligas de alta velocidad como la Bundesliga.

El resultado es que las probabilidades de POISSON FC están calibradas: cuando el modelo dice 60%, ese resultado ocurre aproximadamente el 60% de las veces.

¿Cómo de preciso es el modelo?

POISSON FC evalúa su rendimiento con metodología walk-forward: nunca se mide sobre datos que el modelo ya vio. Las métricas clave son:

  • Accuracy 1X2: porcentaje de partidos donde el resultado más probable fue el correcto.
  • Brier Score: error cuadrático medio de las probabilidades. El modelo ronda 0.200; el mercado de Pinnacle (bookmaker de referencia) ronda 0.183.
Ver rendimiento real del modelo →

Explora las predicciones

Cada día POISSON FC genera predicciones para todas las ligas activas usando este modelo. Puedes ver las probabilidades, el marcador más probable y la comparativa con el mercado.

⚠ Las predicciones son estimaciones estadísticas, no consejo de apuestas ni garantía de resultados. Solo mayores de 18 años. Términos