Análisis estadístico · ATP 1968–2024

¿Predice el ranking de verdad quién gana un partido de tenis?

Analizamos 146.893 partidos ATP del cuadro principal con ranking disponible para los dos jugadores. La pregunta es sencilla: ¿el jugador mejor clasificado en el ranking gana más? ¿Y ha cambiado esto a lo largo de la historia?

Fuente: Jeff Sackmann / tennis_atp
1968 – 2024
Solo cuadro principal ATP
146.893 partidos con ranking de ambos jugadores
00

Antes de empezar — pequeño glosario

💡 En este análisis usamos algunos conceptos estadísticos. Los explicamos aquí con palabras sencillas para que nada quede en el aire.
El "favorito"
En este análisis, llamamos favorito al jugador con mejor ranking (número más bajo en el ranking = mejor puesto). Si el favorito gana, es lo esperado. Si pierde, es un upset o sorpresa.
Significancia estadística
Cuando decimos que una diferencia es estadísticamente significativa, significa que estamos muy seguros de que esa diferencia es real y no fruto de la casualidad. Como cuando lanzas una moneda 10 veces y sale cara 8: puede ser suerte. Pero si la lanzas 10.000 veces y sale cara el 80% de las veces, ya no es suerte.
El valor p (p-value)
El valor p es la probabilidad de que la diferencia que observamos sea pura casualidad. Un valor p muy pequeño (p < 0.001) significa que hay menos de 1 posibilidad entre 1.000 de que la diferencia sea accidental. Cuanto más pequeño, más confianza tenemos.
Intervalo de confianza (IC 95%)
Cuando decimos que el favorito gana el 65.9% ± algo, ese "± algo" es el intervalo de confianza. Significa que si repitiéramos el análisis muchas veces, el 95% de las veces el resultado real caería dentro de ese rango. Es como decir: "no sé el número exacto, pero casi seguro está entre aquí y allí".
Correlación
Mide cuánto se relacionan dos cosas. Una correlación de 1.0 sería perfecta (si sube uno, sube el otro siempre). Una correlación de 0 significa que no hay relación alguna. En este análisis la correlación es 0.11: el ranking influye, pero poco.
Puntos porcentuales (pp)
Cuando comparamos porcentajes, usamos "puntos porcentuales" para evitar confusiones. Si el favorito ganaba el 70% en los 70s y el 64% en los 2020s, la diferencia es 6 puntos porcentuales (pp), no un 6% más o menos.
01

El resultado global: el ranking sí predice, pero no tanto como se cree

🎾 La pregunta más simple: de todos los partidos en los que sabemos el ranking de los dos jugadores, ¿cuántas veces gana el mejor clasificado? Si el ranking no importara nada, ganaría el 50% de las veces (como una moneda). Si importara muchísimo, ganaría casi el 100%. La realidad está en el medio — y más cerca del 50 de lo que mucha gente esperaría.
Gana el favorito
65.9%
De cada 100 partidos, el mejor rankeado gana 66 y pierde 34
Upsets (sorpresas)
34.1%
1 de cada 3 partidos los gana el jugador peor clasificado
Correlación ranking
r = 0.11
Valor bajo: el ranking influye, pero no lo explica todo ni mucho menos
Partidos analizados
146.893
El 75.3% del total — el resto no tenía ranking de alguno de los dos
💡 Lectura clave

Una correlación de r = 0.11 es estadísticamente muy sólida (con 146.000 partidos, incluso diferencias minúsculas son detectables), pero en magnitud es baja. Esto significa que el ranking captura solo una pequeña parte de lo que determina quién gana: el estado físico del día, la superficie, el historial entre ambos jugadores, los nervios, el momento de la temporada... todo eso pesa más que la diferencia de ranking en cualquier partido individual. El tenis es un deporte genuinamente impredecible.

02

¿Cuánto importa la diferencia de ranking?

📊 No es lo mismo que el nº 1 juegue contra el nº 2 (diferencia de 1 puesto) que contra el nº 200 (diferencia de 199 puestos). Aquí agrupamos los partidos según cuántos puestos de diferencia hay entre los dos jugadores y vemos qué porcentaje gana el favorito en cada grupo. El resultado tiene mucho sentido: cuanto mayor es la diferencia, más predecible es el resultado. Pero incluso con diferencias enormes, el "tapado" gana sorprendentemente a menudo.
% que gana el favorito según la diferencia de ranking entre los dos jugadores
Cada barra representa un grupo de partidos con esa diferencia de ranking. La línea roja punteada marca el 50% (azar puro). Cuanto más a la derecha, más diferencia de ranking; cuanto más alta la barra, más predecible el resultado.
Diferencia pequeña (1–50 puestos): resultado casi impredecible
Diferencia grande (50–200): el ranking ya importa
Diferencia muy grande (200+): resultado más claro, pero no seguro
💡 Dato sorprendente

Cuando dos jugadores están separados por solo 1 a 5 puestos en el ranking, el "mejor" gana el 53.2%: prácticamente una moneda al aire. Incluso cuando la diferencia supera los 500 puestos (por ejemplo, el nº 1 del mundo contra el nº 600), el favorito pierde casi 1 de cada 6 veces (15.5% de upsets). El tenis nunca es completamente seguro.

03

¿Ha cambiado esto a lo largo de la historia? Análisis por décadas

📅 Dividimos los más de 50 años de datos en períodos de 10 años para ver si el poder predictivo del ranking ha aumentado o disminuido con el tiempo. El intervalo de confianza (la barra de error en el gráfico) nos indica cuánta incertidumbre hay en cada estimación: cuando el n° de partidos es alto, la barra de error es estrecha (más certeza); cuando hay menos partidos, la barra es más ancha (menos certeza).
% de victorias del favorito por década — con intervalo de confianza al 95%
La zona sombreada alrededor de cada barra muestra el rango donde casi seguro está el valor real. Si dos rangos no se solapan, las diferencias son estadísticamente significativas.
Tabla detallada por décadas
La barra verde muestra el % de victorias del favorito. El rango [mín, máx] es el intervalo de confianza al 95%.
Década Partidos Fav. gana Upsets % victorias del favorito + IC 95% Rango IC 95%
04

¿Son reales esas diferencias? Test de significancia estadística

🔬 Que dos décadas tengan porcentajes diferentes no basta para concluir que son distintas de verdad. Con muchos partidos, incluso diferencias muy pequeñas pueden ser "estadísticamente significativas". La tabla de abajo compara cada par de décadas y nos dice: ¿la diferencia entre estas dos épocas es real, o podría ser pura casualidad? Usamos un test z de diferencia de proporciones — básicamente preguntamos: si las dos décadas fueran iguales, ¿qué probabilidad había de observar esta diferencia solo por azar?
Resultado del test estadístico global
Antes de comparar décadas por pares, verificamos si en conjunto hay diferencias reales entre ellas.
Test chi-cuadrado
χ² = 173.0
Con 5 grados de libertad
Valor p global
1.68 × 10⁻³⁵
Prácticamente cero
Conclusión
Las décadas no son iguales entre sí. Las diferencias son reales con una certeza prácticamente absoluta.
🗺️ Cómo leer la matriz: cada celda muestra si la diferencia entre esas dos décadas es real (significativa) o podría ser casualidad. Dorado *** = diferencia muy real (p < 0.001, menos de 1 entre 1.000 posibilidades de ser azar). Verde ** = diferencia real (p < 0.01). Gris * = diferencia probablemente real (p < 0.05). ns = no significativo, podría ser casualidad — estas dos décadas son estadísticamente iguales.
Matriz de comparación entre todas las décadas
Test z de diferencia de proporciones, bilateral. n total = 146.893 partidos.
1970s69.8% 1980s67.3% 1990s64.5% 2000s65.2% 2010s66.5% 2020s63.9%
1970s69.8% *** p<.001 *** p<.001 *** p<.001 *** p<.001 *** p<.001
1980s67.3% *** p<.001 *** p<.001 *** p<.001 ns · p=.054 *** p<.001
1990s64.5% *** p<.001 *** p<.001 * p=.037 *** p<.001 ns · p=.271
2000s65.2% *** p<.001 *** p<.001 * p=.037 ** p=.001 ** p=.008
2010s66.5% *** p<.001 ns · p=.054 *** p<.001 ** p=.001 *** p<.001
2020s63.9% *** p<.001 *** p<.001 ns · p=.271 ** p=.008 *** p<.001
*** p<.001Diferencia muy real — menos de 1/1.000 posibilidades de ser azar
** p<.01Diferencia real — menos de 1/100
* p<.05Diferencia probable — menos de 1/20
nsNo significativo — estas dos décadas son estadísticamente iguales
💡 Los dos hallazgos más importantes de la matriz

1980s y 2010s son estadísticamente indistinguibles (p=0.054, ns): aunque tienen porcentajes diferentes en papel (67.3% vs 66.5%), la diferencia podría ser perfectamente casual. Son épocas con un nivel de predecibilidad muy similar pese a estar separadas por 30 años.

1990s y 2020s también son estadísticamente iguales (p=0.271, ns): el tenis de los años 90 y el tenis actual tienen exactamente el mismo nivel de imprevisibilidad. El boom de la paridad que vivimos hoy no es nuevo — ya ocurrió hace 30 años.

05

Evolución anual reciente (2005–2024)

📉 Mirando año a año, ¿hay alguna tendencia clara en los últimos 20 años? La respuesta es sí: el tenis se ha vuelto progresivamente menos predecible desde 2015. Hay cada vez más upsets, y el ranking importa ligeramente menos que antes.
% de victorias del favorito, año a año — 2005 a 2024
Cada punto es un año. La zona sombreada muestra la tendencia general. Se aprecia claramente la caída desde ~2015.
06

¿Importa el tipo de torneo y la superficie?

🏟️ No todos los torneos son iguales. Un Grand Slam se juega al mejor de 5 sets, lo que da más margen para que el mejor jugador imponga su nivel. Los torneos pequeños son más abiertos. Respecto a la superficie, la diferencia es sorprendentemente pequeña.
Por nivel de torneo
Los Grand Slams y la Davis Cup son más predecibles — 5 sets favorecen al mejor
Por superficie
Diferencias muy pequeñas — menos de 1 pp entre todas las superficies
Por ronda del torneo
La final es la ronda con más upsets — los mejores jugadores están más igualados
💡 Por qué los Grand Slams son más predecibles

En un partido al mejor de 5 sets, el mejor jugador tiene más oportunidades de remontar si empieza mal. En un partido al mejor de 3 (la mayoría de torneos), cualquier mal comienzo puede ser fatal. Por eso el 70.5% de los Grand Slams lo gana el favorito frente al 64.7% de los torneos pequeños.

Sobre la superficie: el hecho de que solo haya 0.7 pp de diferencia entre tierra batida y pista dura sugiere que el ranking ya incorpora implícitamente la especialización de cada jugador por superficie.

07

Resumen: lo que nos dicen los datos

El ranking predice, pero poco

Con una correlación de solo r=0.11 y un 34% de upsets, el tenis es un deporte genuinamente impredecible partido a partido. El ranking es solo una guía aproximada.

La diferencia de ranking importa en los extremos

Con 1–5 puestos de diferencia es casi moneda al aire (53%). Con más de 500 puestos, el favorito gana el 85%. La diferencia importa, pero el "tapado" siempre tiene opciones.

El tenis es hoy menos predecible

Desde los 70s (70%) hasta los 2020s (64%), la tendencia es clara: el tenis se ha vuelto más igualado. Aunque estadísticamente, los 2020s son casi idénticos a los 90s.

Los Grand Slams son la excepción

El formato a 5 sets da más poder al ranking: 70.5% de victorias del favorito frente al 64.7% de los torneos estándar. La superficie, en cambio, apenas influye.