Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
vale un gol?
Introduccin
En Espaa, la 1 divisin de la LFP (Liga de Ftbol Profesional) est compuesta por 20 equipos que se
enfrentan entre s a ida y vuelta, es decir, cada equipo juega con cada uno de los otros 19 equipos 2 veces,
una en el campo de cada equipo. Lo anterior implica que cada equipo juega un total de 192 = 38 partidos.
El resultado de cada partido se decide segn el nmero de goles que consigue cada equipo, de manera que se
considera ganador al que consigue ms goles a favor y, si ambos equipos consiguen el mismo nmero de
goles, se considera que ambos equipos han empatado.
La clasificacin de los equipos se decide en funcin de los puntos que consigue, a razn de 3 puntos por cada
partido ganado, 1 punto por cada partido empatado y 0 puntos por cada partido perdido.
En la siguiente tabla se muestra un resumen de la clasificacin de los 20 equipos de la 1 divisin de la LFP
en la temporada 2010-2011. De acuerdo con lo anterior, el nmero de puntos de cada equipo se calcula
sumando 3 puntos por cada partido ganado y 1 punto por cada partido empatado:
3
La columna DifG representa la diferencia entre los goles a favor y los goles en contra, de manera que un
valor positivo indica que el equipo en cuestin ha conseguido ms goles de los que ha recibido.
La columna
representa el cociente entre los goles a favor y los goles en contra, de manera que
se puede interpretar como goles a favor por cada gol en contra. Vemos que el equipo mejor clasificado, el
Barcelona, ha conseguido meter 4,52 goles por cada gol que ha encajado, mientras que el equipo peor
clasificado, el Almera, slo ha conseguido meter 0,51 goles por cada gol que ha encajado (encaja el doble de
goles que mete). El Sevilla, sin embargo, tiene un valor prximo a 1 en esta columna (1,02) lo que implica
que prcticamente ha conseguido meter el mismo nmero de goles que ha encajado (62 a favor por 61
encajados).
Resultados de la Liga de Futbol Espaola en la Temporada 2010-2011
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Barcelona
Real Madrid
Valencia
Villarreal
Sevilla
Athletic Club de Bilbao
Atltico de Madrid
Espanyol
Osasuna
Sporting de Gijn
Mlaga
Racing de Santander
Zaragoza
Levante
Real Sociedad
Getafe
Mallorca
Deportivo de La Corua
Hrcules
Almera
Si nos preguntan por el nmero de puntos que consigue un equipo de la 1 divisin de la LFP tendremos que
contestar que esto depende del equipo, es decir, no todos los equipos han conseguido el mismo nmero de
puntos. Lo que acabamos de hacer es constatar la existencia de variabilidad en el nmero de puntos.
La existencia de variabilidad en el nmero de puntos nos lleva a preguntarnos por las causas de dicha
variabilidad. En este caso es claro que lo que causa la diferencia de puntos entre los equipos es que, para
diferentes equipos, se han producido diferentes resultados en los partidos que han disputado, es decir, no
todos los equipos han ganado el mismo nmero de partidos ni han empatado el mismo nmero de partidos y,
1
como sabemos que los puntos vienen determinados por los partidos ganados y empatados, comprendemos
que estos determinan la existencia de variabilidad en el nmero de puntos.
Aunque la causa de la variabilidad se debe a los diferentes resultados obtenidos por los diferentes equipos,
dichos resultados dependen a su vez de los goles que cada equipo consigue meter y los que encaja, ya que en
ltima instancia el ganar, empatar o perder depende de los goles a favor y los encajados. En la tabla anterior
disponemos slo de la informacin correspondiente a los goles a favor y los encajados, por lo que
intentaremos relacionar los puntos con los goles.
Es evidente que los goles a favor no son suficientes para explicar los puntos conseguidos, ya que hay casos
de equipos que, pese a haber conseguido meter el mismo nmero de goles, tienen diferente cantidad de
puntos: el Racing de Santander, el Levante y el Mallorca han conseguido meter 41 goles cada uno y, sin
embargo, no tienen el mismo nmero de puntos (46, 45 y 44, respectivamente). Adems, hay varios equipos
con el mismo nmero de puntos y, sin embargo, han conseguido meter diferente nmero de goles: el Sevilla,
el Athletic de Bilbao y el Atltico de Madrid estn igualados a 58 puntos y, sin embargo lo han conseguido
metiendo diferente nmero de goles (62, 59 y 62, respectivamente). Adems, se puede comprobar que no
siempre meter ms goles significa obtener ms puntos, como le sucede al Real Madrid, que pese a haber
metido 7 goles ms que el Barcelona (95 y 102, respectivamente), tiene 4 puntos menos que l (96 y 92,
respectivamente).
Hay que tener en cuenta que, a efectos de puntos, a los equipos les da igual ganar por un gol que ganar por
dos o tres goles, de manera que podemos decir que el nico gol de un equipo que gana uno a cero vale 3
puntos, mientras que un segundo gol a favor, que le llevara a ganar por dos a cero, no aade puntos al
equipo, luego se puede decir que no vale ningn punto.
Otra consideracin importante es que no slo hay que tener en cuenta los goles que un equipo consigue
meter a sus rivales, ya que de nada sirve meter un gol en un partido si recibimos dos, ya que en este caso,
pese a haber metido un gol, no sumamos ningn punto. Esto nos lleva a considerar tambin los goles
encajados, adems de los metidos, como una variable importante para explicar la variabilidad en el nmero
de puntos sumados.
Explicando la variabilidad en los puntos slo con los goles a favor o con los goles en contra
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
Puntos
Puntos
En la tabla anterior no se facilita el nmero de partidos ganados, empatados y perdidos, lo que supondra una
explicacin 100% precisa del nmero de puntos sumados, ya que los puntos se calculan empleando la
relacin:
3
1
. Sin embargo, s que disponemos
del nmero de goles a favor y del nmero de goles en contra y, es de suponer que, en general, cuantos ms
goles mete un equipo, ms puntos suma (relacin directa entre los goles a favor y los puntos sumados) y
que, tambin en general, cuantos ms goles encaja un equipo, menos puntos sumar (relacin inversa entre
el nmero de goles encajados y el nmero de puntos sumados). Para confirmar estas afirmaciones se muestra
el diagrama de dispersin que relaciona los puntos con los goles a favor y el que relaciona los puntos con
los goles en contra:
20
30
40
50
60
70
80
90
100
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
15
110
25
35
45
55
65
75
Goles en Contra
Goles a Favor
Los dos grficos anteriores tienen el comportamiento previsto, aunque cabe destacar que existe una relacin
lineal directa muy fuerte entre los goles a favor y los puntos. Podemos decir que la relacin lineal es muy
fuerte porque vemos que los puntos estn muy alineados. Sin embargo, la relacin lineal que existe entre los
goles en contra y los puntos es inversa, ya que, en general, a mayor nmero de goles encajados corresponde
un menor nmero de puntos y ms dbil, ya que los puntos del diagrama estn menos alineados.
2
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
Puntos
Puntos
Cuando hablamos de una relacin lineal entre los goles a favor y los puntos y otra entre los goles en contra y
los puntos, estamos sugiriendo la existencia de sendas rectas de regresin, segn se muestran en las
siguientes figuras:
y = 0,8481x + 8,8647
R = 0,8887
20
30
40
50
60
70
80
90
100
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
110
y = -1,1395x + 112,42
R = 0,6434
15
25
35
Goles a Favor
45
55
65
75
Goles en Contra
Los goles netos como variable explicativa para la variabilidad en los puntos
Puntos
Vemos que tanto la variabilidad en los goles a favor como la correspondiente a los goles en contra
contribuyen a explicar la variabilidad en el nmero de puntos, pero razonamos que el efecto de los goles a
favor no es el mismo para los equipos que reciben pocos goles en contra que para aquellos que reciben
muchos goles en contra, ya que apreciamos que, si bien es muy importante conseguir muchos goles a favor
para conseguir muchos puntos, tambin es importante recibir pocos goles en contra, con el mismo objetivo,
lo que nos sugiere la posibilidad de emplear como variable explicativa los goles netos (la diferencia entre los
goles a favor y los goles en contra), esto se muestra en el siguiente diagrama de dispersin:
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
-40
-30
-20
-10
10
20
30
40
Diferencia de Goles
50
60
70
80
Puntos
Se observa que la relacin lineal entre la variable goles netos y la variable puntos obtenidos es
extremadamente fuerte (los puntos del diagrama de dispersin estn claramente alineados), resultando en un
modelo con un muy elevado valor del coeficiente de determinacin lineal R2, segn se muestra en la
siguiente figura:
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
y = 0,6025x + 53,05
R = 0,9716
-40
-30
-20
-10
10
20
30
40
50
60
70
80
Diferencia de Goles
Este modelo nos permite explicar el 97,16% (R2 = 0,9716) de la variabilidad en el nmero de puntos a partir
de la variabilidad en los goles netos y nos dice que los equipos con cero goles netos (los que consiguen el
mismo nmero de goles a favor que en contra) tendrn, en promedio, 53,05 puntos. Otra conclusin del
modelo es que, por cada gol neto adicional, el nmero de puntos aumenta, en promedio, en 0,60 unidades.
Un aspecto importante de esta ltima conclusin del modelo es que se considera igual, en relacin a los
puntos obtenidos, meter un gol ms que recibir un gol menos. Tambin hay que notar que el efecto medio de
un gol a favor y el de un gol en contra es el mismo en valor absoluto, aunque en el primer caso el efecto es
positivo y en el segundo caso es negativo.
Prate a pensar
Segn el modelo anterior el impacto medio sobre el nmero de puntos de un gol neto adicional, positivo o negativo, es el
mismo para todos los equipos. Te parece que esto es as?, es decir, el impacto de meter un gol ms es igual para el
Barcelona que para el Almera?, y el impacto de recibir un gol en contra, es igual para ambos equipos?
El nmero de goles a favor por cada gol encajado y su relacin con los puntos obtenidos
Otra forma de considerar simultneamente los goles a favor y los goles en contra es emplear el ratio
como variable explicativa, es decir, el nmero de goles a favor que consigue cada equipo por
cada gol en contra que recibe. El que para un equipo este cociente resulte igual a 2 implicara que consigue
dos goles a favor por cada gol en contra, es decir, mete el doble de goles que encaja. El cociente ser igual a
1 para los equipos que meten el mismo nmero de goles que encajan y ser menor que 1 para los que encajan
Puntos
1,00
2,00
3,00
Barcelona
RealMadrid
4,00
5,00
Puntos
Si consideramos a estos dos equipos como datos anmalos, y los excluimos del anlisis, tenemos una
relacin lineal directa muy fuerte, segn podemos confirmar al estimar el modelo correspondiente, en la
siguiente figura:
105
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
0,00
Barcelona
RealMadrid
y = 39,417x + 14,069
R = 0,9295
1,00
2,00
3,00
4,00
5,00
Este modelo, si bien resulta tener una gran capacidad explicativa, tiene la debilidad de no ser aplicable para
dos equipos, el Real Madrid y el Barcelona. No obstante vamos a intentar interpretarlo, viendo como vara el
nmero esperado de puntos por cuando los goles a favor se incrementan en una unidad, y haremos lo mismo
cuando se aade un gol en contra.
,
14,07
39,42
1,
14,07
39,42
Si restamos:
1,
39,42
Es decir, por cada gol a favor que se aade al total de los conseguidos por el equipo los puntos aumentan, en
promedio, una cantidad igual a 39,42
. Este resultado tiene la peculiaridad de depender de los goles
encajados por el equipo, ya que el efecto positivo de conseguir meter un gol ms resulta inversamente
proporcional a dicha cantidad, con constante de proporcionalidad igual a 39,42. Para ver como se plasma
esto en la prctica consideraremos un par de ejemplos. Para el Valencia, como ha encajado 44 goles, un gol
adicional supondra, en promedio, un incremento de 39,4244 0,90 puntos, sin embargo, para el Getafe o
e Hrcules, como han encajado 60 goles cada uno, un gol adicional supondra, en promedio, un incremento
de 39,4260 0,66
.
Si consideramos lo que sucede cuando un equipo encaja un gol adicional, el razonamiento se complica:
,
,
14,07
39,42
14,07
39,42
Si restamos:
39,42
Es decir, cuando un equipo encaja un gol ms, el efecto es un descenso en el nmero de puntos cuyo valor
medio depende de manera directa del nmero total de goles a favor y de manera inversa del nmero total de
goles encajados, al cuadrado. Para entender esto un poco mejor veremos algunos ejemplos:
Para el Valencia, con 64 goles a favor y 44 en contra, el efecto medio de encajar un gol adicional es
,
1,27 puntos, el Villareal, tiene tambin 44 goles en contra, pero ha conseguido slo 54 goles a
favor (10 menos que el Valencia) y el efecto medio de encajar un gol adicional es
5
1,08 puntos.
El impacto negativo esperado de encajar un gol adicional resulta ser mayor para el Valencia que para el
Villareal, por haber metido ms goles.
El Hrcules y el Almera han conseguido meter el mismo nmero de goles 36, pero el Almera ha encajado
70 goles mientras que el Hrcules ha encajado 60 goles (10 menos). Segn el modelo, el impacto medio de
,
encajar un nuevo gol para el Almera es
0,29 puntos y para el Hrcules el impacto medio es
,
0,39 puntos. El impacto negativo esperado de encajar un gol adicional resulta ser mayor para el
Hrcules que para el Almera, por haber encajado menos goles.
Lo que sucede en este caso es que, a efectos de puntos, da lo mismo ganar por un gol que ganar por 3, siendo
La transformacin logartmica de
Puntos
Si tratamos de ajustar un modelo que considere a los 20 equipos, necesitamos un modelo diferente del lineal.
y = 31,526ln(GFav/GCon) + 53,661
R = 0,9694
1,00
2,00
3,00
4,00
5,00
Puntos
Cuando transformamos la variable explicativa (como hemos hecho en este ejemplo, al aplicarle el logaritmo
neperiano) o la variable respuesta, o ambas, tenemos un modelo de regresin no lineal. En el caso que nos
del modelo:
53,66 31,53
es decir, si cambiamos
por su
transformacin logartmica
, tenemos el siguiente diagrama de dispersin:
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
y = 31,526Ln(GFav/GCon) + 53,661
R = 0,9694
-1
-0,5
0,5
Ln(GFav/GCon)
1,5
En las dos ltimas figuras tenemos exactamente el mismo modelo, aunque en la segunda hemos deformado
el eje horizontal para conseguir la linealidad de la relacin.
Con los modelos no lineales tenemos la dificultad aadida de la complejidad en la interpretacin de los
coeficientes. En este caso, podemos interpretar la ordenada en el origen 53,661 si consideramos el caso en
que
1, ya que el logaritmo de 1 es cero y eso nos lleva a decir que los equipos que consigan
el mismo nmero de goles a favor que en contra tendrn, en promedio, 53,661 puntos.
La interpretacin de la pendiente 31,526 es ms difcil, ya que, en primera instancia, nos llevara a decir que
31,256
53,661
31,256
53,661
31,256
Es decir, el incremento en los puntos por un gol a favor adicional depende slo del total de goles a favor que
tiene, y tal dependencia se puede ilustrar grficamente de la siguiente manera:
(Puntos por Gol a Favor)
1,2
1,0
0,8
0,6
0,4
0,2
0,0
30 35 40 45 50 55 60 65 70 75 80 85 90 95 100
Goles a Favor despus de 38 partidos
Vemos que el efecto de los goles adicionales a favor es menor, en promedio, para los equipos que terminan
la temporada con muchos goles. Por ejemplo, el Barcelona acab la temporada con 95 goles a favor, con lo
que un gol adicional le proporcionara, en promedio, 31,256
0,33 puntos, sin embargo, el
Almera y el Hrcules solo consiguieron 36 goles a favor, con lo que un gol adicional les supondra, en
promedio, 31,256
0,86 puntos.
Del mismo modo, podemos estudiar el impacto de recibir un gol:
31,256
53,661
31,256
31,256
53,661
Es decir, el incremento en los puntos por un gol en contra adicional depende slo del total de goles en
contra que tiene, lo cual se puede ilustrar grficamente de la siguiente manera:
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
-1,2
-1,4
-1,6
-1,8
20
25
30 35 40 45 50 55 60 65
Goles en Contra despus de 38 partidos
70
75
Vemos que el efecto negativo de los goles adicionales en contra es mayor, en promedio, para los equipos que
terminan la temporada con pocos goles en contra. Por ejemplo, el Barcelona acab la temporada con 21 goles
en contra, con lo que un gol adicional en contra le supondra, en promedio, 31,256
1,45
puntos, sin embargo, el Almera recibi 70 goles en contra, con lo que recibir un gol adicional en contra les
0,44 puntos.
supondra, en promedio, 31,256
Este modelo tiene prcticamente la misma capacidad explicativa que el modelo que empleaba los goles
netos, pero tiene una ventaja importante en la interpretacin de los parmetros, ya que ante el impacto de un
gol a favor o en contra adicional, permite diferenciar entre los equipos segn su situacin en relacin a los
goles a favor y los goles en contra que acumula.
Recapitulando
Hemos visto hasta cinco modelos unidimensionales diferentes en nuestro intento de explicar el motivo por el
que unos equipos han conseguido ms puntos que otros. En la siguiente tabla se muestra un resumen de los
cinco modelos, indicando la expresin de cada uno de ellos, el coeficiente de determinacin lineal asociado y
el impacto estimado de un gol adicional, ya sea a favor o en contra, en los casos en que esto es posible:
Modelo
8,86
88,87%
No procede
64,34%
No procede
0,85
112,42
1,14
53,05
0,60
97,16%
39,42
39,42
39,42
14,07
92,95%
31,26
53,66
96,94%
31,26
(Puntos por Gol en Contra)
31,53
1,2
1,0
0,8
0,6
0,4
0,2
0,0
30 35 40 45 50 55 60 65 70 75 80 85 90 95 100
Goles a Favor despus de 38 partidos
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
-1,2
-1,4
-1,6
-1,8
20
25
30 35 40 45 50 55 60 65
Goles en Contra despus de 38 partidos
70
75
Nota: Los datos empleados en este ejemplo los he obtenido en la web http://www.bdfutbol.com/. En esta
web puedes encontrar datos correspondientes a otras temporadas. Adems puedes estudiar los datos
de cada equipo y los de cada jornada.
8