Sei sulla pagina 1di 17

As chances publicadas neste site so obtidas com base nas probabilidades calculadas para cada um dos resultados possveis

(vitria, empate e derrota) de cada jogo. A partir de milhares de simulaes de todos os jogos ainda no realizados do campeonato em questo, so calculadas todas as possibilidades de cada uma das equipes se classificar fase seguinte, ir para a repescagem etc. O resultado de um jogo depende da fora de cada oponente, mas h tambm uma dose de acaso e imprevisibilidade. As foras de cada clube ou seleo nacional, aps quantificadas e ordenadas, so publicadas periodicamente nos Rankings Chance de Golde Selees, Brasileiro de Clubes e Mundial de Clubes. A forma como as foras de cada time so calculadas se encontra descrita na seo Entenda os Rankings. Para calcular as probabilidades de vitrias, empates e derrotas veiculadas no Chance de Gol, so considerados, entre diversos outros fatores, o local de jogo (se em casa, fora de casa ou em campo neutro) e a fora dos adversrios que, por sua vez, se baseia essencialmente em resultados passados. Alm disso, dada muito pouca importncia a fatos como "o time A nunca foi longe em competies intercontinentais" ou "O time B no vence uma semifinal h cinco campeonatos seguidos" e a informaes de cunho puramente histrico como "o time C j foi campeo mundial enquanto o time D nunca havia disputado a copa continental". Todos os clculos levam em conta os jogos realizados estritamente dentro de um perodo especificado (12, 24 ou 48 meses), pois os resultados e ttulos obtidos h 10, 20 ou 40 anos nada tm a ver com o estgio atual dos times. No decorrer de um campeonato, cada time tem uma seqncia diferente de jogos a disputar, envolvendo adversrios com foras diferentes em locais diferentes. Alm disso, aps cada rodada, os pontos ganhos, saldo de gols, nmero de vitrias, etc. das equipes participantes obviamente se alteraram. Tambm em conseqncia dos resultados da rodada, as foras dos futuros adversrios de cada time so atualizadas e, conseqentemente, as chances de classificao prxima fase, ida repescagem, etc. tambm so alteradas. Por isso, ao longo de um campeonato, nem sempre coincidiro as ordenaes dos times por pontos ganhos e por chances de ttulo ou classificao. No se deve confundir chances altas com certeza nem chances baixas com impossibilidade. A atribuio de 80% de chance de vitria do time X sobre o time Y, por exemplo, no deve ser considerada como uma afirmao de que "O time X VAI GANHAR o jogo", mas como um favoritismo do time X, ou seja como uma tendncia de que a vitria do time X seja mais provvel de acontecer do que o empate ou a vitria do time Y. Todas as chances divulgadas no Chance de Gol (chances de vitria, empate e derrota no prximo jogo, chances de classificao prxima fase, chances de ser campeo etc.), bem como as foras de cada time, so baseadas em um modelo de probabilidades e calculadas atravs de tcnicas matemticas e estatsticas desenvolvidas em Tese de Mestrado (pelo Depto. de Estatstica da USP) e testadas detalhadamente desde a Copa do Mundo de 1998.

1 - Ranking de Selees
O Ranking CHANCE DE GOL de Selees um instrumento que visa medir e ordenar o status atual das selees nacionais de todos os continentes. Esse ranking diferente dos rankings freqentemente publicados por revistas e jornais, os quais pretendem apurar "os melhores equipes da histria", independentemente de seu nvel tcnico atual. O Ranking CHANCE DE GOL , na verdade, um rating, se assemelhando aos rankings da FIFA, da IFFHS e da ATP, por exemplo, no sentido em que tem por objetivo apurar "as melhores equipes da atualidade", independentemente de seu currculo histrico. Esse ranking construdo atravs das mesmas tcnicas matemticas e estatsticas utilizadas nos clculos das probabilidades divulgados no site CHANCE DE GOL e leva em considerao apenas os resultados (placares) das selees nacionais nos ltimos quatro anos, em jogos vlidos pelos principais campeonatos realizados no mundo, entre os quais esto: - Copa do Mundo - Eliminatrias da Copa do Mundo - Copa Amrica - Eurocopa (*) - Copa da sia (*) - Copa Ouro da CONCACAF (*) - Copa da frica (*) - Copa da Oceania (*) - Copa das Confederaes - Amistosos "data FIFA" (*) incluindo as respectivas eliminatrias O Ranking CHANCE DE GOL no um ranking histrico e, por esse motivo, no leva em considerao ttulos conquistados pelas equipes ou quaisquer outras informaes de cunho histrico. O procedimento de clculo dos pontos de cada equipe no ranking se baseia predominantemente em placares de jogos e nas foras dos oponentes, no havendo qualquer pontuao extra por ttulos ou classificaes alcanadas. Os pontos e foras das equipes so sempre calculados conjuntamente no mesmo processo matemtico utilizado na obteno das probabilidades veiculadas no CHANCE DE GOL, de forma semelhante ao The CHANCE DE GOL Worldwide Nations Ranking is a tool which intends to measure and rank the current status of the national teams from all the continents. This ranking is different than those frequently published in magazines and newspapers, which intend to select "the best teams of all-time", independently of its current strength. The CHANCE DE GOL Ranking is, in fact, a rating, being similar to the rankings of FIFA, IFFHS and ATP (for example) which have as their goal the selection of the "best current teams", independently of each team's history. This ranking is built through the same mathematic and statistic techniques applied in the calculation of the probabilities published in the site CHANCE DE GOL and is based solely in the results (scores) of the national teams in the last four years, in matches played for the main championships around the world. The list of these championships includes: - World Cup - World Cup Qualifying - Copa Amrica - European Nations Cup (*) - Asian Nations Cup (*) - CONCACAF Gold Cup (*) - African Nations Cup (*) - Oceanian Nations Cup (*) - FIFA Confederations Cup - "FIFA date" friendlies (*) including their respective qualifying tournaments The CHANCE DE GOL Ranking is not a historical rankingand, for this reason, does not consider titles won by the teams or any other historical information. The calculation procedure of each team's punctuation in the ranking is based predominantly in the scores of the matches and in the strength of the opponents, without any bonus for reaching titles or qualifications. The points and strengths of the teams are always jointly calculated in the same mathematical procedure used to get the probabilities divulged in CHANCE DE GOL. This procedure is similar to the following example: Assume that the database only has the following results: Team A 3x0 Team B , Team B 4x2 Team C

exemplo abaixo: Suponha-se que existissem, no banco de dados, apenas os seguintes resultados: Equipe A 3x0 Equipe B , Equipe B 4x2 Equipe C e Equipe A 1x1 Equipe D. Esses resultados equivalem, respectivamente, s equaes: xA - xB = 3 xB - xC = 2 e xA - xD = 0; de onde o Ranking de Selees poderia ser, dado pelas solues dessas equaes: Equipe A: 10 pontos Equipe D: 10 pontos Equipe B: 7 pontos Equipe C: 5 pontos ou, equivalentemente, tambm poderia ser: Equipe A: 3 pontos Equipe D: 3 pontos Equipe B: 0 pontos Equipe C: -2 pontos. Na prtica, a existncia de muitos confrontos entre as mesmas equipes e a existncia de um efeito de mando de campo, entre outras variveis, obrigam o uso de tcnicas mais sofisticadas para se chegar aos pontos do Ranking CHANCE DE GOL. Os pontos de cada equipe no ranking no tm significado proporcional absoluto, mas apenas significado aritmtico comparativo: se duas equipes tm 3 e 1 pontos, isso no significa que a primeira seja tecnicamente trs vezes melhor do que a segunda. Ao contrrio, a diferena tcnica existente entre uma equipe com 3 e outra equipe com 1 ponto rigorosamente a mesma que existe entre duas equipes com 4 e 2 pontos, com 1468 e 1466 pontos ou com 0,8 e -1,2 pontos. Os pontos de cada equipe podem ser relacionados s respectivas capacidades de marcao e de nosofrimento de gols e a diferena de pontos entre duas equipes pode ser interpretada como a diferena mdia de gols entre elas em um hipottico confronto direto. Por esse motivo, equipes com diferena de pontuao muito abaixo de 1 (ou seja, muito prxima de zero) podem ser consideradas, em algum sentido, "tecnicamente empatadas".

and Team A 1x1 Team D. These results are respectively equivalent to the equations: xA - xB = 3 xB - xC = 2 and xA - xD = 0; from which the Nations Ranking would be given by the solutions of these equations: Team A: 10 points Team D: 10 points Team B: 7 points Team C: 5 points or, equivalently, the ranking would also be: Team A: 3 points Team D: 3 points Team B: 0 points Team C: -2 points. Actually, the existence of many matches between the same teams and the existence of a "home field" effect, among other variables, imply the use of more complex and detailed techniques to get to the points of the CHANCE DE GOL Ranking. Each team's points in the ranking have not an absolute proportional meaning, but only an arithmetical comparative meanig: if two teams have 3 and 1 points, it doesn't mean that the first is technically three times better than the other. Otherwise, the technical difference between one team with 3 and another with 1 point is absolutely the same as between two teams with 4 and 2 points, 1468 and 1466 points or 0.8 and -1.2 points. Each team's points can be related to the respective abilities to score and do not suffer goals. The difference of points between two teams can be understood as the average difference of goals between them in a hypothetical direct match. Due to this, teams with difference of points far below of 1 (i.e., very close to zero) can in some sense be considered as "technically drawn".

2 - Ranking de Clubes Brasileiros (Brazilian Clubs Ranking)


O Ranking CHANCE DE GOL de Clubes Brasileiros segue The CHANCE DE GOL Brazilian Clubs Ranking follows

rigorosamente os mesmos mtodos e critrios empregados na confeco do Ranking CHANCE DE GOL de Selees. As nicas diferenas so as seguintes: a) O Ranking CHANCE DE GOL de Clubes Brasileiros leva em considerao os resultados (placares) dos clubes apenas nos ltimos 12 meses (em vez dos 48 meses utilizados no ranking de selees). b) So considerados os jogos vlidos pelas seguintes competies: - Campeonato Brasileiro (Srie A) - Campeonato Brasileiro (Srie B) - Campeonato Brasileiro (Srie C) - Campeonato Brasileiro (Srie D) - Copa do Brasil - Copa do Nordeste - Campeonatos Estaduais dos estados que tenham pelo menos um clube nas Sries A e B - fases finais dos Campeonatos Estaduais dos estados que tenham pelo menos um clube na Srie C

absolutely the same methods and criteria used to obtain the CHANCE DE GOL Nations Ranking. These are the only differences: a) The CHANCE DE GOL Brazilian Clubs Rankings are based in the results (scores) of the clubs only in the last 12 months (instead of the 48 months used in the nations ranking). b) The ranking are based on matches played for following competitions: - Brazilian Championship (1st level) - Brazilian Championship (2nd level) - Brazilian Championship (3nd level) - Brazilian Championship (4th level) - Brazilian Cup - State Championships of the states with at least one club in Brazil 1st of 2nd Levels - final phases of State Championships of the states with at least one club in Brazil 3rd Level

3 - Ranking Mundial de Clubes (Worldwide Clubs Ranking)


O Ranking CHANCE DE GOL Mundial de Clubes segue rigorosamente os mesmos mtodos e critrios empregados na confeco dos outros Rankings CHANCE DE GOL. As nicas diferenas so as seguintes: a) O Ranking CHANCE DE GOL Mundial de Clubes leva em considerao os resultados (placares) dos clubes nos ltimos 24 meses (em vez dos 12 ou 48 meses utilizados nos outros rankings). b) So considerados os jogos vlidos pelas seguintes competies: - Campeonato Mundial da FIFA - Taa Libertadores da Amrica (*) - Copa dos Campees da Europa - Copa dos Campees da CONCACAF (*) - Copa dos Campees da sia - Copa dos Campees da frica - Copa dos Campees da Oceania (*) (*) incluindo os respectivos torneios classificatrios

Nesses 12 anos em que o Chance de Gol est na estrada, divulgando probabilidades para os mais variados campeonatos, tomei contato direto ou indireto com um sem nmero de reclamaes e queixas acerca de alguns nmeros divulgados. Acredito que os responsveis pelos sites coirmos tambm tenham passado por essas experincias e que, assim como eu, tenham pacientemente respondido s interpelaes mais

sensatas e deixado passar outras manifestaes, mais grosseiras, desrespeitosas ou que simplesmente no lhes eram diretamente dirigidas. Novamente no posso falar pelos coirmos mas posso afirmar que, de minha parte, essas manifestaes ocasionalmente me provocam algum desconforto, mas nada que durasse mais do que os poucos minutos gastos com a leitura de certas alfinetadas dirigidas genericamente "aos matemticos". Nesta segunda-feira (31/10/2011), porm, tive a impresso de essa situao ter chegado ao fundo do poo. Recebi de colegas estatsticos este texto cujo autor menospreza e ridiculariza os "matemticos" e o faz de uma forma to infeliz que, estarrecido que fiquei, eu no poderia deixar passar batido tamanho desrespeito! Para comeo de conversa, vamos dar nomes aos bois e eliminar uma das confuses mais freqentes cometidas pela imprensa em geral: Matemtica e Estatstica so carreiras universitrias diferentes, que formam bacharis com preparo e capacitao diferentes e que recebem registros profissionais diferentes. Portanto, "Estatstico" e "Matemtico" no so sinnimos. Se voc no chama o seu dentista de "mdico" nem chama o colunista do seu jornal de "reprter", ento por favor no chame um estatstico de "matemtico" nem chame um matemtico de "estatstico". Existem, no momento, quatro sites voltados ao clculo de probabilidades no futebol, mais o global Oswald de Souza, que no tem site mas tambm divulga as suas anlises. Curiosamente, desses cinco "matemticos", trs so estatsticos e dois so engenheiros, ou seja, nenhum dos "matemticos" assim tratados pela imprensa de fato so especificamente profissionais em Matemtica. Concludo esse prembulo, vamos ao que de fato interessa: as explicaes de por que os "matemticos" dizem o que dizem e por que isso de forma alguma constitui "erro", "chute" ou "mudana de idia por convenincia". Tudo se origina de um conceito bsico to importante quanto desconhecido do grande pblico: a probabilidade condicional. Todo mundo tem uma noo bsica do conceito de probabilidade, aprendida em exemplos como a moeda que tem 50% de chances de dar cara e 50% de dar coroa ou o dado que tem 1/6 de chance de sair cada uma das faces. S que o "mundo real" no esttico e o Campeonato Brasileiro um processo de sete meses de durao, obviamente muito mais complexo do que um simples lanamento de uma moeda ou um dado. E nesse ponto que entra em cena a probabilidade condicional. Observemos um exemplo bsico para entender como funciona "essa tal" de probabilidade condicional. Imagine que temos uma urna com duas bolas brancas e duas bolas pretas. Voc deve sortear duas bolas da urna e, se forem duas brancas, voc ganha um prmio. A pergunta bvia : qual a probabilidade de voc ganhar o prmio? Pois bem, antes do incio do sorteio, temos as seguintes possibilidades de bolas a serem sorteadas:

(branca1,branca2) * (branca1,preta1) (branca1,preta2) (branca2,branca1) * (branca2,preta1) (branca2,preta2) (preta1,branca1) (preta1,branca2) (preta1,preta2) (preta2,branca1) (preta2,branca2) (preta2,preta1) Dessas 12 possibilidades existentes nesse momento, duas (as identificadas com asterisco) correspondem ao resultado que vale o prmio. Logo, a probabilidade de voc ganhar o prmio evidentemente igual a 2/12 = 16,67 % Imagine agora que voc sorteou a primeira bola e saiu a "branca1". As possibilidades agora foram reduzidas a trs: (branca1,branca2) * (branca1,preta1) (branca1,preta2) E a probabilidade de voc ganhar o prmio mudou para 1/3 = 33,33 % Agora imagine que a primeira bola sorteada fosse a "preta1". As possibilidades restantes seriam: (preta1,branca1) (preta1,branca2) (preta1,preta2) e a probabilidade de voc ganhar o prmio mudaria para 0/3 = zero! Mas como pode uma probabilidade mudar ao longo do tempo? A resposta simples: tratam-se de probabilidades condicionais, ou seja, probabilidades calculadas dadas as (ou luz das) informaes existentes at aquele momento! Na terminologia estatstica, as trs probabilidades que acabamos de calcular podem ser representadas da seguinte forma:

Probabilidade de ganhar o prmio (DADO QUE nada ainda foi sorteado) = 16,67 %

Probabilidade de ganhar o prmio (DADO QUE a primeira bola sorteada foi a branca1) = 33,33 % Probabilidade de ganhar o prmio (DADO QUE a primeira bola sorteada foi a preta1) = 0,00 %

Saindo das bolas e urnas e voltando ao futebol, imagine agora que o Seu Time est em tima fase, que o Rival est em pssima fase e que ambos se enfrentaro na prxima rodada. No incio do jogo, voc est otimista e confiante na vitria do Seu Time. Porm, no final do primeiro tempo o placar mostra 3x0 para o Rival e o Seu Time teve um jogador importante expulso. No natural voc "jogar a toalha" e achar que a derrota irreversvel? S que o segundo tempo comea e, em menos de 5 minutos, o Seu Time diminui a diferena para 3x2. Voc volta a alimentar esperanas de vitria mas ainda est ressabiado. Essa "flutuao de humor" perfeitamente normal, no ? E o que essa "flutuao de humor" se no a manifestao das "probabilidades condicionais" (ainda que no sejam expressas em nmeros) geradas pelo seu "processador interno"? Essa historinha fictcia poderia perfeitamente ser representada por probabilidades condicionais da seguinte forma:

Probabilidade de o Seu Time ganhar o jogo (DADO o retrospecto recente e DADO que o jogo ainda no comeou) = "grande" Probabilidade de o Seu Time ganhar o jogo (DADO que j foram jogados 45 minutos e o Rival est ganhando por 3x0) = "muito pequena" Probabilidade de o Seu Time ganhar o jogo (DADO que foram jogados mais 5 minutos e o Seu Time diminuiu a diferena para 3x2) = "razovel"

Sendo assim, se as probabilidades (condicionais) podem mudar ao longo do sorteio das bolinhas e ao longo dos 90 minutos de um jogo, ento porque no poderiam mudar ao longo de um campeonato? O que os sites divulgam, portanto, so exatamente essas probabilidades condicionais: a probabilidade de o time X ser campeo, a probabilidade de o time Y ser rebaixado e a probabilidade de o time Z se classificar para a Taa Libertadores so valores calculados DADAS as informaes contabilizadas at aquele momento (a tabela de classificao, os resultados at aquela rodada, a agenda des jogos futuros etc.)! uma conseqncia bvia, portanto, que, medida que o tempo vai passando e as rodadas vo acontecendo, o conjunto de informaes contabilizadas vai naturalmente se modificando e, por conseguinte, as probabilidades de cada time ser campeo, ser rebaixado, se classificar etc. tambm sofram alteraes! Alm da probabilidade condicional, existem outros conceitos to simples quanto importantes mas freqentemente ignorados ou tratados de maneira equivocada. O primeiro deles possivelmente esteja relacionado a expresses como "previso matemtica" ou "previso estatstica" que, embora sejam corriqueiras no meio acadmico, so entendidas pela populao em geral (em funo da palavra

"previso") como sinnimas de "adivinhao", "vidncia" ou "profecia". Essa associao incorreta de significados acaba fazendo com que muita gente por a interprete uma probabilidade alta de rebaixamento do time X como se fosse uma afirmao definitiva e imutvel de que "o time X VAI ser rebaixado"! Dessa interpretao incorreta, nasce o segundo conceito importante: a partir do momento em que probabilidades no so afirmaes, no h sentido algum considerar como "acerto" ou "erro" a ocorrncia ou no do "rebaixamento do time X"! Estatisticamente, s se pode falar em erro se um evento ao qual se atribuiu probabilidade 100% no acontecer ou se um evento ao qual se atribuiu probabilidade zero vier a acontecer! Podemos, ento, resumir o que foi dito at agora em trs "mandamentos" do leitor de probabilidades calculadas para o futebol: I - As probabilidades divulgadas no Chance de Gol e nos sites coirmos no so e nunca pretenderam ser afirmaes definitivas e imutveis! Essas probabilidades so apenas projees da situao de um momento especfico e, como a cada rodada a situao de momento se altera, as respectivas projees naturalmente tambm se alteraro. II - Probabilidade no vidncia nem profecia! Probabilidades altas no so uma afirmao de que aquele evento VAI acontecer, assim como probabilidades baixas no significam impossibilidade de ocorrncia desse evento. III - Tudo o que tem probabilidade 99% de acontecer, tem probabilidade 1% de no acontecer. Logo, no se pode rotular o acontecimento ou no de um evento como "acerto" ou "erro". Finalizando, vamos analisar um exemplo real onde todos os "trs mandamentos" se aplicam: recentemente, Flamengo e Universidad de Chile se enfrentaram nas oitavas de finais da Copa Sul-Americana. Pergunta nmero 1: Seria implausvel que, antes da realizao do primeiro jogo, um estatstico calculasse probabilidades de classificao s quartas de finais de 60% para o Flamengo e 40% para a Universidad de Chile? Resposta (mandamento I): No! Esse estatstico estaria simplesmente dizendo que a Probabilidade condicional de classificao do Flamengo, DADAS as informaes existentes at ento, era igual a 60% e, por conseguinte, que a probabilidade condicional etc. da Universidad de Chile era igual a 40%. Pergunta nmero 2: Seria inaceitvel que, aps o jogo de ida, quando o Flamengo perdeu por 4x0, esse estatstico passasse a apontar probabilidades de classificao s quartas de finais de 2% para o Flamengo e 98% para a Universidad de Chile? Resposta (mandamento I): No! Novamente, esse estatstico estaria simplesmente informando uma probabilidade condicional, dizendo agora que a probabilidade de classificao do Flamengo, DADO que o jogo de ida foi 4x0 para a Universidad, era igual a 2% e, por conseguinte, que a probabilidade da Universidad de Chile era igual a 98%. Pergunta nmero 3: E se no jogo de volta o Flamengo vencesse por 5x0? O estatstico

teria "errado" e deveria ser execrado e ridicularizado internet afora? Resposta: No! Em primeiro lugar (mandamento II), em nenhum momento o estatstico afirmou que "a Universidad de Chile VAI se classificar". E, em segundo lugar (mandamento III), a possibilidade de classificao do Flamengo estava contemplada e medida em 2%. Logo, no h como falar em "erro"! Resta agora esperar que os prximos torcedores, jornalistas e blogueiros leiam este artigo antes de fazer suas postagens e procurem humildemente apreender os conceitos por trs das probabilidades anunciadas pelos diversos matemticos. A discordncia e a crtica so direito de todos, mas no h como discordar ou criticar algo sem um mnimo conhecimento de causa! E que as almas de Pascal, Bernoulli, Poisson, Descartes, Gdel, Russell e tantos outros iluminem as mentes que desejarem se aventurar no universo da matemtica, da lgica e das probabilidades. Nota: Eu e alguns colegas estatsticos tentamos diversas vezes postar, na seo de comentrios coluna supracitada, argumentos como os acima detalhados e/ou links para este artigo. Lamentavelmente, porm, o autor daquele texto ignorou por completo todas as manifestaes, somando pelo menos sete posts censurados, unicamente por cometerem o pecado de no concordarem ou no endossarem o seu ponto de vista! Venho aqui, ento, expressar publicamente meus totais e veementes REPDIO e INDIGNAO pela lamentvel atitude daquele cidado em no apenas achincalhar gratuitamente a classe matemtica mas tambm censurar seguida e sumariamente manifestaes contrrias sua verdade absoluta! Fosse um "mero cidado" que tomasse essa atitude, isso j seria inaceitvel. Mas, tratando-se de um membro de uma classe profissional (a classe jornalstica) que sempre empunhou a bandeira das liberdades de pensamento e de expresso e sempre combateu qualquer tipo de ditadura e opresso, simplesmente LAMENTVEL que tudo isso esteja acontecendo! Assim, em meu nome e em nome da classe estatstica, fico espera de uma resposta ou retratao pblica por parte do referido comentarista. Ou do silncio que atestar, publicamente, a sua real capacidade de argumentao e o seu real entendimento do assunto!

Alguns meses atrs, em resposta a uma infelicssima anlise publicada na Internet, eu publiquei esse artigoexplicando um pouco do clculo bsico de probabilidades e, atravs do conceito de Probabilidade Condicional, esclarecendo o porqu de as chances de um time ser campeo, se classificar, ser rebaixado etc. variarem ao longo dos campeonatos. Os exemplos que citei naquele artigo, porm, foram de situaes simples, como lanamentos de moedas ou de dados, em que ns no s podemos considerar todas as faces com a mesma probabilidade de ocorrncia (1/2 para a moeda e 1/6 para o dado) como tambm podemos considerar que essa probabilidade no se altera ao longo do tempo, isto , que a chance de sair cara na 50 jogada continua igual a 50%, independentemente dos resultados das 49 jogadas anteriores. No futebol, por outro lado, seria evidentemente irreal e simplista considerar que todos os times so iguais e que todos os resultados possveis so igualmente provveis. Alm de sempre existirem times melhores que outros, h uma flutuao ao longo do tempo que no pode ser ignorada: especialmente numa competio longa como o Campeonato Brasileiro ou as Eliminatrias para a Copa do Mundo, qualquer time apresenta oscilaes entre fases de melhor forma tcnica (quando sua probabilidade de vencer um jogo "maior") e fases de pior desempenho (quando sua chance de vitria "menor"). Essas caractersticas, intrnsecas ao "mundo real", suscitam a utilizao de parmetrose conseqentemente de uma abordagem mais sofisticada que a do sorteio das bolinhas mencionada no artigo anterior. So esses parmetros e essa sofisticao que provocam um fenmeno que no raro acontece com os nmeros divulgados pelo Chance de Gol: as probabilidades aparentemente exageradas de o time X ser campeo ou de o time Y ser rebaixado. E esse fenmeno que tentarei elucidar neste artigo. Imaginemos, ento, que Almeida e Barbosa estejam disputando um campeonato de "par ou mpar" no qual ser sagrado campeo o primeiro que atingir 10 vitrias. Imaginemos tambm que, aps 13 jogos, Barbosa est com 8 vitrias contra 5 vitrias de Almeida. Qual , ento a probabilidade de Almeida ser campeo? E qual ser a probabilidade aps o prximo jogo? Para termos uma melhor visualizao do processo de clculo que nos levar a essas respostas, lembremos que, de todos os resultados possveis dos jogos futuros, Almeida somente ser campeo se ganhar os cinco prximos jogos ou se perder no mximo um jogo antes da quinta vitria, o que equivale s seguintes seqncias de resultados ("A" representa vitria de Almeida e "B" representa vitria de Barbosa):
Jogo 14 Jogo 15 Jogo 16 Jogo 17 Jogo 18 Jogo 19 Placar Final A A A A A A 10 x 8 B B A A A A A A 10 x 9 B A B A A A A A 10 x 9 B A A B A A A A 10 x 9 B A A A B A A A 10 x 9 B A A A A B A A 10 x 9 B

Agora, se Almeida vencer o Jogo 14, o placar passar para 8 x 6 a favor de Barbosa. Nessa hiptese, Almeida precisar, para ser campeo, de quatro vitrias consecutivas ou, no mximo, perder um jogo antes da quarta vitria:
Jogo 15 Jogo 16 Jogo 17 Jogo 18 Jogo 19 Placar Final A A A A A 10 x 8 B B A A A A A 10 x 9 B A B A A A A 10 x 9 B A A B A A A 10 x 9 B A A A B A A 10 x 9 B

Analogamente, se Almeida perder o Jogo 14, o placar passar para 9 x 5 a favor de Barbosa e, nesse caso, Almeida precisar necessariamente de cinco vitrias seguidas para ser campeo:
Jogo 15 Jogo 16 Jogo 17 Jogo 18 Jogo 19 Placar Final A A A A A A 10 x 9 B

Assim, para conhecer as probabilidades de Almeida ser campeo, vamos, em primeiro lugar, abordar esse problema sob a tica do artigo anterior, supondo que em cada jogo as probabilidades de vitria so sempre 50% para Almeida e 50% para Barbosa. Nesse caso, as probabilidades de cada seqncia favorvel a Almeida so:
Jogo 14 Jogo 15 Jogo 16 Jogo 17 Jogo 18 Jogo 19 Placar Final Probabilidade A A A A A A 10 x 8 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/32 B A A A A A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/64 A B A A A A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/64 A A B A A A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/64 A A A B A A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/64 A A A A B A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/64

E a probabilidade de Almeida ser campeo igual a 1/32 + (5 x 1/64) = 10,94 %. Na hiptese de Almeida vencer o Jogo 14, sua probabilidade de ser campeo passa a ser:
Jogo 15 Jogo 16 Jogo 17 Jogo 18 Jogo 19 Placar Final Probabilidade A A A A A 10 x 8 B 1/2 x 1/2 x 1/2 x 1/2 = 1/16 B A A A A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/32 A B A A A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/32 A A B A A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/32 A A A B A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/32

E a probabilidade de Almeida ser campeo passa a ser igual a 1/16 + (4 * 1/32) = 18,75 %. Finalmente, na hiptese de Almeida perder o Jogo 14, sua probabilidade de ser

campeo passa a ser:


Jogo 15 Jogo 16 Jogo 17 Jogo 18 Jogo 19 Placar Final Probabilidade A A A A A A 10 x 9 B 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/32

O que igual a 1/32 = 3,13 %. Assim, lembrando-se dos conceitos explicados no artigo anterior, podemos escrever:

Probabilidade de Almeida ser campeo, DADOS os resultados dos 13 primeiros jogos = 10,94 % Probabilidade de Almeida ser campeo, DADOS os resultados dos 13 primeiros jogos E que Almeida venceu o Jogo 14 = 18,75 % Probabilidade de Almeida ser campeo, DADOS os resultados dos 13 primeiros jogos E que Almeida perdeu o Jogo 14 = 3,13 %

Porm, assim como ocorre no futebol, podemos considerar que os jogos passados fornecem informaes sobre a qualidade tcnica de cada participante. Se Barbosa ganhou mais jogos que Almeida, isso pode significar que Barbosa seja, em algum sentido, "melhor" que Almeida. Podemos, por exemplo, utilizar os nmeros de vitrias de cada participante como um parmetro: no nosso exemplo, o parmetro de Barbosa poderia ser igual a 8 e o de Almeida igual a 5. Ent, esses parmetros nos permitiriam, por exemplo, basear os clculos na suposio de que a probabilidade de Barbosa vencer um jogo seja igual a 8/13 e a probabilidade de vitria de Almeida seja igual a 5/13. Nesse caso, a probabilidade de Almeida ser campeo seria calculada da seguinte forma:
Jogo 14 A B A A A A Jogo 15 A A B A A A Jogo 16 A A A B A A Jogo 17 A A A A B A Jogo 18 A A A A A B Jogo 19 A A A A A Placar Probabilidade Final A 10 x 8 B 5/13 x 5/13 x 5/13 x 5/13 x 5/13 = 3125/371293 8/13 x 5/13 x 5/13 x 5/13 x 5/13 x 5/13 = A 10 x 9 B 25000/4826809 5/13 x 8/13 x 5/13 x 5/13 x 5/13 x 5/13 = A 10 x 9 B 25000/4826809 5/13 x 5/13 x 8/13 x 5/13 x 5/13 x 5/13 = A 10 x 9 B 25000/4826809 5/13 x 5/13 x 5/13 x 8/13 x 5/13 x 5/13 = A 10 x 9 B 25000/4826809 5/13 x 5/13 x 5/13 x 5/13 x 8/13 x 5/13 = A 10 x 9 B 25000/4826809

E a probabilidade de Almeida ser campeo igual a 3125/371293 + (5 * 25000/4826809) = 3,43 % Agora, na hiptese de Almeida vencer o Jogo 14, o seu parmetro passa a ser igual a 6, as probabilidades de vitria de Barbosa e Almeida passam a ser respectivamente iguais

a 8/14 e 6/14 e a probabilidade de Almeida ser campeo passa a ser:


Jogo 15 Jogo 16 Jogo 17 Jogo 18 Jogo 19 Placar Final Probabilidade A A A A A 10 x 8 B 6/14 x 6/14 x 6/14 x 6/14 = 1296/38416 B A A A A A 10 x 9 B 8/14 x 6/14 x 6/14 x 6/14 x 6/14 = 10368/537824 A B A A A A 10 x 9 B 6/14 x 8/14 x 6/14 x 6/14 x 6/14 = 10368/537824 A A B A A A 10 x 9 B 6/14 x 6/14 x 8/14 x 6/14 x 6/14 = 10368/537824 A A A B A A 10 x 9 B 6/14 x 6/14 x 6/14 x 8/14 x 6/14 = 10368/537824

E a probabilidade de Almeida ser campeo passa a ser igual a 1296/38416 + (4 * 10368/537824) = 11,08 %. Por fim, na hiptese de Almeida vencer o Jogo 14, o parmetro de Barbosa passa a ser igual a 9, as probabilidades de vitria de Barbosa e Almeida passam a ser respectivamente iguais a 9/14 e 5/14 e a probabilidade de Almeida ser campeo passa a ser:
Jogo 15 Jogo 16 Jogo 17 Jogo 18 Jogo 19 Placar Final Probabilidade A A A A A A 10 x 9 B 5/14 x 5/14 x 5/14 x 5/14 x 5/14 = 3125/537824

O que igual a 3125/537824 = 0,58 %. Ento, podemos escrever agora:

Probabilidade de Almeida ser campeo, DADOS os resultados dos 13 primeiros jogos E os parmetros sugeridos por esses resultados = 3,43 % Probabilidade de Almeida ser campeo, DADOS os resultados dos 13 primeiros jogos E que Almeida venceu o Jogo 14 E os parmetros sugeridos por esses resultados = 11,08 % Probabilidade de Almeida ser campeo, DADOS os resultados dos 13 primeiros jogos E que Almeida perdeu o Jogo 14 E os parmetros sugeridos por esses resultados = 0,58 %

O que se pode perceber desses nmeros? Numa primeira olhada, fcil notar que, em todas as trs situaes, a probabilidade de Almeida ser campeo, calculada com parmetros, menor do que a mesma probabilidad,e calculada sob a premissa inicial (de que cada em jogo haja 50% de chances de vitria para cada contendor). E o que isso significa? Por que isso acontece? A explicao simples: se o parmetro de Barbosa maior que o de Almeida, ento Barbosa ser favorito em todos os jogos. Conseqentemente, as seqncias de resultados que levam Barbosa a ser campeo no s so mais numerosas como tambm tm maiores probabilidades de ocorrncia. Logo, quando somamos "muitas" parcelas com "grandes" probabilidades, o resultado inevitavelmente ser uma probabilidade "muito alta" de Barbosa ser campeo e uma probabilidade "muito baixa" de Almeida vencer o campeonato.

Saindo do "par ou mpar" para o futebol, diversos fatores adicionais obviamente precisam ser considerados, como por exemplo: - No "par ou mpar", no h distino entre as vitrias; no futebol, 1x0 diferente de 2x0 que diferente de 3x0, que diferente de 3x1, que e diferente de 3x2 e assim por diante. - No "par ou mpar" s existem vitria e derrota; no futebol, tambm existe o empate. - No "par ou mpar", as nicas informaes existentes so os jogos entre Almeida e Barbosa; no futebol, existem muitos times jogando uns contra os outros; - No "par ou mpar", supusemos que todos os jogos tm peso igual e que o lugar onde eles so realizados no interfere no resultado; no futebol, existe o efeito "jogar em casa" e existe o "envelhecimento" das informaes (para o Time X de hoje, a informao sobre o Time X da semana passada muito mais relevante do que a informao sobre o Time X de cinco anos atrs). Logo, para que todos esses fatores sejam devidamente levados em considerao, necessrio um modelo matemtico significativamente mais complexo tanto para obteno dos parmetros (divulgados nas pginas dos Rankings Chance de Gol) quanto para obteno das probabilidades (veiculadas nas pginas dos diversos campeonatos cobertos pelo Chance de Gol). A pgina de explicaes matemticas sobre os Rankings Chance de Gol contm um resumo de como os parmetros de cada time so calculados. parte a complexidade matemtica desses clculos, o importante ter em mente que a sua essncia basicamente a mesma do exemplo do campeonato de "par ou mpar": Se o Time X tem parmetros melhores que seus adversrios, ento ele tender a ser favorito vitria em todos os seus jogos. Sendo favorito vitria em todos (ou quase todos) os seus jogos, as seqncias de resultados que o conduzem ao ttulo tero probabilidades "grandes" de ocorrncia em comparao com as seqncias de resultados que levam os outros times ao ttulo. E, conseqentemente, a soma dessas probabilidades "grandes" ser uma probabilidade igualmente "grande" de esse time ser campeo, promovido para a diviso superior, classificado prxima fase etc. exatamente essa a explicao para a ocasional apario, nas rodadas iniciais de campeonatos longos, de times com probabilidades inesperadamente altas de ttulo, promoo, classificao etc. E, naturalmente, vale explicao anloga para a existncia de times com probabilidades inesperadamente grandes de eliminao ou rebaixamento. Fico, sinceramente, na esperana de que esse conceito (os parmetros dos times)

esteja agora bem compreendido e seja um "mistrio" a menos a ser "desvendado" sobre a "caixa preta" do Chance de Gol.

Nos artigos anteriores, eu muitas vezes chamei a ateno para a questo de que no se deve confundir a atribuio de probabilidades altas com afirmaes de que um evento "VAI acontecer" e, por conseguinte, no se deve tomar a ocorrncia ou no de tal evento como "acerto" ou "erro" de previso. Apesar desses constantes alertar, mais do que natural que algum pergunte sobre a qualidade das previses estatsticas do Chance de Gol, at para que possa se estabelecer termo de comparao com outros sites do gnero ou com "valores-padro de referncia". Depois de muitos anos de trabalho (o Chance de Gol surgiu em 1999, mas as previses estatsticas j eram realizadas desde a Copa do Mundo de 1998), j existe histrico suficiente para podermos aplicar algumas medidas de qualidade existentes na literatura estatstica. Do incio da Copa do Mundo de 1998 at hoje (29/05/2013), foram calculadas probabilidades para exatos 20.314 jogos, vlidos por um total de 236 campeonatos (sendo 226 encerrados e 10 em andamento). A partir dessa considervel massa de dados, podemos ento calcular duas relevantes medidas da qualidade do Chance de Gol. Antes de entrar nessas medidas, porm, julgo importante mostrar uma estatstica ligada ao erro freqentemente cometido por no-estatsticos e alvo dos constantes alertas citados no primeiro pargrafo deste artigo. Rotulando os trs resultados possveis de cada jogo (vitria, empate e derrota) como "favorito" (o resultado com maior probabilidade de ocorrncia), "mdio" (o segundo resultado com mais chances de acontecer) e "zebra" (o menos provvel dos trs resultados), a histria do Chance de Gol registra, at o presente momento: 52.5% de jogos em que o resultado "favorito" aconteceu; 25.7% de jogos em que o resultado "mdio" aconteceu; 21.8% de jogos em que a "zebra" aconteceu.

Considerando-se que a grande maioria dos jogos contabilizados so confrontos minimamente equilibrados, pode-se considerar esse escore de 52.5% de "favoritos" como uma boa medida de "acerto". Porm, a ocorrncia de um resultado "zebra" para o que se previa uma probabilidade de 1% estava contemplada e medida (exatamente em 1%) de modo que, reitero mais uma vez, enganoso e incorreto tomar as ocorrncias ou no de "favoritos" como "acertos" e "erros". O exemplo a seguir, espero, exibir inquestionavelmente as deficincias desse pensamento e, espero, sepultar definitivamente essa forma de "avaliao" de qualidade. Imagine que dois estatsticos faam as seguintes previses para os jogos Time A x Time B e Time C x Time D: Estatstico X: Time A 90% empate 5% Time B 5% Time C 34% empate 33% Time D 33% Estatstico Y: Time A 30% empate 30% Time B 40% Time C 25% empate 30% Time D 45%

Imagine agora que os Times B e C venceram esses jogos. Pela contagem de "favoritos", os dois modelos seriam iguais entre si, empatados com 1 acerto e 1 erro cada. Analisando atentamente, porm, no difcil ver que o erro do Estatstico X no jogo Time A x Time B muito mais grave que o erro do Estatstico B no jogo Time C x Time D! Logo, a simples contabilizao de resultados mais provveis efetivamente ocorridos negligencia aspectos muito importantes da qualidade de um modelo de previso estatstica.

As medidas que sero apresentadas a seguir, por outro lado, possuem amplo embasamento matemtico e levam em considerao aspectos como essa gravidade supracitada. Vamos a elas, ento: 1 - Medida de Confiabilidade Eventos que tenham, digamos, 30% de probabilidades de acontecer, espera-se que aconteam 30% das vezes, certo? esse o raciocnio bsico por trs dessa medida. Se estivssemos analisando uma moeda, diramos que ela "confivel" (da o nome dessa medida) se a freqncia observada de caras e coroas no longo prazo for condizente com as probabilidades atribudas ocorrncia de cada face. Para o futebol, onde cada jogo uma "moeda" diferente e onde todas as "moedas" tm trs "faces" (vitria, empate e derrota), a matemtica fica mais complicada, mas a essncia do raciocnio a mesma e pode ser sintetizada na tabela abaixo: De todos os resultados cuja probabilidade estava efetivamente aconteceram entre 0% e 10% 10.6% entre 10% e 20% 19.4% entre 20% e 30% 24.9% entre 30% e 40% 32.9% entre 40% e 50% 44.7% entre 50% e 60% 53.8% entre 60% e 70% 60.0% entre 70% e 80% 67.8% entre 80% e 90% 78.0% entre 90% e 100% 88.0% Ento, uma medida de confiabilidade pode ser calculada a partir das distncias entre os valores da segunda coluna e os pontos mdios dos intervalos da segunda coluna: Intervalo Ponto mdio Freqncia observada Distncia 0 a 10% 5% 10.6% (0.05 - 0.106) = 0.003126 10 a 20% 15% 19.4% (0.15 - 0.194) = 0.001978 20 a 30% 25% 24.9% (0.25 - 0.249) = 0.000001 30 a 40% 35% 32.9% (0.35 - 0.329) = 0.000425 40 a 50% 45% 44.7% (0.45 - 0.447) = 0.000007 50 a 60% 55% 53.8% (0.55 - 0.538) = 0.000142 60 a 70% 65% 60.0% (0.65 - 0.600) = 0.002457 70 a 80% 75% 67.8% (0.75 - 0.678) = 0.005122 80 a 90% 85% 78.0% (0.85 - 0.780) = 0.004930 90 a 100% 95% 88.0% (0.95 - 0.880) = 0.004900 Assim, a Medida de Confiabilidade do Chance de Gol igual soma dos valores da coluna "Distncia" (a quarta coluna desta tabela): MC = 0.023088. Evidentemente, quanto menor for o valor dessa medida, melhor ser o modelo de previso. Isso fica visvel se calcularmos essas medidas para os estatsticos X e Y do exemplo mostrado mais acima. O estatstico X (que "errou feio" no primeiro jogo) tem MC = 0.925278, enquanto o estatstico Y (que "errou menos" no segundo jogo) tem MC = 0.625. Alm disso, em comparao com as medidas dos estatsticos X e Y, a medida do Chance de Gol (MC = 0.023088) muitssimo menor e, conseqentemente, podemos afirmar que, sob esse quesito, o desempenho do Chance de Gol muito bom! 2 - Distncia ao Resultado Essa medida, tambm conhecida como Distncia de DeFinetti (nome do estatstico que a desenvolveu), se baseia no raciocnio intuitivo de que, quanto mais alta a probabilidade de um evento acontecer, "mais correta" ter sido a previso se ele de fato acontecer e "mais errada" ter sido a previso se esse

evento no vier a acontecer. Matematicamente falando, trata-se de observar as probabilidades sempre como um terno, isto , um conjunto formado por trs nmeros. Antes de o jogo comear, o terno formado pelos nmeros (prob. de vtria, prob. de empate e prob. de derrota). Depois que o jogo terminou, por outro lado, o resultado j conhecido e consumado e portanto o terno passa a ser (100%, 0, 0) se o time tiver vencido, (0, 100%, 0) se tiver empatado ou (0, 0, 100%) se tiver perdido o jogo. A Distncia ao Resultado , portanto, simplesmente a medida da distncia entre o terno correspondente s probabilidades calculadas antes do jogo e o terno correspondente ao resultado efetivamente conhecido ao final do jogo. Tomemos como exemplo, as previses efetuadas pelo estatstico X para o primeiro jogo do exemplo apresentado no incio deste artigo. O terno correspondente s probabilidades previamente calculadas (90%, 5%, 5%). Conseqentemente as possveis Distncias ao Resultado desse jogo seriam: (0.90 - 1) + (0.05 - 0) + (0.05 - 0) = 0.015 se o Time A tivesse vencido o jogo; (0.90 - 0) + (0.05 - 1) + (0.05 - 0) = 1.715 se o Time A tivesse empatado o jogo; (0.90 - 0) + (0.05 - 0) + (0.05 - 1) = 1.715 se o Time A tivesse perdido o jogo. Calculadas essas distncias individualmente para todos os jogos analisados desde 1998 e posteriormente tomando a sua mdia aritmtica, obtemos o valor de DR = 0.5971 para o Chance de Gol. Assim como a Medida de Confiabilidade, a Distncia ao Resultado tem como caracterstica evidente o fato de que, quanto menor o valor da medida, melhor ser o modelo de previso. Assim, calculando as medidas para os estatsticos X e Y do exemplo inicial, ns podemos perceber que o estatstico X (que "errou feio") tem DR = 2.3684, medida pior que a do estatstico Y (que "errou menos"), que tem DR = 1.395. E podemos novamente observar que, em comparao com as medidas dos estatsticos X e Y, a medida DR = 0.5971 do Chance de Gol muitssimo menor e, portanto, que sob esse quesito o desempenho do Chance de Gol tambm muito bom! H ainda um outro valor de referncia til para o balizamento da Distncia ao Resultado: trata-se de considerar o escore que seria obtido pelo "preguioso" que, sem efetuar anlise ou clculo algum, preguiosamente atribui probabilidades iguais a (1/3, 1/3, 1/3) para todo e qualquer jogo que venha a ser realizado. A Distncia ao Resultado do "preguioso" ser sempre igual a (1/3 - 1) + (1/3 - 0) + (1/3 - 0) = 0.6667. Isso significa dizer que o mnimo que se espera de um bom modelo estatstico que sua Distncia ao Resultado seja melhor (i.e. menor) que 0.6667. Afinal de contas, se o modelo do estatstico X pior que o do "preguioso", ento mais eficiente (e presumivelmente mais barato) do que insistir nesse modelo, ser fechar os olhos e atribuir probabilidades (1/3, 1/3, 1/3) para todos os jogos do planeta! Tambm nesse aspecto, o Chance de Gol com sua medida 0.5971, tambm aprovado com louvor! Espero, sinceramente, que com essas explicaes os equivocados conceitos de "erro" e "acerto" sejam definitivamente esquecidos e que as medidas de qualidade do Chance de Gol, bem como seus conceitos, estejam agora adequadamente compreendidas.

Potrebbero piacerti anche