As the Brazilian National League off-season period is currently underway, I bring you a new method to analyze each club’s performances in last year’s tournament (Brasileirão 2016). The goal of the model is to understand which teams performed better than anticipated and which teams failed to meet expectations. Virtually all soccer specialists agree that to win the Brasileirão (or any national league as a matter of fact) it is necessary to have a talented group of players, hence we will compare the quality of rosters with their achievements in the tournament.
Assumptions:
Costlier squads have better players, which implies on having a better chance of fighting for the championship. The average market value of a player from each team (calculated by dividing the total team market value by the number of players) is a good indicator of squad quality.
Methodology:
First, I used transfermarkt.com to collect data regarding the market value for each team. Most values were from May 2016 (when the Brasileirão was just starting), this means that player performances during the tournament still had not influenced the values. Then, I calculated the average player market for of each team and ordered them accordingly, here is a table with this calculated squad quality ranking:
Last, I compared the squad quality ranking with the team’s final standings by calculating the difference. A negative difference means the team underachieved while a positive one means it overachieved.
Results:
(DISCLAIMER: If you are afraid by statistical terms please skip the next paragraph, I promise that it will be simple to understand if you choose to read it)
At first we can see that there is a moderate correlation between the final league standings and the squad rankings (a correlation of 0.598 to be more precise). In other words, teams with higher average market values tend to finish in the top of the table while team with lower average values tend to get closer to the relegation zone. Also, we see that the average difference is of 4 positions, which means that there is a good chance that your team will finish 4 positions above or below of what the squad ranking predicted. In sum, the model has issues predicting a team’s exact final standing, however it generally gets the “table region” right.
With this initial analysis done, I separated the 4 teams with the greatest positive differences (Botafogo, Santos, Atlético-PR and Ponte Preta) and the 4 teams with the greatest negative differences (Internacional, Cruzeiro, São Paulo and Fluminense). Those were the clubs which the model was the most unsuccessful at predicting performance, we can say they are the season’s biggest over and under achievers.
Now that a quantitative analysis made it clear who were the big surprises and disappointments of the tournament we can look qualitatively at the reasons behind those performances. By analyzing the team’s decisions during 2016 it is clear that knowledge about the players in the club’s squad is essential in order to perform well.
It interesting to note that the only overachiever club who had a managerial change during the Brasileirão was Botafogo, where Jair Ventura replaced Ricardo Gomes. Yet, Jair Ventura was an assistant coach at Botafogo and already knew and dealt with all the athletes he ended up managing for the rest of the season. Meanwhile, Santos, Atlético-PR and Ponte Preta trusted their head coaches (Dorival Júnior, Paulo Autuori and Eduardo Baptista respectively) and kept them at their jobs during the whole tournament, a decision that brought extremely positive results. On the other hand, all the underachieving clubs changed the their head coaches at least once, special highlight to Internacional that had 4 different managers along the 38 games. Even with an extremely qualified squad, it is difficult to achieve good results without a decent amount of time to work and get to know the players’ characteristics.
Observations:
- Another explanation for the results above is the difficulty to make a valuation of some players before the tournament begins. For example, Vitor Bueno (one of Santos’ main players and winner of the rookie of the year award) had a market value of 1 Million Euros, while some other more well-known players such as Eduardo Sasha had a market value of 2.5 Million Euros. The process of translating athlete performance into market value has a few problems and difficulties, yet it is still an interesting analysis tool.
- If you plan in reproducing the model, in order to calculate the average difference you should use absolute values, otherwise negative values will probably have a great interference in the final results
Algolritmo's founder. I have a bachelor's in Computer Science and a master's in Analytics. My goal is to bring a new perspective into Brazilian football. I'm particularly interested in communicating complex ideas through simple data visualizations.
I graduated in Computer Science and Business Administration at the University of Southern California and got a masters degree in Analytics at the same institution. I have worked as a Data Science intern at companies such as Facebook, Itaú and Looqbox.
O PVC tem que ver esses dados!! Parabéns.
Tomara que ele veja, sou fã dele! Obrigado pelo apoio!
Teria a curiosidade se a correlação pegando como referência o valor total (ou o valor dos 11 jogadores mais frequentemente escalados) em vez do valor médio e ainda mais forte. Chama a atenção o fato que o Palmeiras tem um elenco de jogadores muito mais longo do primeiro colocado (46 jogadores) o que é certamente uma vantagem …
Mario, achei muito interessante sua sugestão verifiquei também a correlação com o valor total e ela é um pouco mais baixa (0.55). É claro que para validar esse valor o ideal seria fazer um estudo com os valores totais e posições finais de mais campeonatos, no entanto o transfermarkt.com não é muito amigável para se coletar esse tipo de dado (muito da coleta precisaria ser feita à mão, o que é bastante trabalhoso. Tentarei também fazer um estudo sobre os tamanhos de elencos, à principio tendo a acreditar que deve existir um número “ideal” de jogadores para se trabalhar, porém pode ser que os dados mostrem que “quanto mais melhor”. Além disso pretendo estudar as escalações mais comuns de cada time, para tentar extrair mais insights. Novamente, muito obrigado pelo comentário e sugestões!
Interessante … não é o que eu esperava, mas demonstra que um elenco longo demais talvez não ajude …
Sem dúvida há uma relação entre a troca de treinadores e o desempenho. Mas a troca de treinadores é uma causa (a troca constante de treinador leva ao menor conhecimento do elenco que resulta em mau desempenho), uma consequência (o mau desemenho do elenco leva a diretoria a devidir pela troca do treinador) ou simplesmente está relacionada (as duas variáveis simplesmente estão relacionadas, mas não há necessariamente uma relação de causa e efeito entre elas) ao desempenho? Parabéns pela análise.
Acredito que as duas variáveis estão relacionadas, e acho que podemos ver as relações de causa e efeito de duas maneiras, como você mesmo citou. Na minha opinião o principal problema com as troca de técnicos é uma política de curto prazo, onde técnicos “tapa-buraco” são contratados em detrimento de projetos mais estruturados e promissores. Acho que falta muito aos times de futebol (principalmente no Brasil) mais propriedade e fundamento ao escolher um técnico. É necessário entender quais são suas características e como essas se adequam ao clube, não simplesmente contratar por campanhas recentes ou “renome”.
E obrigado pelo comentário e apoio!
Uma outra possibilidade de análise seria eliminar os (poucos) pontos fora da curva em cada time, jogadores que ganham muito mais do que a média do grupo. Penso que isso vai embaralhar os resultados, mas talvez melhore a correlação, que na análise inicial ainda é baixa. Parabéns pelo blog e pela qualidade da análise!
Boa ideia! Lembro que grande parte do valor do elenco do Palmeiras vinha pela incrível valorização do Gabriel Jesus. Os dados da transfermarkt.com não dos mais simples de se coletar, mas tentarei fazer alguns testes e ver se a correlação aumenta. Obrigado pelo apoio e sugestão!
Rafa,
Uma outra análise que pode ser interessante, seria confrontar os resultados dos jogos levando em conta sua análise do valor médio entre as equipes. Sob esta ótica seria possível levantar as probabilidades que cada equipe tem de vencer, empatar ou perder.
Verdade! Vou tentar organizar os dados e ver o quanto o modelo consegue prever resultados além de estudar os casos em que ele erra. Obrigado pela sugestão Leo!
Que mitagem!
Agradecemos o apoio!
Faz uma comparação do valor médio por jogador antes e depois do campeonato também, para ver se a valorização das surpresas e as decepções do brasileiro tiveram correlação direta com o resultado final no campeonato.
Boa ideia! É um ótimo tópico para o próximo post! O problema é que demora um pouco de tempo para o transfermarkt.com atualizar a valorização dos jogadores, mas ficarei de olho. Obrigado pela sugestão!
Muito irada a ferramenta, dá uma analise de previsão mt boa, interessante testar tambem com outras coisas, parabens bly
Brigado parceiro!