ANÁLISE DE VARIÁVEIS EM PARTIDAS DE FUTEBOL PARA PREVISÃO DE RESULTADOS

Rodrigo Sehnem, Rejane Frozza

Resumo


O ramo de apostas esportivas tem crescido muito recentemente e, consequentemente, a tentativa de entender e prever o resultado de determinado acontecimento torna-se um tema de pesquisa relevante. O futebol, sendo um dos esportes mais populares do mundo, movimenta grande parte dessas apostas. Apesar de ser um esporte coletivo e depender de fatores imprevisíveis como, por exemplo, expulsões, lesões e erros de arbitragem, é possível calcular a probabilidade do resultado, principalmente, analisando dados históricos de partidas anteriores. Existem apostas para os diversos fatores envolvendo uma partida de futebol, como escanteios, chutes a gol, faltas, cartões amarelos e vermelhos, assim como, obviamente, o resultado da partida. Nesse contexto, o objetivo é testar diversos conjuntos de variáveis, com o uso de técnicas baseadas em conhecimento, com o intuito de descobrir quais têm maior influência no resultado de uma partida (derrota, empate, vitória). A metodologia da pesquisa envolve os seguintes passos: (1) levantamento bibliográfico para a compreensão dos assuntos envolvidos na pesquisa, como algoritmos de previsão; (2) realização de bibliometria quantitativa com o objetivo de levantar o número de trabalhos existentes relacionados ao assunto; (3) estudo e realização de sínteses dos trabalhos relacionados, juntamente com um quadro comparativo, destacando suas principais características; (4) modelagem e desenvolvimento do sistema computacional, com a seleção dos conjuntos de variáveis envolvidas; (5) validação dos resultados obtidos e nível de acertos do algoritmo. O algoritmo sendo desenvolvido para prever os resultados das partidas é o Naive Bayes, juntamente com o Cálculo de Poisson (utilizado comumente no ramo de apostas). As variáveis das partidas serão buscadas em sites especializados, disponíveis na internet. No desenvolvimento, o objetivo é realizar o aprendizado de máquina com os dados disponíveis e verificar a saída (neste caso, nível de acerto) em novas partidas. É possível dividir o ramo de apostas disponibilizadas pelas operadoras na internet em dois modelos. O primeiro é o de adesão (utilizado neste trabalho), modelo pelo qual as pessoas apostam em determinado evento e que as probabilidades de resultados são determinadas pela própria casa de apostas, ou seja, o cliente aposta diretamente contra ela. O segundo modelo funciona sob o formato de betting exchanges (bolsa de apostas), similar ao mercado de ações, ou seja, os preços são determinados pelos próprios apostadores de acordo com a regra de oferta e demanda, e a operadora funciona apenas como uma espécie de corretora. Com os resultados obtidos, pretende-se responder ao seguinte problema de pesquisa: “É possível melhorar a previsão de resultados de partidas de futebol com o uso de técnicas inteligentes, baseadas em aprendizado e conhecimento útil, a partir da análise de um conjunto de variáveis?”. Os dados utilizados serão do campeonato brasileiro (ano 2008 a 2014) extraídos da base oficial da CBF (Confederação Brasileira de Futebol). Nessa base de dados existem diversas variáveis que podem ser testadas e utilizadas, como, por exemplo: número de vitórias, empates e derrotas; número de gols feitos e sofridos, média de aproveitamento; número de pontos ganhos no campeonato; entre outras.


Apontamentos

  • Não há apontamentos.