SISTEMA PARA PREDIÇÃO DA EVASÃO DISCENTE

Tiago Roberto Mutschall Krebs, Jacques Corleta Schreiber

Resumo


O presente trabalho propõe o uso das redes Bayesianas na intenção de evidenciar as probabilidades de evasão de alunos matriculados em cursos de ensino superior. Com base na metodologia aplicada, propor a criação de um software capaz de apontar essas probabilidades e realizar insigths sobre os dados analisados. Inicialmente, fez-se um estudo de obras nacionais e estrangeiras que abordam a evasão a fim de levantar os motivos relacionados ao fenômeno. Dentre os mais citados destacam-se informações pessoais dos alunos como idade e sexo, mas também acadêmicas, como quantidade de disciplinas cursadas e frequência em aula. Após, um novo estudo e explanação acerca da aprendizagem Bayesiana e das redes Bayesianas, com exemplos voltados para o problema. Foram utilizados dados da Universidade de Santa Cruz do sul (UNISC), contendo informações da instituição e de histórico acadêmico dos alunos entre os anos de 2006 e 2012, na tentativa de prever os acontecimentos-alvo em 2013 e 2014. Uma vez que os dados foram selecionados e extraídos, a montagem da rede Bayesiana foi feita para a análise dos mesmos bem como a realização de inferências sobre a rede a fim de descobrir as probabilidades de evasão. Inicialmente foi encontrada a probabilidade média de um grupo de alunos onde em 95% dos casos em que o aluno evadiu a rede evidenciou probabilidade acima da média sem ter conhecimento do fato. Entretanto, esse resultado se mostrou impreciso após análise mais criteriosa da estrutura da rede proposta, bem como da situação dos dados analisados no que diz respeito a padronização das informações e limpeza de possíveis "sujeiras" contidas. O processo para chegar a esse resultado dependeu de conhecimento técnico sobre os dados e da metodologia proposta, o que inviabiliza seu uso sem a necessidade de um especialista. Os próximos passos do trabalho são a limpeza do banco de dados obtido, com base em técnicas de data mining, a passagem desses dados a um algoritmo que deverá identificar quais os atributos mais significativos contidos no dataset para então criar-se uma nova estrutura para a rede Bayesiana, através do algoritmo TAN e, então, analisar os novos resultados obtidos. Através desses procedimentos, espera-se chegar a um nível de maior acurácia na predição de alunos com probabilidade de evasão considerando suas informações pessoais e acadêmicas. Ao final, propõe-se a criação de um software que aumente o nível de abstração nos procedimentos realizados, a fim de resultar em uma boa ferramenta de apoio a decisão para gestores e professores de cursos de graduação.

Apontamentos

  • Não há apontamentos.