MINERAÇÃO DE DADOS COM REDES BAYESIANAS

Alvin Lauro Beskow, Jacques Nelson Corleta Schreiber

Resumo


A evasão dos alunos nas Instituições de Ensino Superior (IES) é um dos grandes problemas enfrentados pela gestão Universitária, visto que os gastos são planejados em relação ao ingresso de alunos, e as vagas ociosas são um grave problema para a estabilidade do curso e até da IES. Ao longo do tempo, percebeu-se que a coleta de informações é muito maior que o processamento e/ou análise das mesmas, o que gera um problema e uma contradição, pois as organizações, por possuírem uma grande quantia de dados, possuem uma falsa sensação de que estão bem informadas; porém essas informações de nada valem se não forem analisadas de forma correta e em tempo hábil. Uma metodologia emergente, que tenta solucionar o problema da análise de grandes quantidades de dados e ultrapassa a habilidade e a capacidade humana, é a descoberta de conhecimento em banco de dados. Data mining, ou mineração de dados, é uma técnica que faz parte de uma das etapas da descoberta de conhecimento em banco de dados. Ela é capaz de revelar, automaticamente, o conhecimento que está implícito em grandes quantidades de informações. Essa técnica pode fazer, entre outras, uma análise antecipada dos eventos, possibilitando prever tendências e comportamentos futuros, permitindo aos gestores a tomada de decisões baseada em fatos e não em suposições. Além do que, uma pequena eficácia (+- 3%) em uma organização, possibilita a economia de milhares de reais, visto que o índice de evasão total em cursos como a Ciência da Computação está próximo de 80%. Uma forma de tentar amenizar o problema do contexto apresentado foi o desenvolvimento de uma ferramenta (Software) que auxilia os gestores na tomada de decisão, este software por sua vez, utiliza como base de cálculo as Redes Bayesianas, que foi a metodologia usada para prever a evasão. O processo de mineração de dados envolve várias etapas até deixar os dados consistentes, sem isso, eles podem conter informações erradas tanto, por erro de digitação, duplicação de dados, ou até mesmo como ruído, que são informações fora da curva de aprendizagem. Para evitar que a rede "aprenda" essas informações, precisamos normalizar os dados, reduzindo a quantia de atributos e agrupando valores semelhantes, no entanto essa fase requer muita dedicação, mesmo porque várias tentativas não trazem benefícios, mas sim malefícios para a rede, sem mencionar que consome uma grande parcela do tempo. Enfim, até o momento dessa redação, conseguimos formular a parte visual e a parte estrutural do software, também conseguimos gerar algumas redes, porém a mais precisa está com aproximadamente 70% de acerto das investidas, isso tudo, mesmo com os dados não completamente normalizados, ou seja, podemos melhorar. Com isso, concluímos que a mineração de dados, mais especificadamente em Redes Bayesianas, é um tema com um grande potencial, ainda que sua base bibliográfica seja pequena, pode ser altamente interessante, dado que o assunto é bastante amplo, quebrando as barreiras entre as diferentes áreas do conhecimento, aliás, ela é muito difundida na área da saúde, o que ajuda a popularizar a integração das diferentes áreas do conhecimento em novos trabalhos e linhas de pesquisa.

 

Apontamentos

  • Não há apontamentos.