IDENTIFICAÇÃO DE SEGMENTOS TEMPORAIS CAPAZES DE PREVER AS FUTURAS PUBLICAÇÕES DO CORPO DOCENTE DAS INSTITUIÇÕES DE ENSINO SUPERIOR

Alvin Lauro Beskow, Verônica Meinhardt Najdzion, Juliana Ipê da Silva, Júlia Weber Reuter, Guilherme Augusto Schwingel, Jacques Nelson Corleta Schreiber

Resumo


Uma gestão proativa, em amplo contexto, é denotada por um melhor uso dos recursos com o menor custo possível, então, informações privilegiadas e de confiança sobre o corpo docente de uma Instituição de Ensino Superior (IES), são de suma importância. Com isso, métricas para análise de grandes bases de dados, capazes de extrair conhecimento em tempo/forma hábil, são fundamentais. Nesse contexto, foi iniciada a pesquisa com o principal objetivo de estudar algoritmos capazes de prever acontecimentos temporalmente, com base em um histórico previamente gerado, para que com isso seja possível estimar possíveis publicações qualificadas, que o corpo docente pode vir a ter com o passar dos meses, para que com isso, os coordenadores possam prever possíveis investimentos que sejam necessários em determinados períodos. Em geral, o processo de mineração de dados por sequenciação, requer que o desenvolvedor crie uma linha temporal, determinando os itens, e segmentos temporais de cada professor, para que então o algoritmo assuma sua função de gerar as possíveis relações entre as publicações para gerar as dos professores. Por exemplo, assume-se que o professor 1 publicou um A1 e um B2, em anos diferentes, então essas publicações irão pertencer ao professor 1, no entanto esses “itens” estarão em dois espaços de tempo. Essa etapa, é sem dúvida uma das mais complexas e demoradas, visto que não existe uma regra exata de qual espaço temporal usar, e em qual frequência usar, além do que essa é a etapa que delimita a funcionalidade ou não do método. O algoritmo estudado capaz de prever sequencialmente essas ocorrências, é o Generalized Sequential Patterns (GSP), que foi criado por Ramakrishnan Srikant e por Rakesh Agrawal, no qual se divide em dois principais passos, a geração de candidatos e a poda de candidatos. A geração dos candidatos é referente à análise dos dados, e na tentativa de encontrar outros dados, em outros espaços temporais. Já a poda dos candidatos está relacionada ao número de ocorrências que cada candidato virá a ter, visto que, se ele for infrequente será descartado. Parcialmente, foram obtidos alguns dados de professores de uma IES, na qual foram adquiridos a partir da Plataforma Lattes, e estão sendo preparados para melhor aproveitar a geração de sequências. Até o momento da redação desse texto, conseguiu-se algumas estimativas de futuras publicações de alguns docentes, no entanto os índices de poda, da primeira e segunda etapa do GSP, estão próximos aos 60%, ou seja, essa ocorrência está aproximadamente 60% correta, o que pode ser melhorado com o decorrer da pesquisa. Portanto, esse projeto, o qual está sendo baseado na predição de futuras publicações por parte docentes das IES, está conseguindo boas estimativas, aliás, o tema é de altíssima inovação, visto que esses métodos podem vir a ser pré-requisito para uma boa gestão universitária.


Apontamentos

  • Não há apontamentos.