IDENTIFICAÇÃO DE SEGMENTOS TEMPORAIS CAPAZES DE PREVER AS FUTURAS PUBLICAÇÕES DO CORPO DOCENTE DAS INSTITUIÇÕES DE ENSINO SUPERIOR
Resumo
Uma gestão proativa, em amplo contexto, é denotada por um melhor uso dos recursos com o menor custo possível, então, informações privilegiadas e de confiança sobre o corpo docente de uma Instituição de Ensino Superior (IES), são de suma importância. Com isso, métricas para análise de grandes bases de dados, capazes de extrair conhecimento em tempo/forma hábil, são fundamentais. Nesse contexto, foi iniciada a pesquisa com o principal objetivo de estudar algoritmos capazes de prever acontecimentos temporalmente, com base em um histórico previamente gerado, para que com isso seja possível estimar possíveis publicações qualificadas, que o corpo docente pode vir a ter com o passar dos meses, para que com isso, os coordenadores possam prever possíveis investimentos que sejam necessários em determinados períodos. Em geral, o processo de mineração de dados por sequenciação, requer que o desenvolvedor crie uma linha temporal, determinando os itens, e segmentos temporais de cada professor, para que então o algoritmo assuma sua função de gerar as possíveis relações entre as publicações para gerar as dos professores. Por exemplo, assume-se que o professor 1 publicou um A1 e um B2, em anos diferentes, então essas publicações irão pertencer ao professor 1, no entanto esses “itens” estarão em dois espaços de tempo. Essa etapa, é sem dúvida uma das mais complexas e demoradas, visto que não existe uma regra exata de qual espaço temporal usar, e em qual frequência usar, além do que essa é a etapa que delimita a funcionalidade ou não do método. O algoritmo estudado capaz de prever sequencialmente essas ocorrências, é o Generalized Sequential Patterns (GSP), que foi criado por Ramakrishnan Srikant e por Rakesh Agrawal, no qual se divide em dois principais passos, a geração de candidatos e a poda de candidatos. A geração dos candidatos é referente à análise dos dados, e na tentativa de encontrar outros dados, em outros espaços temporais. Já a poda dos candidatos está relacionada ao número de ocorrências que cada candidato virá a ter, visto que, se ele for infrequente será descartado. Parcialmente, foram obtidos alguns dados de professores de uma IES, na qual foram adquiridos a partir da Plataforma Lattes, e estão sendo preparados para melhor aproveitar a geração de sequências. Até o momento da redação desse texto, conseguiu-se algumas estimativas de futuras publicações de alguns docentes, no entanto os índices de poda, da primeira e segunda etapa do GSP, estão próximos aos 60%, ou seja, essa ocorrência está aproximadamente 60% correta, o que pode ser melhorado com o decorrer da pesquisa. Portanto, esse projeto, o qual está sendo baseado na predição de futuras publicações por parte docentes das IES, está conseguindo boas estimativas, aliás, o tema é de altíssima inovação, visto que esses métodos podem vir a ser pré-requisito para uma boa gestão universitária.
Apontamentos
- Não há apontamentos.