UTILIZAÇÃO DO PROCESSAMENTO DE LINGUAGEM NATURAL NA AVALIAÇÃO DAS PRODUÇÕES CIENTÍFICAS E TECNOLÓGICAS REGISTRADAS NA PLATAFORMA LATTES

Victor Hugo Aguiar Pacce, Gilson A. Helfer, Adilson Ben da Costa, Aline Ramos da Silva

Resumo


As universidades são grandes centros de produção do conhecimento, onde a ciência é parte do cotidiano das suas atividades. A CAPES desempenha papel fundamental na formação de profissionais altamente qualificados, por meio da disseminação e da avaliação periódica da pós-graduação stricto sensu (mestrados e doutorados). A produção acadêmica é todo trabalho publicado com embasamento científico e vinculado a universidades reconhecidas pelo MEC (Ministério da Educação). É por meio da pesquisa acadêmica científica que os resultados são obtidos e, então, divulgados para conhecimento da sociedade. As produções acadêmicas e científicas geram um grande volume de dados e experimentações, tornando as informações publicadas por meio de artigos, livros, patentes etc. de alta confiabilidade. A utilização de indicadores de desempenho é cada vez mais necessária, principalmente ao analisar a situação do cenário econômico e competitivo em que as instituições de ensino estão se deparando. Os indicadores de ciência e tecnologia são dados estatísticos utilizados na projeção de cenários e tendências sobre o avanço científico e tecnológico de um tema, servindo para subsidiar a tomada de decisão e o planejamento de políticas públicas. Já a produção científica e os seus respectivos estudos, resultados, temas e repercussões em cada área do conhecimento, podem ser considerados um instrumento que auxilia no direcionamento de estratégias visando o desenvolvimento de políticas e diretrizes operacionais. Desta forma, fornecem contribuições para um alinhamento das políticas e da condução da ciência e o impacto das pesquisas no futuro. Dentro da área de Processamento de Linguagem Natural, há uma variedade de técnicas que podem ser aplicadas com o objetivo de explorar essas produções. Uma das técnicas é a modelagem de tópicos, que permite discernir os tópicos de um documento de texto a partir de um banco de palavras. Considerando estas características, o objetivo principal deste trabalho é desenvolver um algoritmo capaz de identificar os campos metodológicos de corpus de publicações cientificas e tecnológicas, para auxiliar no processo de extração informações de pesquisa de forma a entregar informações qualitativas. Sendo assim, os seguintes objetivos específicos são definidos como estudar modelos de algoritmos para coleta, processamento e análise de dados referentes a produções cientificas e tecnológicas. Pretende-se utilizar técnicas de Processamento de Linguagem Natural (PLN), como a mineração de textos, para entender e levantar dados sobre a produção acadêmica. Além disso, dar continuidade ao projeto Farol - ferramenta desenvolvida na UNSC que visa apoiar a gestão da produção científica e tecnológica de instituições de ensino superior utilizando a base de dados da Plataforma Lattes adicionando novas funcionalidades com foco em dados qualitativos.

Apontamentos

  • Não há apontamentos.


ISSN 2764-2135