UTILIZAÇÃO DO PROCESSAMENTO DE LINGUAGEM NATURAL NA AVALIAÇÃO DAS PRODUÇÕES CIENTÍFICAS E TECNOLÓGICAS REGISTRADAS NA PLATAFORMA LATTES
Resumo
As universidades são grandes centros de produção do conhecimento, onde a ciência é parte do cotidiano das suas atividades. A CAPES desempenha papel fundamental na formação de profissionais altamente qualificados, por meio da disseminação e da avaliação periódica da pós-graduação stricto sensu (mestrados e doutorados). A produção acadêmica é todo trabalho publicado com embasamento científico e vinculado a universidades reconhecidas pelo MEC (Ministério da Educação). É por meio da pesquisa acadêmica científica que os resultados são obtidos e, então, divulgados para conhecimento da sociedade. As produções acadêmicas e científicas geram um grande volume de dados e experimentações, tornando as informações publicadas por meio de artigos, livros, patentes etc. de alta confiabilidade. A utilização de indicadores de desempenho é cada vez mais necessária, principalmente ao analisar a situação do cenário econômico e competitivo em que as instituições de ensino estão se deparando. Os indicadores de ciência e tecnologia são dados estatísticos utilizados na projeção de cenários e tendências sobre o avanço científico e tecnológico de um tema, servindo para subsidiar a tomada de decisão e o planejamento de políticas públicas. Já a produção científica e os seus respectivos estudos, resultados, temas e repercussões em cada área do conhecimento, podem ser considerados um instrumento que auxilia no direcionamento de estratégias visando o desenvolvimento de políticas e diretrizes operacionais. Desta forma, fornecem contribuições para um alinhamento das políticas e da condução da ciência e o impacto das pesquisas no futuro. Dentro da área de Processamento de Linguagem Natural, há uma variedade de técnicas que podem ser aplicadas com o objetivo de explorar essas produções. Uma das técnicas é a modelagem de tópicos, que permite discernir os tópicos de um documento de texto a partir de um banco de palavras. Considerando estas características, o objetivo principal deste trabalho é desenvolver um algoritmo capaz de identificar os campos metodológicos de corpus de publicações cientificas e tecnológicas, para auxiliar no processo de extração informações de pesquisa de forma a entregar informações qualitativas. Sendo assim, os seguintes objetivos específicos são definidos como estudar modelos de algoritmos para coleta, processamento e análise de dados referentes a produções cientificas e tecnológicas. Pretende-se utilizar técnicas de Processamento de Linguagem Natural (PLN), como a mineração de textos, para entender e levantar dados sobre a produção acadêmica. Além disso, dar continuidade ao projeto Farol - ferramenta desenvolvida na UNSC que visa apoiar a gestão da produção científica e tecnológica de instituições de ensino superior utilizando a base de dados da Plataforma Lattes adicionando novas funcionalidades com foco em dados qualitativos.
Apontamentos
- Não há apontamentos.
ISSN 2764-2135