ADAPTAÇÃO TEMPORAL E QUALITATIVA SOBRE MECANISMOS DE CLIPAGEM ELETRÔNICA

EDUARDO KROTH, ROBERTO ANTONIO SCHUSTER FILHO

Resumo


Na área da Comunicação Social, tem-se uma atividade denominada de clipagem, através da qual, profissionais recuperam recortes de mídias (jornais, revistas, sites, etc.) conforme uma determinada área do conhecimento. Mais recentemente, a Informática evoluiu esta atividade para o que se conhece por "clipagem eletrônica". Nesta evolução, softwares específicos fazem o papel de pesquisar e recuperar conteúdos da mídia, armazenando-os em um banco de dados para posteriores consultas. Sobre o conteúdo recuperado, tem-se uma atividade posterior que consiste na qualificação dos conteúdos obtidos. Para se alcançar isto, é preciso definir critérios de qualidade, mais precisamente, trabalha-se com "Qualidade de Dados". Esta pesquisa consiste na evolução do trabalho de conclusão "Robô de Captura e Indexação de Textos para Clipagem On-line com Base em Ontologias", de autoria de Claudio Omar Correa Carvalho Junior. O resultado deste trabalho foi o OntoClipping, uma ferramenta de clipagem eletrônica que utiliza ontologia como forma de representação do conhecimento, em conjunto com técnicas de recuperação da informação (RI) aliadas a um motor de busca de páginas web, em que o material coletado pelo processo de clipagem é armazenado em uma base de dados relacional. Considerando que o modelo de dados relacional tende a refletir um estado momentâneo do banco de dados, foi necessário considerar o aspecto temporal na modelagem de dados. Além disso, a análise do material coletado é um dos pontos principais deste trabalho, a fim de fornecer uma avaliação qualitativa das informações. Deste modo, estudos se fizeram necessários para a especificação de novas características que permitem a avaliação qualitativa das informações a partir de critérios específicos, como: 1) categorização das fontes de informação; 2) categorização e mapeamento de gêneros e formatos jornalísticos; 3) mapeamento e coleta de atributos que caracterizam a completude dos dados; 4) definição da abrangência das fontes de informação através da importação de dados de tráfego. Foi incluído na ferramenta um recurso que permite a configuração e categorização de fontes de informação. Ou seja, é possível cadastrar e definir um peso para os sites que possivelmente terão informações coletadas pelo robô de busca, podendo assim influenciar na classificação dos resultados de busca do usuário. Considerando que as notícias coletadas podem ser classificadas em diferentes gêneros e formatos jornalísticos, e que estes gêneros e formatos possuem importâncias distintas para uma determinada área do conhecimento, a categorização dos mesmos também foi um critério de avaliação qualitativa desenvolvido neste trabalho. Desta forma, é possível obter uma classificação mais inteligente dos resultados da busca do usuário. Além disso, a definição de termos equivalentes para os gêneros e formatos também foi permitida para fins de padronização. O mapeamento da completude foi outra característica desenvolvida neste trabalho. Este recurso tem o objetivo de permitir a identificação de atributos necessários para caracterizar a completude dos materiais coletados no processo de clipping como fonte, autor, título, data de publicação e de atualização, entre outros. Em virtude dos fatos mencionados, espera-se que este trabalho possa contribuir na atividade de clipagem, através de resultados mais criteriosos e de maior qualidade. Logo, se faz necessária a validação da ferramenta por período indeterminado, em uma empresa que realize cl.


Apontamentos

  • Não há apontamentos.