UM AMBIENTE PARA INDEXAÇÃO DE DOCUMENTOS COM BASE EM UM SISTEMA GERENCIADOR DE FOTOS

Eduardo Kroth, Alexandre Spode

Resumo


 

A incapacidade dos mecanismos de busca realizar recuperação de informação relevante é um dos maiores problemas no contexto de Recuperação de Informação. Isso ocorre pois, muitas vezes, os motores de busca não identificam a área de conhecimento que tal informação está inserida, ou seja, apenas fazem uma busca através da indexação de documentos, tornando o resultado da busca ineficiente, gerando uma constante insatisfação com relação ao resultado de buscas. Este estudo faz o uso de estruturas baseadas em Tesauros e indexação de documentos em uma área de conhecimento qualquer como modelo de consultas de dados em um software gerenciador de imagens, possibilitando a recuperação mais precisa da imagem requerida pelo usuário. Este trabalho propõe-se o estudo e implementação de novas técnicas de recuperação de informação que proporcionem a minimização dos problemas acima citados, levando em consideração os termos pesquisados pelo usuário. Este trabalho tem como referências principais os estudos desenvolvidos por Molinar (2005) e Fagundes (2007). Molinar (2005) manteve o foco no Gerenciamento Eletrônico de Documentos (GED) juntamente com definições sobre Tesauros. A partir daí, construiu um modelo de software para controle e catalogação de documentos históricos em um colégio da cidade. Fagundes (2007) buscou incorporar novas funcionalidades aos mecanismos de indexação, catalogação e busca de documentos, como, por exemplo, aplicação de funções de similaridade no processo de busca, a fim de aumentar qualitativamente e quantitativamente o número de documentos recuperados, definindo um ranking por relevância. Os estudos realizados durante este trabalho, juntamente às referências aos trabalhos acima citados, este trabalho de conclusão apresenta uma proposta de software a fim de minimizar alguns problemas existentes na área de indexação, consulta e Recuperação de Informação (RI) em imagens com base em um sistema gerenciador de fotos, de forma que se consiga aumentar a abrangência de documentos pesquisados, mostrando resultados relevantes com relação aos termos inseridos na consulta. Motivações e Justificativas: Com o aumento exponencial do uso e acesso ao conteúdo digital, principalmente imagens e textos, foi necessária a criação de novos sistemas de informação, capazes de gerenciar eficientemente um grande número de imagens. Assim, foram criados os bancos de imagens, capazes de armazenar, indexar e recuperá-las. Um dos softwares mais conhecidos desta área chama-se Google Picasa. Porém, há um problema com relação à busca de documentos no que diz respeito ao contexto de busca desejado pelo usuário. Muitas vezes, torna-se bastante difícil buscar a informação que usuário deseja devido à ineficiência dos softwares existentes e a grande quantidade de documentos existentes. Neste cenário, faz-se necessário desenvolver um sistema capaz de realizar a indexação de documentos de uma área de conhecimento qualquer com uma base de dados de um gerenciador de imagens, a fim de potencializar o processo de recuperação e armazenamento de imagens. Objetivos: Estudar formas de armazenamento de dados em um sistema gerenciador de fotos; Definição/Especificação de um software de indexação de documentos; Especificação de um software de busca de fotos através do uso de Tesauros.

 


Apontamentos

  • Não há apontamentos.