ESPECIFICAÇÃO DE FUNCIONALIDADES PARA INDEXAÇÃO DE BANCO DE DADOS SOBRE ATRIBUTOS EXTENSOS

EDUARDO KROTH, RODRIGO SEHNEM

Resumo


A tecnologia da informação sempre será uma área onde se terá dezenas de aplicações voltadas aos processos específicos de cada empresa que, na sua grande maioria usam banco de dados relacionais. Devido a este enorme crescimento na quantidade de aplicações e dados gerados a partir destes, torna-se necessária a utilização de técnicas de indexação de documentos, atuando principalmente na seleção, processamento e referenciação das aplicações para uma maior interação com as aplicações desenvolvidas e seus usuários. Para exemplificar estas técnicas de indexação de documentos temos o Google como uma das maiores ferramentas busca e pesquisa que possui um potente motor de busca na web. Banco de dados textuais são semelhantes aos convencionais: dada uma consulta, cada documento deve ser comparado aos termos da mesma para determinar se ele é uma possível resposta. Para que esse processo seja eficiente, uma estrutura de dados chamada índice é utilizada. Com base nestas informações este trabalho foi desenvolvido para propor diretrizes para associar dados, extraídos de um banco de dados relacional, às aplicações e também criar uma aplicação com uma interface bem intuitiva para que o usuário final seja capaz de usá-la de uma maneira simples e ágil, de modo que não seja necessário o apoio de um técnico, aumentando assim a usabilidade desta ferramenta. O desenvolvimento foi realizado em Java, que atende as necessidades da aplicação. Foram criadas telas de parametrização para que usuários de administração da aplicação possam efetuar as configurações desejadas. A partir da alimentação dos parâmetros de pesquisa do motor de busca em banco de dados relacional comum, ou seja, um banco de dados que possuam atributos de tamanhos extensos, depois as informações resultantes do processamento efetuado pela busca foram armazenadas na base de dados criada com a ferrramenta MySql™, o que necessitou a adequação do modelo de dados a ser utilizado. Por fim, os dados foram relacionados e indexados com a ferramenta Lucene™. O Lucene é uma biblioteca de mecanismo de procura de texto altamente escalável e de software livre a partir do Apache Software Fundation. Esta biblioteca possui algoritmos de procura poderosa e eficiente, calcula uma pontuação para cada documento que corresponda a uma determinada consulta e retorna a maioria dos documentos relevantes classificados por essas pontuações. Os resultados gerados da indexação foram revelados em uma aplicação com uma interface amigável onde o usuário pôde também digitar um termo desejado e submetê-lo a consulta. Os dados exibidos ao usuário em uma lista para o usuário, que somente necessitou clicar no link sugerido pela mesma, que posteriormente é aberto o registro desejado na aplicação desejada. Mesmo após a consulta ter sido efetuada o usuário pode escolher novos termos para acrescentar a busca que tenha sido enviado anteriormente. Caso o termo selecionado anteriormente tenha sinônimos são retirados da consulta e uma nova pesquisa é realizada para a exibição dos links. Assim, conclui-se que o trabalho teve êxito no seu propósito ao apresentar resultados satisfatórios através da avaliação dos conteúdos coletados, bem como da apresentação de resultados para o usuário.


Apontamentos

  • Não há apontamentos.