IMPLEMENTAÇÃO DE MECANISMOS DE INDEXAÇÃO ENTRE UM DATA WAREHOUSE E BIG DATA

Jean da Costa Serpa, Eduardo Kroth

Resumo


Introdução: Com o avanço da tecnologia, novas fontes de dados foram criadas e os sistemas de Data Warehouse precisaram adaptar-se para suprir a necessidade da análise de mais dados. Para poder usufruir do potencial das informações não estruturadas, criou-se o conceito de Big Data. Utilizando novas tecnologias, consegue-se processar e analisar grandes quantidades de dados estruturados e não estruturados em tempo real. Objetivo: O objetivo principal deste trabalho é criar mecanismos de indexação de dados entre um Data Warehouse e um Big Data, com a finalidade de aprimorar as pesquisas. A solução tem como objetivo relacionar os dados carregados em um Data Warehouse com os dados coletados (seja da internet, sistemas de gestão ou arquivos texto) e armazenados em um ambiente de Big Data, para que o analista/usuário tenha condições de identificar o perfil dos atendimentos, perfil dos pacientes e relacionar estas informações com os dados coletados no Big Data. Metodologia: Inicialmente, o Data Warehouse será carregado com dados de um sistema de gestão do Hospital Santa Cruz, referente aos atendimentos realizados a pacientes, entre os anos de 2010 e 2015. O ambiente de Big Data será carregado com dados da internet e para isto será utilizado o programa Ontoclipping, desenvolvido no trabalho de conclusão de Claudio Omar Corrêa Carvalho Jr. Com a utilização do Ontoclipping será possível configurar uma base de conhecimento (Ontologias) para que seja possível representar áreas específicas para análise. Em um segundo momento, serão criados os mecanismos de indexação, a interação entre o Data Warehouse e o Big Data. Resultados: espera-se apresentar ao usuário mecanismos que facilitem as pesquisas e o relacionamento das informações. As informações armazenadas no Data Warehouse irão trazer uma visão geral para o analista sobre os atendimentos realizados no hospital e o Big Data possibilitará correlacionar estes atendimentos com demais situações que possam acontecer em qualquer lugar, identificando padrões. Conclusão: As soluções de Big Data atualmente são as maiores responsáveis por auxiliar as empresas nas tomadas de decisões, principalmente empresas baseadas na internet, onde são necessárias quantidades enormes de informações. O ambiente de Data Warehouse proporciona rápidas consultas e facilita as análises, pois concentra somente as informações necessárias para a tomada de decisão, mas trabalha especificamente com dados estruturados, coletados de sistemas de gestão. Relacionar estes dois ambientes, criando mecanismos para consultas avançadas proporciona uma poderosa ferramenta de análise e identificação de padrões e oportunidades.

Apontamentos

  • Não há apontamentos.