DESENVOLVIMENTO DE UM SISTEMA DE DADOS ANONIMIZADOS A PARTIR DE PRONTUÁRIOS ELETRÔNICOS

Patrick Luiz Martini, Rejane Frozza

Resumo


Com os avanços tecnológicos, passou-se a produzir um volume maior de dados a cada dia, vindos de diversas fontes, como, por exemplo, sensores e aplicações diversas. Este volume de dados gerado acarretou a necessidade de legislações específicas sobre as formas de tratamento e acesso a estes dados pelas Instituições. Neste contexto, o objetivo deste trabalho é desenvolver um sistema de dados anonimizados a partir de prontuários eletrônicos, de modo que possa ser integrado ao sistema de uma Instituição de Saúde. A necessidade de implantação de um sistema de anonimização foi identificada devido às imposições legais em decorrência da aprovação da Lei Geral de Proteção de Dados (LGPD), pelo Governo Brasileiro em 2018.  A LGPD teve impacto direto no fluxo de diversos segmentos de pesquisas, entre eles, o da saúde, uma vez que pesquisas desta área utilizam dados de pacientes para realizar análises. Como metodologia empregada para o desenvolvimento deste trabalho, destaca-se: i) o estudo realizado sobre prontuários eletrônicos, mineração de texto, processamento de linguagem natural (PLN) e sobre a LGPD; ii)  a busca de trabalhos relacionados para elaboração de sínteses, a fim de levantar características das pesquisas desenvolvidas no mesmo tema; iii) definições iniciais com especialistas da área; iv) especificações para o desenvolvimento do sistema anonimizado; v) testes e validação com especialistas da área. Sobre os assuntos envolvidos nesta pesquisa, prontuários eletrônicos são documentos que pertencem aos pacientes, mas ficam sob responsabilidade do médico e da Instituição de saúde. Já a mineração de textos tem como objetivo encontrar informações úteis para o domínio em questão em uma base textual. Enquanto o PLN refere-se à tarefa de processar a linguagem natural dos seres humanos para que os sistemas computacionais consigam interpretá-la. O sistema proposto é composto por cinco etapas: i) identificação de informações do paciente e a criação de uma chave única para ser utilizada na base anonimizado; ii) identificação de informações básicas do paciente como nome, cor/raça, sexo e data de nascimento, entre outras; iii) aplicação de algoritmos de PLN e mineração de texto para categorização das palavras; iv) remoção das palavras categorizadas como sensíveis; e iv) construção do arquivo anonimizado a ser disponibilizado para pesquisas. Com a possiblidade do sistema ser integrado ao da Instituição de Saúde, destaca-se a criação de um fluxo de anonimização de informações, cuja base anonimizada poderá ser atualizada diariamente com novas informações inseridas na base de origem.  Visto que a área de computação tem uma importante característica de interdisciplinaridade, o desenvolvimento de um sistema de dados anonimizado, a partir de prontuários eletrônicos, mostra-se uma interessante possibilidade para contribuir com o andamento de pesquisas que necessitem de dados oriundos de prontuários eletrônicos.


Apontamentos

  • Não há apontamentos.


ISSN 2764-2135