MÉTODOS PARA EXTRAÇÃO DE PADRÕES DE TRATAMENTO E SINTOMAS DE REAÇÕES ALÉRGICAS EM MÍDIAS SOCIAIS UTILIZANDO PROCESSAMENTO DE LINGUAGEM NATURAL

Fernando Battisti da Silva, Rejane Frozza, Gilson Augusto Helfer

Resumo


Juntamente com o aumento considerável da população global, as grandes indústrias alimentícias e de cosméticos começam a enfrentar novos desafios para sobreviver a um mercado cada vez mais competitivo e abrangente. A qualidade de um produto não é mais apenas vista como uma questão de gosto, mas também como uma questão de saúde e precaução para diversos tipos de problemas, como as alergias. Neste contexto, este trabalho tem como objetivo analisar relatos na rede social twitter, a fim de descobrir palavras ou termos relacionados a possíveis reações alérgicas de produtos por parte de consumidores. Para atender este objetivo, a proposta é desenvolver um algoritmo, baseado em técnicas de processamento de linguagem natural, capaz de relacionar textos de usuários na rede social twitter que estão tendo reações alérgicas com o uso de componentes potencialmente tóxicos em produtos consumidos pelos mesmos usuários, descobrindo padrões de possíveis causas de crises alérgicas e auxiliando no diagnóstico rápido e prevenção. A questão de pesquisa abordada, neste contexto, é “A coleta de informações sobre dados alérgicos de pessoas e produtos, organizados de forma estruturada, é capaz de permitir uma análise sobre os fatores que prejudicam a saúde das pessoas e do meio ambiente e contribuir para alteração na fórmula desses produtos?”. A metodologia da pesquisa realizada no desenvolvimento do trabalho envolve: (1) estudo do referencial teórico e levantamento bibliográfico a respeito do uso de informações de usuários para a identificação de padrões dos consumidores, um breve histórico do que já existe em termos de aproveitamento de dados de pessoas, os perigos dos produtos tóxicos ou alérgicos para os consumidores; (2) bibliometria quantitativa (levantamento do número de trabalhos existentes relacionados ao assunto) e qualitativa (síntese dos trabalhos relacionados escolhidos), comparando os trabalhos selecionados através de um quadro comparativo (3) modelagem e desenvolvimento do algoritmo para interpretação e identificação de reações alérgicas em consumidores; (4) validação  do sistema em relação a taxa de assertividade. Para a validação e treinamento será utilizado um conjunto de rotinas chamado Application Programming Interface (APIs) da rede social twitter contendo postagens de um número determinado de usuários. A rede social twitter foi escolhida para ser analisada tendo em vista a facilidade de acesso às API se o objetivo principal que muitos dos usuários têm com a mesma: transmitir seus pensamentos e opiniões do momento. A arquitetura do algoritmo possuirá três módulos: i) módulo de processamento para realizar a captação das palavras e a interpretação e comparação das palavras utilizando as técnicas de linguagem natural; ii) dicionário de palavras que transmite a ideia de reações alérgicas e é utilizado para realizar comparações com as palavras presentes nas postagens dos usuários do twitter. Se a palavra existente na postagem existe no dicionário, esta mesma poderá indicar uma reação alérgica no usuário. Os melhores resultados alimentam a base de dados do sistema com as previsões realizadas; iii) módulo que gera gráficos acerca dos resultados conquistados dos usuários analisados por suas postagens gravadas na API. Dessa forma, pretende-se contribuir para uma compatibilidade maior dos produtos com seus consumidores.


Apontamentos

  • Não há apontamentos.