APLICAÇÃO EXPERIMENTAL DA FERRAMENTA TENSORFLOW PARA ESTUDO E ANÁLISE EM CLASSIFICAÇÃO DE IMAGENS EM RECONHECIMENTO DE FACES

Eduardo Borba, Juliana Ipê da Silva, Jacques Schreiber

Resumo


Tensorflow é um sistema de aprendizado de máquina que opera em larga escala em variados ambientes. O TensorFlow também utiliza gráficos de fluxo de dados para representar computação, estados compartilhados e operações que alteram esse estado. Mapeia os nodos do fluxo de dados de diversas máquinas em um cluster e dentro da máquina através de vários dispositivos computacionais, incluindo CPUs multiprocessados, GPUs de propósito geral e TPUs (Tensor Processing Unisc) que são ASICs personalizados. Por sua versatilidade, o TensorFlow pode ser utilizado nas mais diversas aplicações com foco em treinamento de máquina e dedução de redes neurais. Muitos serviços da Google utilizam TensorFlow em sua produção, recentemente lançado em um projeto de código aberto, a sua utilização se tornou amplamente utilizada em pesquisas de aprendizado de máquina. Sabendo das possibilidades, o poder computacional do TensorFlow e os algoritmos de aprendizagem de máquina com rede neural convolucional disponibilizada pela Google, uma ferramenta para classificação de imagens voltado para o reconhecimento de faces foi desenvolvida. Sendo sua aplicação de forma prática e rápida em relação aos modelos atuais pois a base dos algoritmos já está desenvolvida, sendo somente necessário a adaptação de mesmo. A captura da base de dados para a classificação é feita através de um pequeno vídeo de cerca de 10 segundos, em três dias diferentes, então esses vídeos passam por um processo para separar seus frames em imagens individuais, criando um banco de dados de imagens. Utilizando o código disponibilizado pela Google, o treinamento da rede neural foi feito com 1000 passos de aprendizagem. Vale ressaltar a importância da qualidade do banco de dados de imagens para um resultado satisfatório. Os resultados obtidos com o treinamento foram satisfatórios em comparação com a complexidade do problema e facilidade de desenvolvimento, com índices acima de 70% de confiança. Mesmo os resultados sendo satisfatórios algumas alterações para melhorar ainda mais seu desempenham pode ser utilizadas, por exemplo, o pré-processamento da imagem se torna de extrema importância para melhores resultados reduzir o espectro de variáveis em relação a imagem, como ruídos do ambiente, roupas utilizadas, diferenças de iluminação, etc. Outra técnica capaz de melhorar o índice de acerto é incluir um banco de imagens de pessoas que não seriam reconhecidas pelo algoritmo junto com um banco de dados de imagens sem pessoas, somente com o ambiente.

Apontamentos

  • Não há apontamentos.