SISTEMA DE RECONHECIMENTO DE FACES EM VÍDEO
Resumo
O reconhecimento de faces por computador é um assunto que traz interesse, visto que não só está presente no meio acadêmico, comercial e militar, como em diversos itens de entretenimento, de filmes a seriados, como por exemplo Person of Interest, que tem por foco específico esse assunto. No meio acadêmico é uma área madura, cuja aplicabilidade como tecnologia se torna viável, com crescente redução de margens de erros de reconhecimento. O reconhecimento de faces de forma automatizada é uma tecnologia cuja importância cresce com o desenvolvimento de sistemas de segurança e monitoria em resposta a atentados terroristas. Também possui utilidade nas áreas de entretenimento e comércio, nas quais permite automatizar e agilizar processos. Este trabalho visa utilizar Support Vector Machines (SVM) na tarefa de reconhecimento de faces automatizado em vídeo. SVM é uma técnica de classificação binária linear, que visa separar pontos de entrada do espaço amostral por um plano separatório, o mais largo o possível. Através do uso de técnica Kernel Trick, é possível executar a classificação de forma não linear, em um espaço de dimensões maiores, com baixo custo computacional. A técnica pode ser expandida para classificações multi-classe. O processo de reconhecimento engloba duas etapas principais, a detecção de faces e o posterior reconhecimento. Ambos são aprofundados neste trabalho, embora o foco se encontre no problema do reconhecimento e aplicação de SVM para o mesmo. É explorado para detecção de faces o método Detector de faces Viola-Jones, cuja variante do mesmo chamada Haar Feature-based Cascade Classifier será utilizada na criação do sistema de reconhecimento. Especificamente, será utilizada a versão implementada do algoritmo anterior pela biblioteca Open Source Computer Vision (OpenCV). A função do SVM se encontra em classificar corretamente uma face detectada, a partir de imagens de vídeo. Para tanto, são abordados três métodos de classificação multi-classe baseados em SVM, respectivamente: um-contra-um, um-contra-todos e Grafo Dirigido Acíclico SVM, DAGSVM (do inglês Directed Asiclic Graph SVM). Este último processo de classificação ganha ênfase por ser implementado por grafos de diferentes tamanhos, criados de acordo com a necessidade do problema, levando ao refinamento do desempenho classificatório. Para a etapa de reconhecimento, será utilizada a biblioteca LIBSVM, que possui a implementação dos métodos de classificação comentados. Serão utilizadas bases de imagens de faces, e de imagens de vídeo, que podem conter faces, para treinamento e teste dos modelos de reconhecimento. As imagens precisam ser tratadas para serem utilizadas na LIBSVM. Este processo pode requerer transformações para reduzir o tamanho de cada imagem e extrair áreas mais relevantes para o processo de classificação. Uma tabela comparativa das três técnicas de classificação por SVM será montada comparando diferentes bases utilizadas, e valores obtidos com outras técnicas sobre as mesmas (obtidos da literatura). O trabalho está em andamento, na presente data preparando imagens de faces para o algoritmo de detecção. Está se utilizando da base de imagens de faces pré-existentes (especificamente, AT-T "The Database of Faces"), sem obtê-las diretamente de vídeo. Obtendo-se sucesso com estas, progressivamente serão utilizadas bases mais próximas a qualidade existente em vídeo.
Apontamentos
- Não há apontamentos.