MINERAÇÃO DE DADOS APLICADA À ANÁLISE E PREVISÃO DE CRIMES

Daniel Pravitz, Rejane Frozza

Resumo


Crime é um dos principais problemas sociais que está continuamente crescendo em intensidade e complexidade, influenciando no desenvolvimento social e econômico de um país. Diante do desafio de superar o fenômeno da violência urbana, faz-se necessária uma polícia orientada para a solução do problema sendo a prevenção de crimes um dos pilares deste modelo. Em cada crime cometido, pode-se levantar uma série de dados que, quando analisados e contextualizados, transformam-se em informação. A informação aplicada de forma útil gera conhecimento. Neste sentido, a Mineração de dados é uma técnica computacional que consiste em aplicar algoritmos que objetivam transformar os dados em informação e, posteriormente, em conhecimento, imprescindível para o processo de tomada de decisão. A Mineração de Dados pode ser aliada para análise dos dados nesta área e contribuir para prevenção de crimes através da automatização dos métodos provenientes do Aprendizado de Máquina. Assim sendo, o objetivo principal é aplicar técnicas de Mineração de Dados e de Aprendizado de Máquina para prever possíveis ocorrências criminais a partir de dados históricos relacionados à cidade de São Paulo. A questão de pesquisa abordada, neste contexto, é “Seria possível prever a probabilidade de um crime ocorrer através de uma análise histórica dos incidentes já ocorridos?”. A metodologia da pesquisa realizada no desenvolvimento do trabalho envolve: (1) estudo do referencial teórico e levantamento bibliográfico a respeito da criminalidade, criminalidade no contexto brasileiro, previsão de crimes, descoberta de conhecimento em base de dados e Mineração de Dados; (2) bibliometria quantitativa (levantamento do número de trabalhos existentes relacionados ao assunto) e qualitativa (sínteses do trabalhos relacionados escolhidos), comparando os trabalhos selecionados através de um quadro comparativo (3) modelagem e desenvolvimento do sistema para previsão e análise de crimes; (4) validação do sistema em relação à taxa de assertividade. Para a validação e treinamento serão utilizadas as ocorrências criminais da cidade de São Paulo, envolvendo os crimes de roubo (celulares e veículos) e furto (celulares e veículos) no período de 2012 a 2018, utilizando técnicas como validação cruzada, com o objetivo de medir a acurácia do sistema. A cidade de São Paulo foi escolhida devido a diversos fatores, sendo o principal a quantidade de dados abertos relacionados às ocorrências criminais, fatores socioeconômicos, demográficos e ambientais, e por representar grande parte da população brasileira. A arquitetura do sistema é constituída de três módulos: repositório de dados, núcleo de inteligência e interface do usuário. O repositório de dados contém as informações relacionadas às ocorrências criminais, dados demográficos, socioeconômicos, ambientais e as previsões provenientes do núcleo de inteligência. Este núcleo é responsável por utilizar os dados presentes na base do sistema para treinar e testar os modelos de previsão, com técnicas de mineração de dados e os algoritmos relacionados à tarefa de previsão. Os melhores resultados alimentam a base de dados do sistema com as previsões realizadas. A interface do usuário é responsável por exibir as previsões realizadas de forma gráfica e intuitiva. Em cada crime cometido, pode-se levantar uma série de dados que podem ser utilizados na elaboração de um sistema previsor de crimes. Assim, pretende-se contribuir para ações mais efetivas de combate aos crimes.


Apontamentos

  • Não há apontamentos.