AudioProcessing

Classificação de Eventos Sonoros

Esse projeto foca no processamento de sinais de áudios e na extração de características dos mesmos através de uma Rede Neural Convolucional, utilizando o Keras como frontend e o TensorFlow como backend.

A captura, análise e caracterização automáticas dos sons urbanos são utilizadas na redução da poluição sonora, computação sensível ao contexto e vigilância. Tais aplicações podem melhorar aspectos essenciais da vida urbana, incluindo saúde, mercado imobiliário, segurança e educação. Nesse âmbito, o conjunto de dados utilizado é uma base pública chamada UrbanSound8K. Essa base conta com 8732 áudios com duração inferior ou igual a 4 segundos rotulados em 10 classes distintas: ar condicionado, buzina de carro, crianças brincando, latido de cachorro, furadeira, motor de veículo, tiro, britadeira, sirene e música de rua. Com exceção das classes crianças brincando e tiros, todas as outras classes foram selecionadas devido a alta frequência em que aparecem no serviço de reclamações de ruído urbano 311 da cidade de Nova York.

Passos importantes

A metodologia proposta para a classificação de eventos sonoros conta com cinco etapas:

Aquisição de dados, consiste na obtenção dos sinais de áudio obtidos através de base de dados pública;
Pré-processamento, onde os dados serão uniformizados,aumentados e representados em diferentes domínios que serão empregados na etapa 3; O pré-processamento, subdivide-se em 3 passos: (1) aumento dos dados decorrente da aplicação de alterações no conjunto de amostras de treinamento para fins de balanceamento e aumento do número de amostras (scripts: urbansound8k_jams_generator.py e urbansound8k_augmentation.py); (2) uniformização do sinal de áudio, aplicação de reamostragem e quantização dos áudios de treino e teste para garantir homogeneidade e qualidade do sinal de entrada (script: urbansound8k_resample.py); (3) geração da representação do sinal de áudio, que servirá de entrada para etapas de extração de características (script: urbansound8k_spectrogram.py).
Extração de Características, nesta etapa temos o aprendizado de características por meio de uma CNN é treinada com espectrogramas dos áudios a fim de extrair características relevantes da representação do sinal e gerar um descritor. De posse do descritor, é possível aplicá-lo diretamente na etapa 4;*
Classificação, onde o classificador que será responsável por associar cada áudio a uma classe de evento sonoro;*
Validação, que será utilizada para avaliar se o descritor gerado pode se utilizado pelo método de classificação para detectar as classes de eventos sonoros de maneira acurada.*

estão presentes no notebook: urbansound8k_cnn.ipynb

Dependências

Segue a lista de bibliotecas necessárias para a execução da metodologia:

JAMS para v0.3.2

pip install jams

LibROSA

pip install librosa

MUDA para v0.2.0

pip install muda

SoX

sudo apt install sox

TensorFlow

pip install --upgrade pip pip install tensorflow

Keras

sudo pip install keras

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AudioProcessing

Classificação de Eventos Sonoros

Passos importantes

Dependências

About

Releases

Packages

Contributors 4

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
Minicurso Ercas 2019.pdf		Minicurso Ercas 2019.pdf
README.md		README.md
urbansound8k_augmentation.py		urbansound8k_augmentation.py
urbansound8k_cnn.ipynb		urbansound8k_cnn.ipynb
urbansound8k_jams_generator.py		urbansound8k_jams_generator.py
urbansound8k_resample.py		urbansound8k_resample.py
urbansound8k_spectrogram.py		urbansound8k_spectrogram.py

deborahvm/AudioProcessing

Folders and files

Latest commit

History

Repository files navigation

AudioProcessing

Classificação de Eventos Sonoros

Passos importantes

Dependências

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Languages

Packages