ATRIBUTOS PNCC PARA RECONOCIMIENTO ROBUSTO DE LOCUTOR INDEPENDIENTE DEL TEXTO

Autores/as

  • Harry Anacleto Silva Universidad César Vallejo - filial Trujillo

DOI:

https://doi.org/10.26495/icti.v3i2.431

Palabras clave:

Reconocimiento de Locutor, MFCC, GFCC, PNCC, Robustez frente al ruido

Resumen

El reconocimiento automático de locutores ha sido sujeto de intensa investigación durante toda la década pasada. Sin embargo las características, del estado de arte de los algoritmos son drásticamente degradados en presencia de ruido. Este artículo se centra en la aplicación de una nueva técnica  llamada Power-Normalized Cepstral Coefficients (PNCC) para el reconocimiento de locutor independiente del texto. El objetivo de este estudio es evaluar las características de esta técnica en comparación con la técnica convencional Mel Frequency Cepstral Coefficients (MFCC) y la técnica Gammatone Frequency Cepstral Coefficients (GFCC). 

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Garofolo, JS., Lamel, LF. , Fisher, WM., Fiscus, JG., Pallett, DS. , Dahlgren, NL. (1993). The DARPA – TIMIT Acoustic-Phonetic Continuous Speech Corpus. [CD-ROM] Philadelphia: Linguistic Data Consortium.

Kim, C., Stern, R. (2010). Feature Extraction For Robust Speech Recognition Based On Maximizing The Sharpness Of The Power Distribution And On Power Flooring. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, pág. 4574–4577.

Reynolds, D., Rose, R. (1995). Robust Text-Independent Speaker Identification Using Gaussian Mixture Speaker Models. , IEEE Trans. on Speech and Audio Processing, (3), pág. 72-83.

Wang, DL. , Brown, GJ. (2006). Computational Auditory Scene Analysis: Principles, algorithms, and applications. Hoboken. New Jersey: Wiley-IEEE.

Zhao, X., Shao, Y., Wang DL. (2012).CASA - Based Robust Speaker Identification. IEEE Trans. Audio, Speech and Language Processing, 20(5), pág. 1608-1616.

Zhao, X., Wang, D. (2013). Analyzing Noise Robustness Of Mfcc And Gfcc Features In Speaker Identification. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, pág. 7204–7208.

Publicado

2016-09-12

Cómo citar

Anacleto Silva, H. (2016). ATRIBUTOS PNCC PARA RECONOCIMIENTO ROBUSTO DE LOCUTOR INDEPENDIENTE DEL TEXTO. INGENIERÍA: iencia, Tecnología Innovación, 3(2), 35–40. https://doi.org/10.26495/icti.v3i2.431

Número

Sección

ARTÍCULOS INTERNOS