Por favor, use este identificador para citar o enlazar este ítem: http://dspace.espoch.edu.ec/handle/123456789/6365
Título : Implementación de un módulo de reconocimiento de voz para niños mediante el procesamiento de señales aplicado en un caso práctico.
Autor : Apolo Díaz, Katty Beatriz
Coba Castillo, Nelly Jacqueline
Director(es): Martínez, Oswaldo
Tribunal (Tesis): Altamirano, Edwin
Palabras claves : TECNOLOGÍA Y CIENCIAS DE LA INGENIERÍA;TELECOMUNICACIONES;PROCESAMIENTO DE SEÑALES;VOZ HUMANA;ENERGÍA;UMBRAL;COEFICIENTES DE PREDICCIÓN LINEAL (LPC);DISTANCIA EUCLIDIANA
Fecha de publicación : feb-2017
Editorial : Escuela Superior Politécnica de Chimborazo
Citación : Apolo Díaz, Katty Beatriz; Coba Castillo, Nelly Jacqueline. (2017). Implementación de un módulo de reconocimiento de voz para niños mediante el procesamiento de señales aplicado en un caso práctico. Escuela Superior Politécnica de Chimborazo. Riobamba.
Identificador : UDCTFIYE;98T00135
Abstract : A Child voice recognition was developed by signal processing applied to the control of 4wd robot car througth voice commands: right, left, forward, backward and halt. The program consists of two graphical interfaces developed in Matlab called database and voice recognition for children. In the database interface processes were performed corresponding to the acquisition of the voice using a Stereo Headset microphone, once acquired the speech signal processing was performed whose objective was to eliminate unwanted silences of the signal for which the method was used of energy calculation which encompasses normalization, threshold determination and segmentation processes. To this new signal, we used a pre-emphasis filter to accentuate the high frequencies and smooth the spectrum, from this filtered signal we extracted the voice characteristics through the Calculation of Linear Prediction Coefficients (LPC), to obtain the signal was performed an average between the coefficients of each recording. The second graphical interface performs the same processes described above for the speech signal to be recognized, then a comparison of distances between the speech signal to be recognized and each of the pattern signals is performed, the speech command having a minimum distance being recognized. According to the tests carried out with the Voice Recognition Module for children, it was determined that it has a total effectiveness of 84.70%.These results were compared with the existing Module in the SR-07 market used in the thesis "Design and implementation of the System of directional movement of a wheelchair to be controlled by recognition of a voice pattern by means of power electronics and DC motors as actuators ", thus concluding that it fulfilled each of the objectives proposed in this titration work due to that the implemented module provided better results, however it is recommended to test the current methods used in voice recognition in order to further optimize the results.
Resumen : Se realizó un Módulo de reconocimiento de voz para niños mediante el procesamiento de señales aplicado en el control de un carro robot 4wd a través de comandos de voz: derecha, izquierda, adelante, atrás y para. El programa consta de dos interfaces gráficas desarrolladas en Matlab denominadas base de datos y reconocimiento de voz para niños. En la interfaz base de datos se realizaron los procesos correspondientes a la adquisición de la voz utilizando un micrófono Stereo Headset, una vez adquirida la señal de voz se realizó el preprocesamiento cuyo objetivo fue eliminar silencios indeseados de la señal para lo que se empleó el método de cálculo de energía el que engloba procesos de normalización, determinación del umbral y segmentación. A esta nueva señal se empleó un filtro preénfasis para la acentuación de las frecuencias altas y suavizar el espectro, de esta señal filtrada se extrajo las características de voz a través del Cálculo de Coeficientes de Predicción Lineal (LPC), para obtener la señal patrón se realizó un promedio entre los coeficientes de cada grabación. La segunda interfaz gráfica realiza los mismos procesos descritos anteriormente para la señal de voz a reconocer, luego se realiza una comparación de distancias entre la señal de voz a reconocer y cada una de las señales patrón siendo reconocida el comando de voz cuya distancia sea mínima. De acuerdo a las pruebas realizadas con el Módulo de reconocimiento de voz para niños se determinó que tiene una efectividad total de 84,70% estos resultados fueron comparados con el Módulo existente en el mercado SR-07 utilizado en la tesis “Diseño e implementación del sistema de movimiento direccional de una silla de ruedas para ser controlada por reconocimiento de un patrón de voz mediante electrónica de potencia y motores DC como actuadores”, por lo que concluye que se cumplió con cada uno de los objetivos propuestos en este trabajo de titulación debido a que el módulo implementado proporcionó mejores resultados, sin embargo se recomienda probar los métodos actuales utilizados en el reconocimiento de voz con la finalidad de optimizar aún más los resultados.
URI : http://dspace.espoch.edu.ec/handle/123456789/6365
Aparece en las colecciones: Ingeniería en Electrónica Telecomunicaciones y Redes

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
98T00135.pdf3,32 MBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.