septiembre 16, 2024

VEKTRA 374

Sitio web de animación 3D, inteligencia artificial, robótica y tecnología

- Inicio » Reconstruir el habla con la ayuda de la inteligencia artificial

Reconstruir el habla con la ayuda de la inteligencia artificial

habla inteligencia artificial
Investigadores de Hong Kong están utilizando la inteligencia artificial para ayudar en el habla a las personas que sufren de disartria.

Investigadores de Hong Kong están utilizando la inteligencia artificial para ayudar a las personas con disartria a comunicarse. El habla transmite quiénes somos, qué pensamos y qué necesitamos.

La capacidad de comunicarse puede verse comprometida por daños neuronales y musculares, lo que lleva a una afección llamada disartria, que hace que el habla se vuelva lenta, arrastrada y difícil de entender.

Los desarrollos en inteligencia artificial (IA) y aprendizaje automático tienen el potencial de ayudar a las personas con esta condición a superar estas barreras para la comunicación.

Estudios en la Universidad China de Hong Kong

“Con las herramientas avanzadas desarrolladas en nuestro laboratorio de investigación, los computadores son capaces de reconocer el habla poco clara de los pacientes con disartria y convertirla en un habla comprensible, facilitando y mejorando la comunicación”, dice Helen Meng, profesora de ingeniería de sistemas y gestión de ingeniería en la Universidad China de Hong Kong (CUHK).

Meng se unió a CUHK en 1998, y pronto estableció el Laboratorio de Comunicaciones Humano-Computador, enfocado en el procesamiento del habla y el lenguaje.

El laboratorio se convirtió en un “Centro InnoHK” dirigido por CUHK llamado Centro de Inteligencia Perceptual e Interactiva, donde Meng es ahora directora.

La impresión de la inteligencia artificial a través del arte del habla

Uno de los proyectos de investigación de Meng se centra en el uso de técnicas computacionales y de aprendizaje automático para decodificar y reconstruir lenguas habladas.

Pone un énfasis particular en el deterioro del habla para idiomas distintos del inglés, incluidas las lenguas tonales como el chino, que también tiene múltiples dialectos.

Para abordar este problema, Meng está creando el Corpus de Disartria de la Universidad China o CUDYS, que contendrá datos de habla de hablantes de cantonés con disartria.

El equipo ahora está utilizando estos datos para desarrollar herramientas basadas en IA para reconstruir el habla disártrica cantonesa y producir un habla más clara.

Habla natural gracias a la inteligencia artificial

El enfoque DSR basado en IA del equipo ha logrado una reducción de aproximadamente el 30% en los errores en el reconocimiento automático en comparación con el habla disártrica original.

El estudio refleja una mejora en términos de inteligibilidad y naturalidad del habla reconstruida.

La clave del éxito de CUHK, dice Meng, es su énfasis en la comprensión de las características acústico-fonéticas de la disartria.

Este análisis genera información sobre cómo el habla disártrica difiere del habla normal y se está utilizando para desarrollar técnicas de terapia del habla más efectivas, así como ayudas de comunicación impulsadas por IA.

habla inteligencia artificial
Helen Meng (a la derecha) con el gerente de TI del equipo, William Leung, ambos de la Universidad China de Hong Kong, emplean soluciones tecnológicas para reconstruir el habla disártrica cantonesa. Créditos a Nature.

Más allá de la voz

El equipo de Meng también ve otro uso potencial para sus sistemas de análisis de voz.

“La voz es un biomarcador barato y fácil de adquirir que puede utilizarse para detectar y controlar problemas relacionados con la demencia”, explica Meng.

El equipo está desarrollando una plataforma de cribado y monitorización que utiliza la IA para extraer marcadores de enfermedades neurológicas de las lenguas habladas. Estos marcadores incluyen falta de fluidez, vacilación y “pausas de relleno”.

La plataforma ha demostrado su valía potencial para detectar el Alzheimer en comparación con un conjunto de datos de referencia disponible públicamente conocido como el corpus ADReSS.

Con información de Nature.