Euphonia: uno de los proyectos con un enorme impacto social de Google


En el Google I/O 2019 , su encuentro anual de desarrolladores, la compañía presentó teléfonos nuevos, anunció cambios al secretario Assistant y adelantó las novedades de Android 10 Q, pero también mostró los avances en Euphonia, uno de los servicio más interesantes de los últimos tiempos ( eufonía significa “buen sonido” en referencia a la combinación de audio en forma agradable).

Esta iniciativa busca ayudar a que personas con dificultades en el habla causadas por condiciones neurológicas como el Parkinson, la esclerosis múltiple, esclerosis lateral amiotrófica (ELA), entre otras puedan comunicarse mejor.

Con este objetivo en mente, se ideó el Proyecto Eufonía, que cuenta con el apoyo de dos ONG que trabajan con pacientes con esclerosis lateral amiotrófica: ALS TDI y ALSRI.

Lo que Google está haciendo es pedirle a gente de todo el mundo que les envíe sus audios para que sus sistemas aprendan de esas verbalizaciones. Como sabe cualquiera que haya usado un sistema de reconocimiento de voz, el patrón base es una palabra bien pronunciada; en el caso de personas con dificultades en la dicción, esto hace imposible interactuar con la voz con una computadora.

Se grabaron muestras de varias voces de personas con ELA. Y esta información se utilizó para optimizar los algoritmos de inteligencia artificial, de modo tal que estos sistemas puedan comprender mejor sus palabras y así sean capaces de transcribir lo que dicen estos usuarios con dificultades en el habla.

Los audios recogidos fueron utilizados para entrenar a los sistemas de inteligencia artificial detrás de celulares y computadores, con el fin de facilitar la comunicación en este tipo de pacientes. Eventualmente, se trasladará este concepto a personas con otro tipo de dificultades en el habla.
Además se entrenaron a los algoritmos para que detecten gestos y sonidos, y los traduzcan en comandos de voz para pedirle al asistente que realice diferentes acciones, como buscar información, enviar un mensaje, prender las luces o gestionar cualquier otro dispositivo inteligente del hogar.

Que los sistemas de Google aprendan a reconocer instrucciones con una pronunciación deficiente sería un cambio enorme para estas personas, sobre todo aquellas que están paralizadas pero mantienen cierto control sobre la voz, porque abriría un camino de comunicación fundamental, sobre todo si luego se combina con el motor de texto-a-voz de Google; en la demo que mostraron en la conferencia, podrían incluso mantener una conversación telefónica con la computadora como intermediario.