Asistentes de voz
El reto de Siri: entender a millones de personas con trastornos de la voz
MADRID, 27 May. (EDIZIONES/Portaltic) -
Los asistentes de voz no entienden a millones de personas. Siri y el resto de asistentes aún no tienen la capacidad de atender a más de nueve millones de personas que, solo en EEUU, tienen problemas en la voz o algún tipo de discapacidad que les impide articular frases de manera correcta.
Emma Mattes es una de las nueve millones de personas que tienen que renunciar a Siri y a servicios similares, según cuenta la revista Scientific American. Mattes tiene un trastorno en la voz que causa espamos involuntarios de las cuerdas vocales y su discurso es inestable. Esto provoca que su sistema de voz de Bluetooth no la comprenda correctamente. Tartamudos o personas con parálisis cerebral tampoco pueden utilizar este tipo de servicios.
“El reconocimiento de voz está dirigido a la mayoría de la gente”, explica el director de Sensory, Todd Mozer, compañía que proporciona chips de reconocimiento de voz a infinidad de productos como, por ejemplo, los teléfonos Samsung Galaxy. El reconocimiento es cada vez más preciso, explican los expertos, pero aún queda lejos de ser capaz de reconocer voces atípicas o patrones de voz y cuenta con importantes obstáculos que superar, explica el citado medio.
Las compañías no han abordado el asunto de forma directa, pero según cuenta Scientific American Apple y Amazon dijeron por correo electrónico que tienen intención de mejorar su tecnología. Microsoft, por su parte, dueño y creador de Cortana, aseguró a través de un portavoz que desde el principio pretende llegar a todos en el diseño y funciones de sus productos.
Entre las posibilidades para mejorar este tipo de servicios, existe la posibilidad de que los servicios preguntasen en caso de no entender inmediatamente. Gracias a preguntas aclaratorias podrían comunicarse con los casi diez millones de personas que no pueden utilizarlos. También, explican los investigadores, los sistemas podrían ser más susceptibles al aprendizaje incluyendo voces inusuales o algoritmos que sean capaces de detectar distintas pronunciaciones y versiones.