Cómo la IA podría llevar pronto la interacción entre humanos y computadoras a nuevos niveles | por LucianoSphere (Luciano Abriata, PhD) | Agosto, 2024

A medida que los modelos de IA alcanzan la excelencia en el reconocimiento y síntesis de voz, el procesamiento de texto y el multimodalismo, las interfaces de usuario de voz definitivas pronto podrían ser omnipresentes.

Interfaz de usuario de voz (VUI) para la interacción hombre-computadora basada en voz natural imaginada por Dall-E 3 a través de ChatGPT.

Era una típica tarde de viernes, justo al final de una larga semana de trabajo en nuestro proyecto de desarrollo de un concepto y una aplicación radicalmente nuevos para gráficos moleculares en realidad aumentada y virtual, cuando me encontré en medio de una acalorada discusión con mi amigo y colega. Es un ingeniero, programador web y diseñador “hardcore” que ha estado en las trincheras del desarrollo web durante más de una década. Como alguien que se enorgullece de su eficiencia y control sobre cada línea de código y, especialmente, que siempre tiene en mente al usuario y la experiencia del usuario, mi amigo se burló de mi idea de que las interfaces de voz se conviertan pronto en la norma…

“¿Interfaces de voz? Son inmaduras, incómodas y, francamente, un poco espeluznantes”, dijo, no con esas palabras exactas, pero sin duda las decía en serio y expresaba un sentimiento que muchos en la comunidad tecnológica comparten. Y eso fue después de haberlo convencido, tal vez en un 30-50%, de que nuestra herramienta de realidad aumentada/virtual para gráficos y modelado molecular necesita absolutamente ese tipo de interacción humano-computadora porque, como las manos de los usuarios están ocupadas…