ShowUI: un modelo de visión-lenguaje-acción para agentes visuales de GUI que aborda desafíos clave en el modelado visual y de acción de UI
Los modelos de lenguaje grandes (LLM) han demostrado un potencial notable para realizar tareas complejas mediante la creación de agentes inteligentes. A medida que las personas interactúan cada vez más…