Los LLM se destacan en la comprensión y generación de textos similares a los humanos, lo que les permite comprender y generar respuestas que imitan el lenguaje humano, mejorando la comunicación entre máquinas y humanos. Estos modelos son versátiles y adaptables a diversas tareas, incluida la traducción de idiomas, resúmenes, respuesta a preguntas, generación de texto, análisis de sentimientos y más. Su flexibilidad permite su implementación en diversas industrias y aplicaciones.
Sin embargo, los LLM a veces tienen alucinaciones, lo que resulta en declaraciones incorrectas plausibles. Los modelos de lenguaje grandes, como los modelos GPT, son muy avanzados en comprensión y generación de lenguaje y aún pueden producir confabulaciones por varias razones. Si la entrada o el mensaje proporcionado al modelo es ambiguo, contradictorio o engañoso, el modelo podría generar respuestas inventadas basadas en su interpretación de la entrada.
Los investigadores de Google DeepMind superan esta limitación al proponer un método llamado FunSearch. Combina un LLM previamente capacitado con un evaluador, lo que protege contra confabulaciones e ideas incorrectas. FunSearch convierte programas iniciales de baja puntuación en programas de alta puntuación para descubrir nuevos conocimientos combinando múltiples ingredientes esenciales. FunSearch produce programas que generan las soluciones.
FunSearch opera como un proceso iterativo donde, en cada ciclo, el sistema selecciona ciertos programas del grupo actual. Estos programas seleccionados luego son procesados por un LLM, que los amplía de manera innovadora, produciendo programas nuevos que se someten a una evaluación automática. Los más prometedores se reintroducen en el conjunto de programas existentes, estableciendo un ciclo de automejora.
Los investigadores toman muestras de los programas con mejor rendimiento y los ingresan nuevamente en los LLM como indicaciones para mejorarlos. Comienzan con un programa inicial como esqueleto y desarrollan sólo las partes críticas que gobiernan la lógica del programa. Establecen un esqueleto de programa codicioso y toman decisiones colocando una función prioritaria en cada paso. Utilizan métodos evolutivos basados en islas para mantener un gran conjunto de programas diversos. Lo escalan de forma asincrónica para ampliar el alcance de su enfoque y encontrar nuevos resultados.
FunSearch utiliza la misma estrategia general de embalaje en contenedores. En lugar de empaquetar artículos en contenedores con la menor capacidad, asigna los artículos a la menor capacidad solo si el ajuste es muy ajustado después de colocar el artículo. Esta estrategia elimina los pequeños huecos en los contenedores que es poco probable que se llenen. Uno de los componentes cruciales de FunSearch es que opera en el espacio de programas en lugar de buscar construcciones directamente. Esto le da a FunSearch el potencial para aplicaciones del mundo real.
Sin duda, esto marca sólo la fase inicial. El avance de FunSearch se alineará naturalmente con la evolución más amplia de los LLM. Los investigadores están comprometidos a ampliar sus funcionalidades para abordar diversos desafíos científicos y de ingeniería críticos que prevalecen en la sociedad.
Revisar la Papel y Blog. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de 34k+ ML, 41k+ comunidad de Facebook, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.
Si te gusta nuestro trabajo, te encantará nuestra newsletter.
Arshad es pasante en MarktechPost. Actualmente cursa su carrera internacional. Maestría en Física del Instituto Indio de Tecnología Kharagpur. Comprender las cosas hasta el nivel fundamental conduce a nuevos descubrimientos que conducen al avance de la tecnología. Le apasiona comprender la naturaleza fundamentalmente con la ayuda de herramientas como modelos matemáticos, modelos de aprendizaje automático e inteligencia artificial.