¿Pueden los transformadores resolverlo todo?

¿Pueden los transformadores resolverlo todo? | Harys Dalvi

Si analizamos las matemáticas y los datos, revelamos que los transformadores se utilizan tanto en exceso como en subutilización.

Los transformadores son mejor conocidos por sus aplicaciones en el procesamiento del lenguaje natural. Fueron diseñados originalmente para traducir entre idiomas,[1] y ahora son más famosos por su uso en grandes modelos de lenguaje como ChatGPT (generativo preentrenado transformador).

Pero desde su introducción, los transformadores se han aplicado a cada vez más tareas, con excelentes resultados. Estos incluyen reconocimiento de imágenes,[2] aprendizaje por refuerzo,[3] e incluso predicción del tiempo.[4]

Incluso la tarea aparentemente específica de generar lenguaje con transformadores tiene una serie de sorpresas, como ya hemos visto. Los modelos de lenguaje grandes tienen propiedades emergentes que parecen más inteligentes que simplemente predecir la siguiente palabra. Por ejemplo, pueden conocer varios hechos sobre el mundo o replicar matices del estilo de habla de una persona.

El éxito de los transformadores ha hecho que algunas personas se pregunten si los transformadores pueden hacerlo todo. Si los transformadores se generalizan a tantas tareas, ¿hay alguna razón? no ¿Usar un transformador?

Claramente, todavía hay argumentos a favor de otros modelos de aprendizaje automático y, como a menudo se olvida hoy en día, modelos de aprendizaje no automático y el intelecto humano. Pero los transformadores tienen una serie de propiedades únicas y hasta ahora han mostrado resultados increíbles. También existe una base matemática y empírica considerable…

¿Pueden los transformadores resolverlo todo? | Harys Dalvi

ByEquipo de 7 minutos

Si analizamos las matemáticas y los datos, revelamos que los transformadores se utilizan tanto en exceso como en subutilización.

By Equipo de 7 minutos

Related Post

Microsoft ha aflojado su control exclusivo sobre OpenAI y ahora la carrera por la inteligencia artificial parece abierta de par en par

Cómo crear una base de conocimientos de IA con capacidad de búsqueda completa con OpenKB, OpenRouter y Llama

Meta AI lanza Sapiens2: un modelo de visión centrado en el ser humano de alta resolución para pose, segmentación, normales, mapa de puntos y albedo

You missed

El nuevo acceso al hospital es clave para el plan de mejora de carreteras de Torrevieja por 6,3 millones de euros – The Leader

Claressa Shields reacciona a la victoria en el debut de Chrisean Rock en el boxeo profesional

Los científicos descubren por qué los gatos de repente dejan de comer su comida: ScienceAlert

Melania Trump se desliza hasta el fondo e intenta que despidan a Jimmy Kimmel