AI y ML se están expandiendo a un ritmo notable, marcado por la evolución de numerosos subdominios especializados. Recientemente, dos ramas centrales que se han vuelto centrales en la investigación académica y las aplicaciones industriales son IA generativa y IA predictiva. Si bien comparten principios fundamentales del aprendizaje automático, sus objetivos, metodologías y resultados difieren significativamente. Este artículo describirá la IA generativa y la IA predictiva, basándose en artículos académicos destacados.
Definición de IA generativa
La IA generativa se centra en crear o sintetizar nuevos datos que se asemejan a muestras de entrenamiento en estructura y estilo. La autenticidad de este enfoque radica en su capacidad para aprender la distribución de datos fundamentales y generar instancias novedosas que no sean meras réplicas. Ian Goodfellow y cols. introdujo el concepto de redes generativas adversarias (GAN)donde se entrenan simultáneamente dos redes neuronales, es decir, el generador y el discriminador. El generador produce nuevos datos, mientras que el discriminador evalúa si la entrada es real o sintética. Las GAN aprenden a producir imágenes, audio y contenido textual muy realistas a través de esta configuración adversa.
Se puede encontrar un enfoque paralelo al modelado generativo en los codificadores automáticos variacionales (VAE) propuestos por Diederik P. Kingma y Max Welling.. Los VAE utilizan un codificador para comprimir datos en una representación latente y un decodificador para reconstruir o generar nuevos datos a partir de ese espacio latente. La capacidad de los VAE para aprender representaciones latentes continuas los ha hecho útiles para diversas tareas, incluida la generación de imágenes, la detección de anomalías e incluso el descubrimiento de fármacos. Con el paso de los años, mejoras como la GAN convolucional profunda (DCGAN) de Radford et al. y Técnicas de entrenamiento mejoradas para GAN por Salimans et al. han ampliado los horizontes del modelado generativo.
Definición de IA predictiva
La IA predictiva se ocupa principalmente de pronosticar o inferir resultados basados en datos históricos. En lugar de aprender a generar nuevos datos, estos modelos pretenden hacer predicciones precisas. Uno de los primeros y ampliamente reconocidos trabajos sobre modelado predictivo dentro del aprendizaje profundo es el Modelo de lenguaje basado en redes neuronales recurrentes (RNN) de Tomas Mikolovque demostró cómo los algoritmos predictivos podrían capturar dependencias secuenciales para predecir tokens futuros en tareas lingüísticas.
Los avances posteriores en las arquitecturas basadas en Transformer llevaron las capacidades predictivas a nuevas alturas. Notablemente, BERT (Representaciones de codificador bidireccional de transformadores), presentado por Devlin et al.utilizó un objetivo de modelado de lenguaje enmascarado para sobresalir en tareas predictivas como la respuesta a preguntas y el análisis de sentimientos. GPT-3 de Brown et al. Ilustró aún más cómo los modelos de lenguaje a gran escala pueden exhibir capacidades de aprendizaje en pocas oportunidades, refinando las tareas predictivas con un mínimo de datos etiquetados. Aunque a GPT-3 y sus sucesores a veces se les llama «modelos de lenguaje generativo», su objetivo de entrenamiento, predecir el siguiente token, se alinea estrechamente con el modelado predictivo. La diferencia radica en la escala de datos y parámetros, lo que les permite generar texto coherente manteniendo fuertes propiedades predictivas.
Análisis comparativo
La siguiente tabla resume las principales diferencias entre la IA generativa y la IA predictiva, destacando los aspectos clave.
Investigación e implicaciones en el mundo real
La IA generativa tiene implicaciones de amplio alcance. En la creación de contenidos, los modelos generativos pueden automatizar la producción de obras de arte, texturas de videojuegos y medios sintéticos. Los investigadores también han explorado aplicaciones médicas y farmacéuticas, como la generación de nuevas estructuras moleculares para el descubrimiento de fármacos. Mientras tanto, la IA predictiva sigue dominando la inteligencia empresarial, las finanzas y la atención sanitaria a través de la previsión de la demanda, la evaluación de riesgos y el diagnóstico médico. Los modelos predictivos aprovechan cada vez más el entrenamiento previo autosupervisado a gran escala para manejar tareas con datos etiquetados limitados o para adaptarse a entornos cambiantes.
A pesar de sus diferencias, han comenzado a surgir sinergias entre la IA generativa y la IA predictiva. Algunos modelos avanzados integran componentes generativos y predictivos en un único marco, lo que permite tareas como aumento de datos para mejorar el rendimiento predictivo o generación condicional para adaptar los resultados en función de características predictivas específicas. Esta convergencia indica un futuro en el que los modelos generativos ayudan a las tareas predictivas mediante la creación de muestras de entrenamiento sintéticas, y los modelos predictivos guían los procesos generativos para garantizar que los resultados se alineen con los objetivos previstos.
Conclusión
La IA generativa y la IA predictiva ofrecen fortalezas distintas y enfrentan desafíos únicos. La IA generativa brilla cuando el objetivo es producir muestras nuevas, realistas y creativas, mientras que la IA predictiva sobresale al proporcionar pronósticos o clasificaciones precisas a partir de datos existentes. Ambos paradigmas se desarrollan continuamente, atrayendo el interés de investigadores y profesionales que buscan perfeccionar los algoritmos subyacentes, abordar las limitaciones existentes y descubrir nuevas aplicaciones. Al examinar el trabajo fundamental sobre Redes generativas de confrontación y Autocodificadores variacionales junto con avances predictivos como Modelos de lenguaje basados en RNN y Transformadoreses evidente que la evolución de la IA depende tanto del eje generativo como del predictivo.
Fuentes
Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. No olvides unirte a nuestro SubReddit de más de 65.000 ml.
🚨 [Recommended Read] Nebius AI Studio se expande con modelos de visión, nuevos modelos de lenguaje, incorporaciones y LoRA (Promovido)
A Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en IIT Madras, le apasiona aplicar la tecnología y la inteligencia artificial para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.