¿Qué hace que el aprendizaje automático cuántico sea “cuántico”?

Practiqué informática hace 7 años, justo después de terminar mi maestría. En ese momento, el campo estaba lleno de entusiasmo pero también de escepticismo. Hoy en día, la computación cuántica se destaca como una tecnología emergente, junto con las HPC y la IA.

La atención pasó de la investigación y el debate únicamente relacionados con el hardware a las aplicaciones, el software y los algoritmos. Quantum es realmente una herramienta que se puede utilizar en diferentes disciplinas y no en un campo aislado. Uno de los usos prometedores de las computadoras cuánticas, aunque aún no completamente comprendido, es el aprendizaje automático cuántico.

El aprendizaje automático cuántico (QML) se ha convertido en un término generalizado en los últimos años. Una de las primeras y más significativas apariciones de QML fue en 2013, cuando Google y la NASA establecieron el Laboratorio de Inteligencia Artificial Cuántica, cuya tarea era explorar cómo las computadoras cuánticas podrían usarse en aplicaciones de aprendizaje automático. Desde entonces, el término QML apareció en artículos de investigación, presentaciones de startups y charlas en conferencias, a menudo con significados tremendamente diferentes.

En algunos casos, se refiere al uso de computadoras cuánticas para acelerar el aprendizaje automático. En otros, describe algoritmos clásicos inspirados en la física cuántica. Y, a veces, simplemente significa ejecutar un flujo de trabajo de aprendizaje automático familiar en hardware desconocido.

Entonces, incluso yo, alguien que trabaja e investiga las computadoras cuánticas, estaba muy confundido al principio… Apuesto a que la primera pregunta de muchas personas cuando escuchan “Aprendizaje automático cuántico” es ¿qué es exactamente lo que hace que el aprendizaje automático cuántico sea cuántico?

¡Responder a esta pregunta es la razón por la que decidí escribir este artículo! La respuesta corta no es velocidad, ni redes neuronales, ni vagas referencias a la “ventaja cuántica”. En esencia, el aprendizaje automático cuántico se define por cómo se representa, transforma y lee la información. En QML, esto se hace utilizando las reglas de la mecánica cuántica en lugar de la computación clásica.

Este artículo tiene como objetivo aclarar esa distinción, separar la sustancia de la exageración y proporcionar una base conceptual clara para el resto de esta serie. Planeo escribir sobre la exploración de la tradición de QML, así como algunos de sus resultados de investigación y aplicaciones a corto plazo.

Aprendizaje automático antes de lo “cuántico”

Antes de abordar todo lo cuántico, demos un paso atrás. Despojado de sus adornos modernos, el aprendizaje automático consiste en aprender a mapear las entradas y las salidas utilizando datos. Independientemente de si el modelo es un regresor lineal, un método kernel o una red neuronal profunda, la estructura es más o menos la misma:

Los datos se representan numéricamente (vectores, matrices, tensores). Un modelo parametrizado transforma esos datos. Los parámetros se ajustan optimizando una función de costos. El modelo se evalúa estadísticamente en nuevas muestras.

Las redes neuronales, las GPU y los conjuntos de datos masivos son opciones de implementación y no características definitorias. Esta abstracción es importante porque nos permite hacer una pregunta precisa:

¿Qué cambia cuando los datos y el modelo viven en un espacio cuántico?

Entra la mecánica cuántica

El aprendizaje automático cuántico se vuelve cuántico cuando la información cuántica es el sustrato computacional. Esto se manifiesta de tres maneras.

1. Los datos se representan como estados cuánticos.

En los modelos clásicos de aprendizaje automático, los datos se representan como bits o números de punto flotante. Por el contrario, el aprendizaje automático cuántico utiliza estados cuánticos, que son vectores complejos que siguen las reglas de la mecánica cuántica. Estos estados a menudo se describen mediante matrices de densidad y sus transformaciones se representan mediante matrices unitarias.

Como resultado, codificamos información en amplitudes de valores complejos en lugar de probabilidades, y los estados pueden existir en superposición.

Esto no significa que todos los datos clásicos de repente se compriman exponencialmente o sean fácilmente accesibles. Cargar datos en estados cuánticos suele ser costoso y extraer información de ellos está fundamentalmente limitado por la medición.

Entonces, el punto importante es que el modelo opera con estados cuánticos, no con números clásicos.

2. Los modelos son evoluciones cuánticas

Los modelos de ML clásicos aplican funciones a los datos. Los modelos Quantum ML aplican operaciones cuánticas (normalmente transformaciones unitarias) en canales cuánticos. En la práctica, muchos modelos QML se construyen a partir de circuitos cuánticos parametrizados. Estos circuitos son secuencias de puertas cuánticas, que son operaciones básicas que cambian los estados cuánticos. Los parámetros de estas puertas cuánticas se ajustan durante el entrenamiento, de forma similar al ajuste de pesos en una red neuronal en el aprendizaje automático clásico.

Fundamentalmente, lo que sucede en estos modelos es que comenzamos con el estado del sistema, representado en una matriz (la llamaremos hamiltoniana, para ser precisos), y luego las puertas que aplicamos al sistema nos dirán cómo ese sistema evoluciona (cambia) durante un cierto período de tiempo. Esa evolución dicta el comportamiento del modelo.

Como resultado, los modelos cuánticos exploran un espacio de hipótesis que es estructuralmente diferente al de los modelos clásicos, incluso cuando el bucle de entrenamiento parece similar en la superficie.

3. La medición es parte del proceso de aprendizaje

En el ML clásico, leer la salida de un modelo es trivial y de ninguna manera afecta el estado o el comportamiento del modelo (a menos que lo hagamos intencionalmente). Sin embargo, en el aprendizaje automático cuántico, la medición es probabilística y destructiva del estado. Esto tiene un efecto significativo en el sistema. Las salidas están determinadas por ejecuciones repetidas del circuito, llamadas “disparos”. En este caso, “disparos” significa ejecutar el mismo circuito cuántico varias veces para estimar un resultado, ya que las mediciones cuánticas son probabilísticas.

Los gradientes (lo que guía la actualización de los parámetros durante el entrenamiento) se estiman estadísticamente a partir de estas mediciones en lugar de calcularse exactamente como en el aprendizaje automático clásico. Como resultado, el costo de capacitación a menudo está dominado por el ruido de muestreo de estas mediciones repetidas, en lugar de solo por el cálculo.

En otras palabras, la incertidumbre está integrada en el propio modelo. Cualquier discusión seria sobre QML debe tener en cuenta el hecho de que el aprendizaje ocurre a través de la medición, no después de ella.

Lo que no hace que QML sea cuántico

La computación cuántica y QML, en particular, generan exageraciones y malentendidos. Muchas cosas que hoy se llaman “aprendizaje automático cuántico” son cuánticas solo de nombre, por ejemplo:

Los algoritmos de ML clásicos se ejecutan en hardware cuántico sin hacer un uso significativo de los estados cuánticos. Métodos “inspirados en lo cuántico” que son completamente clásicos. Canalizaciones híbridas donde el componente cuántico se puede eliminar sin cambiar el comportamiento o rendimiento del modelo.

Si alguna vez te encuentras con alguien hablando sobre QML y no estás seguro de qué tan cuántico es el modelo que están discutiendo, una buena regla a seguir es preguntar:

“¿Puedo sustituir la parte cuántica por una clásica sin alterar la estructura matemática del modelo?”

En caso afirmativo o tal vez, el enfoque probablemente no sea fundamentalmente cuántico. Este trabajo puede seguir siendo valioso, pero queda fuera del núcleo del aprendizaje automático cuántico.

¿Dónde está QML hoy?

Cuando hablemos de computación cuántica, recuerde que el hardware actual es ruidoso, pequeño y tiene recursos limitados. Debido a esto:

En la actualidad, no existe una ventaja cuántica general y probada para las tareas de aprendizaje automático. Muchos modelos QML se parecen más a los métodos del kernel que a las redes profundas. La carga de datos y el ruido suelen dominar el rendimiento.

Esto no es un fracaso en el campo; es donde se encuentra actualmente la computación cuántica. La mayor parte de la investigación actual sobre QML es exploratoria: mapear clases de modelos, comprender la teoría del aprendizaje cuántico e identificar dónde podría importar la estructura cuántica.

Por qué todavía vale la pena estudiar el aprendizaje automático cuántico

Si es poco probable que se produzcan aceleraciones a corto plazo, ¿por qué adoptar QML?

QML nos obliga a repensar cuestiones fundamentales sobre el aprendizaje automático y la computación cuántica. Necesitamos responder qué significa aprender de los datos cuánticos, cómo el ruido afecta la optimización y qué clases de modelos existen en los sistemas cuánticos pero no en los sistemas clásicos.

El aprendizaje automático cuántico se trata menos de superar el aprendizaje automático clásico actual y más de ampliar el espacio de lo que puede significar el “aprendizaje” en un mundo cuántico.

Esto es importante porque los avances científicos y tecnológicos comienzan con nuevos enfoques. Incluso si el hardware aún no está listo, explorar QML nos prepara para un mejor hardware en el futuro.

Pensamientos finales y lo que viene después

Los avances en la computación cuántica se están acelerando. Las empresas de hardware están compitiendo para construir una computadora cuántica tolerante a fallas. Una computadora cuántica que utiliza todo el poder de la mecánica cuántica. Las empresas de software y aplicaciones están explorando los problemas que la computación cuántica puede abordar de manera significativa.

Dicho esto, las computadoras cuánticas actuales son incapaces de ejecutar una aplicación de tamaño casi natural, y mucho menos un modelo complejo de aprendizaje automático. Aún así, la promesa de la eficiencia de la computación cuántica en el aprendizaje automático es bastante interesante y vale la pena explorarla ahora, en paralelo con los avances del hardware.

En este artículo, me centré en las definiciones y los límites del aprendizaje automático cuántico para allanar el camino para futuros artículos que explorarán:

Cómo se integran los datos clásicos en los estados cuánticos. Modelos cuánticos variacionales y sus limitaciones. Núcleos cuánticos y espacios de características. Desafíos de optimización en sistemas cuánticos ruidosos. Donde es plausible que surja una ventaja cuántica.

Antes de preguntar si el aprendizaje automático cuántico es útil, debemos tener claro qué es realmente. Cuanto más nos alejemos de las exageraciones, más nos acercaremos al progreso.