Y Xdq8eqcqlzxyk Mz2owppppmwg6laq8dz Lzfuh8tv5s2tbb3rk Vkmue Skrziop5ap6ot9xpmwfawmenz55ewxvfcmszptg2ezsyod6ftlllgyew1200 H630 N Nu.jpeg

Investigación

Publicado
Autores

Anna Goldie y Azalia Mirhoseini

Fotografía de primer plano de la unidad de procesamiento tensorial (TPU) Trillium de Google.

Nuestro método de IA ha acelerado y optimizado el diseño de chips, y sus diseños de chips sobrehumanos se utilizan en hardware de todo el mundo.

En 2020, lanzamos un preimpresión Presentamos nuestro novedoso método de aprendizaje por refuerzo para diseñar diseños de chips, que luego… publicado en Nature y de código abierto.

Hoy estamos Publicación de un apéndice de Nature que describe más sobre nuestro método y su impacto en el campo del diseño de chips. También estamos lanzando un punto de control pre-entrenadocompartiendo los pesos del modelo y anunciando su nombre: AlphaChip.

Los chips de computadora han impulsado un progreso notable en inteligencia artificial (IA), y AlphaChip devuelve el favor al usar IA para acelerar y optimizar el diseño de chips. El método se ha utilizado para diseñar diseños de chips superhumanos en las últimas tres generaciones del acelerador de IA personalizado de Google, el Unidad de procesamiento de tensores (TPU).

AlphaChip fue uno de los primeros enfoques de aprendizaje por refuerzo utilizados para resolver un problema de ingeniería del mundo real. Genera diseños de chips superhumanos o comparables en cuestión de horas, en lugar de requerir semanas o meses de esfuerzo humano, y sus diseños se utilizan en chips de todo el mundo, desde centros de datos hasta teléfonos móviles.

«

El innovador enfoque de inteligencia artificial de AlphaChip revoluciona una fase clave del diseño de chips.

SR Tsai, vicepresidente sénior de MediaTek

Cómo funciona AlphaChip

Diseñar la distribución de un chip no es una tarea sencilla. Los chips de ordenador están formados por muchos bloques interconectados, con capas de componentes de circuitos, todos ellos conectados por cables increíblemente finos. También hay muchas limitaciones de diseño complejas e interrelacionadas que deben cumplirse al mismo tiempo. Debido a su enorme complejidad, los diseñadores de chips han luchado por automatizar el proceso de planificación de la distribución de chips durante más de sesenta años.

Similar a AlfaGo y Alfa Ceroque aprendieron a dominar los juegos de Go, ajedrez y shogi, construimos AlphaChip para abordar la planificación de chips como una especie de juego.

Partiendo de una cuadrícula en blanco, AlphaChip coloca un componente del circuito a la vez hasta que termina de colocar todos los componentes. Luego, recibe una recompensa en función de la calidad del diseño final. Una novedosa red neuronal de gráficos «basada en bordes» permite a AlphaChip aprender las relaciones entre los componentes de chips interconectados y generalizarlas entre chips, lo que permite a AlphaChip mejorar con cada diseño que diseña.

Izquierda: Animación que muestra a AlphaChip colocando la CPU Ariane RISC-V de código abierto, sin experiencia previa. Derecha: Animación que muestra a AlphaChip colocando el mismo bloque después de haber practicado con 20 diseños relacionados con TPU.

Uso de IA para diseñar los chips aceleradores de IA de Google

AlphaChip ha generado diseños de chips superhumanos utilizados en cada generación de TPU de Google desde su publicación en 2020. Estos chips permiten ampliar masivamente los modelos de IA basados ​​en Google. Transformador arquitectura.

Las TPU se encuentran en el corazón de nuestros poderosos sistemas de IA generativa, desde grandes modelos de lenguaje, como Géminisa generadores de imágenes y vídeos, Imagen y VeoEstos aceleradores de IA también se encuentran en el corazón de los servicios de IA de Google y son disponible a usuarios externos a través de Google Cloud.

Una fila de supercomputadoras aceleradoras de inteligencia artificial Cloud TPU v5p en un centro de datos de Google.

Para diseñar diseños de TPU, AlphaChip primero practica en una amplia gama de bloques de chips de generaciones anteriores, como Bloques de red en chip y entre chips, controladores de memoriay buffers de transporte de datosEste proceso se denomina preentrenamiento. Luego, ejecutamos AlphaChip en los bloques de TPU actuales para generar diseños de alta calidad. A diferencia de los enfoques anteriores, AlphaChip se vuelve mejor y más rápido a medida que resuelve más instancias de la tarea de colocación de chips, de manera similar a como lo hacen los expertos humanos.

Con cada nueva generación de TPU, incluida nuestra última Trilio (6.ª generación), AlphaChip ha diseñado mejores diseños de chips y ha proporcionado una mayor superficie general, acelerando el ciclo de diseño y produciendo chips de mayor rendimiento.

Gráfico de barras que muestra la cantidad de bloques de chips diseñados por AlphaChip en tres generaciones de unidades de procesamiento tensorial (TPU) de Google, incluidas v5e, v5p y Trillium.

Gráfico de barras que muestra la reducción promedio de la longitud del cable de AlphaChip en tres generaciones de unidades de procesamiento tensorial (TPU) de Google, en comparación con las ubicaciones generadas por el equipo de diseño físico de TPU.

El impacto más amplio de AlphaChip

El impacto de AlphaChip se puede ver a través de sus aplicaciones en Alphabet, la comunidad de investigación y la industria del diseño de chips. Además de diseñar aceleradores de IA especializados como las TPU, AlphaChip ha generado diseños para otros chips en Alphabet, como Procesadores Google Axionnuestras primeras CPU de centro de datos de propósito general basadas en Arm.

Las organizaciones externas también están adoptando y desarrollando AlphaChip. Por ejemplo, MediaTek, una de las principales empresas de diseño de chips del mundo, amplió AlphaChip para acelerar el desarrollo de sus chips más avanzados, como el El buque insignia de Dimensity 5G Se utiliza en los teléfonos móviles Samsung, mejorando al mismo tiempo la potencia, el rendimiento y el área del chip.

AlphaChip ha desencadenado una explosión de trabajo en IA para el diseño de chips y se ha extendido a otras etapas críticas del diseño de chips, como síntesis lógica y selección macro.

«

AlphaChip ha inspirado una línea de investigación completamente nueva sobre el aprendizaje de refuerzo para el diseño de chips, abarcando todo el flujo de diseño, desde la síntesis lógica hasta la planificación, la optimización de tiempos y más allá.

Profesor Siddharth Garg, Facultad de Ingeniería Tandon de la Universidad de Nueva York

Creando los chips del futuro

Creemos que AlphaChip tiene el potencial de optimizar cada etapa del ciclo de diseño de chips, desde la arquitectura informática hasta la fabricación, y de transformar el diseño de chips para el hardware personalizado que se encuentra en dispositivos cotidianos como teléfonos inteligentes, equipos médicos, sensores agrícolas y más.

Actualmente estamos desarrollando futuras versiones de AlphaChip y esperamos trabajar con la comunidad para continuar revolucionando esta área y lograr un futuro en el que los chips sean aún más rápidos, más baratos y más eficientes energéticamente.