Investigadores de OpenAI entrenan transformadores de poco peso para exponer circuitos interpretables
Si las redes neuronales ahora toman decisiones en todas partes, desde editores de código hasta sistemas de seguridad, ¿cómo podemos ver los circuitos específicos internos que impulsan cada comportamiento? OpenAI…