Tag: Interpretabilidad

Este documento de IA presenta una estrategia corta de ajuste de KL+MSE: una alternativa de bajo costo a la capacitación de autointerpretadores dispersos de extremo a extremo para la interpretabilidad

Los autoencoders escasos son herramientas centrales para analizar cómo funcionan internamente los modelos de lenguaje grandes. Traducir estados internos complejos en componentes interpretables permite a los investigadores dividir las activaciones…