El seguimiento del experimento es una parte esencial de los flujos de trabajo de aprendizaje automático modernos. Ya sea que esté ajustando hiperparámetros, monitoreando métricas de capacitación o colaborando con colegas, es crucial tener herramientas robustas y flexibles que hacen que los experimentos de seguimiento sean directos y perspicaces. Sin embargo, muchas soluciones de seguimiento de experimentos existentes requieren una configuración compleja, vienen con tarifas de licencia o bloquean los datos de los usuarios en formatos propietarios, lo que las hace menos accesibles para investigadores individuales y equipos más pequeños.
Meet Trackio: una nueva biblioteca de seguimiento de experimentos de código abierto desarrollada por Hugging Face y Gradio. Trackio es un rastreador local, ligero y totalmente gratuito diseñado para los entornos de investigación de ritmo rápido de hoy y las colaboraciones abiertas.
¿Qué es Trackio?
Trackio es un paquete Python diseñado como un reemplazo Para bibliotecas ampliamente utilizadas como WandB, con compatibilidad para llamadas de API fundamentales (wandb.init, wandb.log, wandb.finish). Esto coloca a Trackio en una liga donde cambiar o ejecutar scripts heredados requiere pocos o ningún cambio de código, simplemente importe a Trackio como Wandb y continúe trabajando como antes.
Características clave
- Diseño local: Por defecto, los experimentos se ejecutan y persisten localmente, proporcionando privacidad y acceso rápido. Compartir es opcional, no el valor predeterminado.
- Código abierto y abierto: No hay paredes de pago ni limitaciones de características: todo, incluida la colaboración y los paneles en línea, está disponible para todos sin costo.
- Ligero y extensible: Toda la base de código está por debajo de 1,000 líneas de Python, asegurando que sea fácil de auditar, extender o adaptarse.
- Integrado con el abrazo del ecosistema facial: Soporte listo para usar con
Transformers,Sentence TransformersyAcceleratepermite a los usuarios comenzar a rastrear métricas con una configuración mínima. - Portabilidad de datos: A diferencia de algunas herramientas de seguimiento establecidas, Trackio hace que todos los datos de experimentos sean fácilmente exportables y accesibles, empoderando el análisis personalizado y la integración perfecta en las tuberías de investigación.
Seguimiento de experimentos sin interrupciones: local o compartido
Una característica destacada de Trackio es su shareability. Los investigadores pueden monitorear las métricas en un tablero local con motor gradio o, simplemente sincronizar con espacios faciales para abrazarse, migrar un tablero en línea para compartir con colegas (o el público, si lo desea). Los espacios se pueden establecer privados o públicos, sin autenticación compleja o incorporación requerida para los espectadores.
Por ejemplo, para ver el tablero de su experimento localmente:
O, de Python:
import trackio
trackio.show()
Para lanzar paneles en espacios:
- Sincrita sus registros con espacios faciales para abrazar e instantáneamente compartir o incrustar paneles de experimentos con una URL simple.
Es importante destacar que cuando se ejecuta en espacios, Trackio realiza una copia de seguridad automáticamente de las métricas de la DB de SQLite efímera a un conjunto de datos facial de abrazos (como archivos de parquet) cada 5 minutos, asegurando que sus datos experimentales nunca se pierdan, incluso si el espacio público se reinicia.
Integración de plug-and-play con su flujo de trabajo ML
La integración con el ecosistema de la cara abrazada es tan simple como es:
- Con
transformers.Traineroacceleratepuede iniciar sesión y visualizar métricas especificando Trackio como su registrador.
Por ejemplo, usando Accelerate:
from accelerate import Accelerator
accelerator = Accelerator(log_with="trackio")
accelerator.init_trackers("my-experiment")
...
accelerator.log({"training_loss": loss}, step=step)
Este enfoque de baja fricción significa que cualquier persona que use transformadores, transformadores de oraciones o acelerar puede comenzar inmediatamente a rastrear y compartir experimentos con cero configuración adicional.
Transparencia, sostenibilidad y libertad de datos
Trackio va más allá de las métricas estándar, fomentando la transparencia en el uso de recursos computacionales. Admite el seguimiento de métricas como Uso de energía de GPU (leyendo de nvidia-smi), una característica alineada con el énfasis de Hugging Face en la responsabilidad ambiental y la reproducibilidad en la documentación de la tarjeta modelo.
A diferencia de las plataformas cerradas, Sus datos siempre son accesibles: Los registros de Trackio se almacenan en formatos estándar, y los paneles se construyen utilizando herramientas abiertas como Gradio y Hugging Face DataSets, lo que hace que todo sea fácil de remezclar, analizar o compartir.
Comienzo rápido
Para comenzar:
pip install trackio
# or
uv pip install trackio
O intercambie la importación en su base de código:
Conclusión
Rastreador está posicionado para empoderar investigadores individuales y colaboración abierta en Ml Al ofrecer un rastreador de experimentos transparente y completamente libre. Local-primero, por defecto, fácilmente compartible, y estrechamente integrado con las herramientas faciales para abrazar, ofrece la promesa de un seguimiento robusto sin la fricción o el costo de las soluciones tradicionales.
Mira el Detalle técnico y Página de Github. No dude en ver nuestro Página de Github para tutoriales, códigos y cuadernos. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.
Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.