Febrero puede ser el mes más corto, pero ciertamente no se siente así aquí en TDS, donde nuestros autores han estado en la cima de su juego, compartiendo importantes contribuciones sobre temas actuales, incluidos algunos de los más largos. y Artículos más leídos del año hasta el momento.
Ahora que la mayoría de nosotros nos hemos adaptado al flujo de las cosas en 2024, vemos que nuestros lectores se centran un poco menos en los cambios profesionales y más en las habilidades básicas y las soluciones concretas a problemas comunes. Nuestros artículos más leídos y discutidos del mes pasado reflejan eso, y a continuación encontrará una muestra representativa de nuestros artículos más destacados de febrero.
Destacados mensuales
- Las matemáticas detrás del optimizador Adam
En una explicación clara, accesible y ampliamente compartida, cristian leo desvela el funcionamiento matemático interno del optimizador Adam (Estimación de momento adaptativo) y, a lo largo del camino, nos ayuda a comprender por qué se ha convertido en una opción tan popular entre los profesionales del aprendizaje profundo. - 12 puntos débiles de RAG y soluciones propuestas
Si bien la generación de recuperación aumentada continúa causando sensación como una opción poderosa para mejorar el desempeño de los LLM, sus deficiencias también son cada vez más claras. Wenqi Glantz ofrece un recurso útil para cualquiera que se haya sentido estancado al implementar un sistema RAG recientemente, recopilando 12 errores comunes, así como soluciones alternativas sugeridas. - Visualización de datos 101: manual para imágenes que llamen la atención
Para cualquiera que busque crear “imágenes más claras, nítidas e inteligentes” (¿y quién no lo está realmente?), la última guía de visualización de datos de Mariya Mansurova Es una lectura esencial, ya que aprovecha numerosos ejemplos concretos (en Plotly) para mostrar los principios de diseño esenciales en acción.
- Técnicas avanzadas de ETL para principiantes
Si es un ingeniero de datos en etapa inicial y le gustaría mejorar sus habilidades de ingesta de datos, 💡Mike ShakhomirovEl nuevo tutorial de es uno que definitivamente deberías explorar (y marcar como favorito): cubre patrones de ingesta típicos y proporciona fragmentos de código que puedes usar para comenzar a modificar por tu cuenta. - Recuperación avanzada-generación aumentada: de la teoría a la implementación de LlamaIndex
¿Está interesado en profundizar más en el apasionante mundo de RAG? Leonie Monigatti explica los detalles esenciales de las optimizaciones previas, recuperativas y posteriores a la recuperación, antes de guiarnos a través del proceso de transformar una canalización RAG “ingenua” en una avanzada. - Principales métricas de evaluación para fallas de RAG
Recurrimos a RAG por última vez esta semana, esta vez para Ámbar RobertsLa contribución más reciente de: un recurso útil para solucionar problemas de rendimiento inesperado o decepcionante, y para aplicar métricas sólidas de evaluación de respuesta y recuperación para garantizar que todas las piezas de su canalización funcionen en armonía. - Construyendo una plataforma de datos en 2024
Tres años después de abordar este tema por primera vez, estábamos encantados de darle la bienvenida nuevamente. David Melillo, cuya nueva publicación reevalúa los componentes clave de las plataformas de datos eficientes. Comparte conocimientos valiosos basados en su experiencia al afrontar los desafíos de datos de diversas industrias y haber trabajado tanto con “grandes corporaciones como con nuevas empresas ágiles”.
Una dosis extra de Python
Algunas de nuestras publicaciones más populares de las últimas semanas cubrieron el tema siempre actual de la programación Python para profesionales de datos y ML. Por si te los perdiste:
Nuestra última cohorte de nuevos autores
Cada mes, estamos encantados de ver un nuevo grupo de autores unirse a TDS, cada uno de los cuales comparte su propia voz, conocimiento y experiencia únicos con nuestra comunidad. Si está buscando nuevos escritores para explorar y seguir, simplemente explore el trabajo de nuestras últimas incorporaciones, que incluyen Sarthak Handa, Vadim Arzamásov, Mahyar Aboutalebi, Ph.D. 🎓, James W., Mahoma Mahoma, Kirsten Jiayi Pan, Mateo Chak, Ugur Yildirim, Mikayil Ahadli, Hamza Gharbi, Sami Abboud, Mateo Gunton, Eivind Kjosbakken, Eva Revere, Nithhyaa Ramamoorthy, Krispin Rami, Kennedy Selvadurai, Ph.D., Vasili Morózov, Patricio Beukema, Thomas Rouch, Ritanshi Agarwal, Rohan Nanda, Nikolaus Correll, Mert Ersoz, Dani Lisle, Roberta Roca, Adil Rizvi, Mateo Turco, Celia Bancos, Ph.D., Skylar Jean Callis, Ryan McDermott, Anand Subramanian, Aayush Agarwal, PG Baumstarck, José D. Hernández-Betancur, Khin Yadanar Liny Daniel Kangentre otros.