quizás haya sido la palabra más importante cuando se trata de modelos de lenguajes grandes (LLM), con el lanzamiento de ChatGPT. ChatGPT tuvo tanto éxito, en gran parte debido al entrenamiento previo a escala que realizó OpenAI, lo que lo convirtió en un poderoso modelo de lenguaje.
Después de eso, los laboratorios de Frontier LLM comenzaron a ampliar la capacitación posterior, con ajustes finos supervisados y RLHF, donde los modelos mejoraron cada vez más en el seguimiento de instrucciones y la realización de tareas complejas.
Y justo cuando pensábamos que los LLM estaban a punto de estancarse, comenzamos a escalar el tiempo de inferencia con el lanzamiento de modelos de razonamiento, donde el gasto de tokens de pensamiento proporcionó enormes mejoras en la calidad de los resultados.
Ahora sostengo que deberíamos continuar con este escalamiento con un nuevo paradigma de escalamiento: escalamiento basado en el uso, donde escalas cuánto estás usando LLM:
Ejecute más agentes de codificación en paralelo. Siempre inicie una investigación profunda sobre un tema de interés. Ejecute flujos de trabajo de búsqueda de información.
Si no despides a un agente antes de ir a almorzar o ir a dormir, estás perdiendo el tiempo.
En este artículo, analizaré por qué ampliar el uso de LLM puede generar una mayor productividad, especialmente cuando se trabaja como programador. Además, analizaré técnicas específicas que puede utilizar para ampliar su uso de LLM, tanto personalmente como para las empresas para las que trabaja. Mantendré este artículo de alto nivel, con el objetivo de inspirar cómo puedes utilizar la IA al máximo para tu beneficio.
Por qué debería ampliar el uso de LLM
Ya hemos visto anteriormente que el escalado es increíblemente poderoso con:
escala de tiempo de inferencia pre-entrenamiento y post-entrenamiento
La razón de esto es que resulta que cuanto más potencia informática gastes en algo, mejor calidad de salida obtendrás. Esto, por supuesto, supone que eres capaz de utilizar la computadora de manera efectiva. Por ejemplo, para la formación previa, poder escalar la informática depende de
Modelos lo suficientemente grandes (suficientes pesos para entrenar) Suficientes datos para entrenar
Si escala la computación sin estos dos componentes, no verá mejoras. Sin embargo, si escala los tres, obtendrá resultados sorprendentes, como los LLM de frontera que estamos viendo ahora, por ejemplo, con el lanzamiento de Gemini 3.
Por lo tanto, sostengo que debería intentar ampliar su propio uso de LLM tanto como sea posible. Esto podría, por ejemplo, despedir a varios agentes para que codifiquen en paralelo o iniciar una investigación profunda de Gemini sobre un tema que le interese.
Por supuesto, el uso debe seguir siendo valioso. No tiene sentido iniciar un agente de codificación en alguna tarea oscura que no necesita. Más bien, debería iniciar un agente de codificación en:
Un problema lineal que nunca sintió que tuviera tiempo de sentarse y resolver usted mismo. Se solicitó una función rápida en la última llamada de ventas. Algunas mejoras en la interfaz de usuario, ya sabe, los agentes de codificación actuales las manejan fácilmente.
En un mundo con abundancia de recursos, debemos buscar maximizar el uso que hacemos de ellos.
Mi punto principal aquí es que el umbral para realizar tareas ha disminuido significativamente desde el lanzamiento de los LLM. Anteriormente, cuando recibías un informe de error, tenías que sentarte durante 2 horas en profunda concentración, pensando en cómo resolver ese error.
Sin embargo, hoy en día, ese ya no es el caso. En su lugar, puede ingresar al Cursor, ingresar el informe de error y pedirle a Claude Sonnet 4.5 que intente solucionarlo. Luego puede regresar 10 minutos más tarde, probar si el problema se solucionó y crear la solicitud de extracción.
¿Cuántas fichas puedes gastar mientras sigues haciendo algo útil con las fichas?
Cómo escalar el uso de LLM
Hablé sobre por qué debería escalar el uso de LLM ejecutando más agentes de codificación, agentes de investigación profunda y cualquier otro agente de IA. Sin embargo, puede resultar difícil pensar exactamente qué LLM debería realizar. Por lo tanto, en esta sección, analizaré agentes específicos que puede utilizar para ampliar su uso de LLM.
Agentes de codificación paralela
Los agentes de codificación paralela son una de las formas más sencillas de ampliar el uso de LLM para cualquier programador. En lugar de trabajar solo en un problema a la vez, inicia dos o más agentes al mismo tiempo, ya sea utilizando agentes Cursor, código Claude o cualquier otra herramienta de codificación agente. Por lo general, esto es muy fácil de hacer utilizando árboles de trabajo de Git.
Por ejemplo, normalmente tengo una tarea o proyecto principal en el que estoy trabajando, donde estoy sentado en el Cursor y programando. Sin embargo, a veces recibo un informe de error y lo dirijo automáticamente a Claude Code para que busque por qué ocurre el problema y lo solucione si es posible. A veces, esto funciona de inmediato; A veces tengo que evitarlo un poco.
Sin embargo, el costo de iniciar este agente de corrección de errores es muy bajo (literalmente puedo simplemente copiar el problema de Linear en Cursor, que puede leer el problema usando Linear MCP). De manera similar, también tengo un script que investiga automáticamente prospectos relevantes, que ejecuto en segundo plano.
Investigación profunda
La investigación profunda es una funcionalidad que puede utilizar en cualquiera de los proveedores de modelos de vanguardia como Google Gemini, OpenAI ChatGPT y Anthropic’s Claude. Prefiero la investigación profunda de Gemini 3, aunque existen muchas otras herramientas sólidas de investigación profunda.
Siempre que estoy interesado en aprender más sobre un tema, encontrar información o algo similar, despido a un agente de investigación profunda con Gemini.
Por ejemplo, estaba interesado en encontrar algunos prospectos dado un PCI específico. Luego pegué rápidamente la información de ICP en Gemini, le di información contextual y comencé a investigar para que pudiera ejecutarse mientras trabajaba en mi proyecto de programación principal.
Después de 20 minutos, recibí un breve informe de Gemini, que resultó contener mucha información útil.
Creando flujos de trabajo con n8n
Otra forma de ampliar el uso de LLM es crear flujos de trabajo con n8n o cualquier herramienta similar de creación de flujos de trabajo. Con n8n, puede crear flujos de trabajo específicos que, por ejemplo, lean mensajes de Slack y realicen alguna acción basada en esos mensajes de Slack.
Podría, por ejemplo, tener un flujo de trabajo que lea un grupo de informes de errores en Slack e inicie automáticamente un agente de código Claude para un informe de errores determinado. O podría crear otro flujo de trabajo que agregue información de muchas fuentes diferentes y se la proporcione en un formato fácilmente legible. Básicamente, existen infinitas oportunidades con las herramientas de creación de flujos de trabajo.
Más
Existen muchas otras técnicas que puede utilizar para ampliar su uso de LLM. Solo he enumerado los primeros elementos que me vinieron a la mente cuando trabajo con LLM. Recomiendo tener siempre en cuenta qué se puede automatizar utilizando la IA y cómo aprovecharla para ser más eficaz. La forma de ampliar el uso de LLM variará ampliamente según las diferentes empresas, puestos de trabajo y muchos otros factores.
Conclusión
En este artículo, analicé cómo ampliar su uso de LLM para convertirse en un ingeniero más eficaz. Sostengo que hemos visto que el escalamiento funciona increíblemente bien en el pasado, y es muy probable que podamos ver resultados cada vez más poderosos al escalar nuestro propio uso de los LLM. Esto podría consistir en disparar más agentes codificadores en paralelo, ejecutando agentes de investigación profunda mientras almorzamos. En general, creo que al aumentar nuestro uso de LLM, podemos ser cada vez más productivos.
👉 Encuéntrame en las redes sociales:
📚 Obtenga mi libro electrónico gratuito sobre Modelos de lenguaje de visión
💻 Mi seminario web sobre modelos de lenguaje de visión
📩 Suscríbete a mi newsletter
🧑💻 Ponte en contacto
🐦X/Twitter
✍️ Medio