Construyendo una tubería confiable de aprendizaje automático de extremo a extremo utilizando MLE-agent y Ollama localmente

Comenzamos este tutorial mostrando cómo podemos combinar Agente mle con Ollama para crear un flujo de trabajo de aprendizaje automático totalmente local y sin API. Configuramos un entorno reproducible en Google Colab, generamos un pequeño conjunto de datos sintético y luego guiamos al agente para redactar un script de capacitación. Para que sea robusto, desinfectamos errores comunes, aseguramos las importaciones correctas y agregamos un script de alternativa garantizado. De esta manera, mantenemos el flujo de trabajo suave mientras aún se beneficia de la automatización. Mira el Códigos completos aquí.

import os, re, time, textwrap, subprocess, sys
from pathlib import Path


def sh(cmd, check=True, env=None, cwd=None):
   print(f"$ {cmd}")
   p = subprocess.run(cmd, shell=True, env={**os.environ, **(env or {})} if env else None,
                      cwd=cwd, stdout=subprocess.PIPE, stderr=subprocess.STDOUT, text=True)
   print(p.stdout)
   if check and p.returncode!=0: raise RuntimeError(p.stdout)
   return p.stdout

Definimos una función de ayuda SH que usamos para ejecutar los comandos de shell. Imprimimos el comando, capturamos su salida y elevamos un error si falla para que podamos monitorear la ejecución en tiempo real. Mira el Códigos completos aquí.

WORK=Path("/content/mle_colab_demo"); WORK.mkdir(parents=True, exist_ok=True)
PROJ=WORK/"proj"; PROJ.mkdir(exist_ok=True)
DATA=WORK/"data.csv"; MODEL=WORK/"model.joblib"; PREDS=WORK/"preds.csv"
SAFE=WORK/"train_safe.py"; RAW=WORK/"agent_train_raw.py"; FINAL=WORK/"train.py"
MODEL_NAME=os.environ.get("OLLAMA_MODEL","llama3.2:1b")


sh("pip -q install --upgrade pip")
sh("pip -q install mle-agent==0.4.* scikit-learn pandas numpy joblib")


sh("curl -fsSL https://ollama.com/install.sh | sh")
sv = subprocess.Popen("ollama serve", shell=True)
time.sleep(4); sh(f"ollama pull {MODEL_NAME}")

Configuramos nuestras rutas y nombres de archivo del espacio de trabajo de Colab, luego instalamos las dependencias exactas de Python que necesitamos. Instalamos y iniciamos ollama localmente, tiramos del modelo elegido y mantenemos el servidor Ejecutando para que podamos generar código sin ninguna tecla API externas. Mira el Códigos completos aquí.

import numpy as np, pandas as pd
np.random.seed(0)
n=500; X=np.random.rand(n,4); y=([email protected]([0.4,-0.2,0.1,0.5])+0.15*np.random.randn(n)>0.55).astype(int)
pd.DataFrame(np.c_[X,y], columns=["f1","f2","f3","f4","target"]).to_csv(DATA, index=False)


env = {"OPENAI_API_KEY":"", "ANTHROPIC_API_KEY":"", "GEMINI_API_KEY":"",
      "OLLAMA_HOST":"http://127.0.0.1:11434", "MLE_LLM_ENGINE":"ollama","MLE_MODEL":MODEL_NAME}
prompt=f"""Return ONE fenced python code block only.
Write train.py that reads {DATA}; 80/20 split (random_state=42, stratify);
Pipeline: SimpleImputer + StandardScaler + LogisticRegression(class_weight="balanced", max_iter=1000, random_state=42);
Print ROC-AUC & F1; print sorted coefficient magnitudes; save model to {MODEL} and preds to {PREDS};
Use only sklearn, pandas, numpy, joblib; no extra text."""
def extract(txt:str)->str|None:
   txt=re.sub(r"x1B[[0-?]*[ -/]*[@-~]", "", txt)
   m=re.search(r"```(?:python)?s*([sS]*?)```", txt, re.I)
   if m: return m.group(1).strip()
   if txt.strip().lower().startswith("python"): return txt.strip()[6:].strip()
   m=re.search(r"(?:^|n)(froms+[^n]+|imports+[^n]+)([sS]*)", txt);
   return (m.group(1)+m.group(2)).strip() if m else None


out = sh(f'printf %s "{prompt}" | mle chat', check=False, cwd=str(PROJ), env=env)
code = extract(out) or sh(f'printf %s "{prompt}" | ollama run {MODEL_NAME}', check=False, env=env)
code = extract(code) if code and not isinstance(code, str) else (code or "")
(Path(RAW)).write_text(code or "", encoding="utf-8")

Generamos un pequeño conjunto de datos etiquetado y establecemos variables de entorno para que podamos conducir el agente MLE a través de Ollama localmente. Elaboramos un mensaje estricto para Train.py y definimos un ayudante de extracto que solo tira del código Python cercado. Luego le preguntamos a MLE-agent (retrocediendo a Ollama Run si es necesario) y guardar el script generado en bruto en disco para la desinfección. Mira el Códigos completos aquí.

def sanitize(src:str)->str:
   if not src: return ""
   s = src
   s = re.sub(r"r","",s)
   s = re.sub(r"^pythonb","",s.strip(), flags=re.I).strip()
   fixes = {
       r"froms+sklearn.pipelines+imports+SimpleImputer": "from sklearn.impute import SimpleImputer",
       r"froms+sklearn.preprocessings+imports+SimpleImputer": "from sklearn.impute import SimpleImputer",
       r"froms+sklearn.pipelines+imports+StandardScaler": "from sklearn.preprocessing import StandardScaler",
       r"froms+sklearn.preprocessings+imports+ColumnTransformer": "from sklearn.compose import ColumnTransformer",
       r"froms+sklearn.pipelines+imports+ColumnTransformer": "from sklearn.compose import ColumnTransformer",
   }
   for pat,rep in fixes.items(): s = re.sub(pat, rep, s)
   if "SimpleImputer" in s and "from sklearn.impute import SimpleImputer" not in s:
       s = "from sklearn.impute import SimpleImputern"+s
   if "StandardScaler" in s and "from sklearn.preprocessing import StandardScaler" not in s:
       s = "from sklearn.preprocessing import StandardScalern"+s
   if "ColumnTransformer" in s and "from sklearn.compose import ColumnTransformer" not in s:
       s = "from sklearn.compose import ColumnTransformern"+s
   if "train_test_split" in s and "from sklearn.model_selection import train_test_split" not in s:
       s = "from sklearn.model_selection import train_test_splitn"+s
   if "joblib" in s and "import joblib" not in s: s = "import joblibn"+s
   return s


san = sanitize(code)


safe = textwrap.dedent(f"""
import pandas as pd, numpy as np, joblib
from pathlib import Path
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import roc_auc_score, f1_score
from sklearn.compose import ColumnTransformer


DATA=Path("{DATA}"); MODEL=Path("{MODEL}"); PREDS=Path("{PREDS}")
df=pd.read_csv(DATA); X=df.drop(columns=["target"]); y=df["target"].astype(int)
num=X.columns.tolist()
pre=ColumnTransformer([("num",Pipeline([("imp",SimpleImputer()),("sc",StandardScaler())]),num)])
clf=LogisticRegression(class_weight="balanced", max_iter=1000, random_state=42)
pipe=Pipeline([("pre",pre),("clf",clf)])
Xtr,Xte,ytr,yte=train_test_split(X,y,test_size=0.2,random_state=42,stratify=y)
pipe.fit(Xtr,ytr)
proba=pipe.predict_proba(Xte)[:,1]; pred=(proba>=0.5).astype(int)
print("ROC-AUC:",round(roc_auc_score(yte,proba),4)); print("F1:",round(f1_score(yte,pred),4))
import pandas as pd
coef=pd.Series(pipe.named_steps["clf"].coef_.ravel(), index=num).abs().sort_values(ascending=False)
print("Top coefficients by |magnitude|:\n", coef.to_string())
joblib.dump(pipe,MODEL)
pd.DataFrame({{"y_true":yte.reset_index(drop=True),"y_prob":proba,"y_pred":pred}}).to_csv(PREDS,index=False)
print("Saved:",MODEL,PREDS)
""").strip()

Desinterratamos el script generado por el agente despojando los prefijos callejeros y el autoejecimiento de los errores comunes de importación de Scikit-Learn, luego prependemos cualquier importación esencial faltante para que funcione limpiamente. También preparamos un tren de luz seguro y completamente determinista que podemos ejecutar incluso si el código del agente es imperfecto, asegurando que siempre entrenamos, evaluemos y persistamos de manera confiable. Mira el Códigos completos aquí.

chosen = san if ("import " in san and "sklearn" in san and "read_csv" in san) else safe
Path(SAFE).write_text(safe, encoding="utf-8")
Path(FINAL).write_text(chosen, encoding="utf-8")
print("n=== Using train.py (first 800 chars) ===n", chosen[:800], "n...")


sh(f"python {FINAL}")
print("nArtifacts:", [str(p) for p in WORK.glob('*')])
print("✅ Done — outputs in", WORK)

Decidimos si ejecutar el código de agente desinfectado o recurrir al script seguro, luego guardar ambos como referencia. Ejecutamos el Train.py elegido, imprimimos una vista previa de su contenido y luego enumeramos todos los artefactos generados para confirmar que el flujo de trabajo se completa con éxito.

Concluimos ejecutando la versión desinfectada o segura del script de entrenamiento, evaluando ROC-AUC y F1, impresión de magnitud del coeficiente y guardando todos los artefactos. A través de este proceso, demostramos cómo podemos integrar LLM locales con tuberías ML tradicionales al tiempo que preservamos la confiabilidad y la seguridad. El resultado es un marco práctico que nos permite controlar la ejecución, evitar las claves externas y aún aprovechar la automatización para la capacitación del modelo del mundo real.

Mira el Códigos completos aquí. No dude en ver nuestro Página de Github para tutoriales, códigos y cuadernos. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.

Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.

Construyendo una tubería confiable de aprendizaje automático de extremo a extremo utilizando MLE-agent y Ollama localmente

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

El nuevo modelo de IA de DeepSeek se está implementando silenciosamente, sin causar shock en el mercado de Wall Street

Cursor presenta un SDK de TypeScript para crear agentes de codificación programática con máquinas virtuales en la nube protegidas, subagentes, enlaces y precios basados en tokens

IBM lanza dos modelos Granite Speech 4.1 2B: ASR autorregresivo con traducción y edición no autorregresiva para una inferencia rápida

You missed

IA para la civilización global: Diálogo China-Singapur celebrado en Singapur

El crecimiento económico de España desafía el impacto de la guerra en Oriente Medio

Kiara Advani canta Baby Shark durante las vacaciones con Sidharth Malhotra y su hija Saraayah

Muere a los 79 años el genetista pionero y decodificador del genoma humano J. Craig Venter