Creación de datos de ajuste supervisados a partir de NVIDIA Open-SWE-Traces: análisis de trayectoria, análisis de parches, presupuestos de tokens y métricas de uso de herramientas

banner(“PASO 3: Creación del marco de datos de análisis”) def process_example(ex): traj = normalize_trajectory(ex.get(“trajectory”)) rc = role_counts(traj) nf, add, dele, _files, _exts = parse_patch(ex.get(“model_patch”)) meta = normalize_metadata(ex.get(“metadata”)) full_text = “\n”.join(message_text(m) for m in traj) return { “instance_id”: ex.get(“instance_id”), “repo”: ex.get(“repo”), “idioma”: (ex.get(“idioma”) o “desconocido”).lower(), “licencia”: ex.get(“licencia”), “resuelto”: ex.get(“resuelto”), “agente”: ex.get(“_agent”), “model”: ex.get(“_model”), “n_messages”: len(traj), “n_system”: rc.get(“system”, 0), “n_user”: rc.get(“user”, 0), “n_assistant”: rc.get(“assistant”, 0), “n_tool”: rc.get(“tool”, 0), “patch_files”: nf, “patch_add”: agregar, “patch_del”: eliminar, “patch_churn”: agregar + eliminar, “traj_tokens”: count_tokens(full_text), “categoría”: meta.get(“categoría”), “meta_files”: meta.get(“num_modified_files”), “meta_lines”: meta.get(“num_modified_lines”), “_tools”: extraer_tool_names(traj), } registros = [process_example(ex) for ex in raw_rows]
df = pd.DataFrame(registros) df[“is_resolved”] = (gl[“resolved”] == 1) gl[“known_label”] = gl[“resolved”].isin([0, 1]) print(f”Marco de datos: {df.shape[0]} filas x {df.forma[1]} cols”) print(“\nResumen numérico:”) print(df[[“n_messages”, “n_assistant”, “n_tool”,
“patch_files”, “patch_churn”, “traj_tokens”]].describe().ronda(1))

Creación de datos de ajuste supervisados a partir de NVIDIA Open-SWE-Traces: análisis de trayectoria, análisis de parches, presupuestos de tokens y métricas de uso de herramientas

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Cómo Cara es pionera en la IA de dominio específico para corretaje de seguros empresariales con AWS

Perplexity lanza Computer for Counsel: una capa agente multimodelo para flujos de trabajo legales

David Autor nombrado jefe del Departamento de Economía | Noticias del MIT

You missed

Los científicos encontraron microplásticos en los erizos y la explicación es inquietante: ScienceAlert

una aeronáutica polaca inicia un plan para producir en Burgos robots aéreos de vigilancia y ataque

París prohíbe beber en público durante la ola de calor « Euro Weekly News

Olivia Wilde y la reacción del hijo de Jason Sudeikis, Otis, ante las escenas de invitación de NSFW