Cómo utilizar NVIDIA Canary-1B-v2 para ASR, traducción y exportación automática de subtítulos SRT en Python
importar tiempo, json, gc, matemáticas, urllib.request importar antorcha, numpy como np, archivo de sonido como sf, librosa print(“>>> FASE 2: ejecución del tutorial\n”) print(“NumPy:”, np.__version__, “| PyTorch:”, torch.__version__) print(“CUDA disponible:”, torch.cuda.is_available()) if torch.cuda.is_available(): print(“GPU:”, torch.cuda.get_device_name(0), f”| VRAM: {torch.cuda.get_device_properties(0).total_memory/1e9:.1f} GB”) else: print(“⚠️ Sin GPU: se ejecutará en la CPU (muy lento). ” “Establecer tiempo de ejecución > Cambiar tipo de tiempo de ejecución > GPU.”) DEVICE = “cuda” if torch.cuda.is_available() else “cpu” LANGS = { “bg”:”búlgaro”,”hr”:”croata”,”cs”:”checo”,”da”:”danés”,”nl”:”holandés”, “en”:”inglés”,”et”:”estonio”,”fi”:”finlandés”,”fr”:”francés”,”de”:”alemán”, “el”:”griego”,”hu”:”húngaro”,”it”:”italiano”,”lv”:”letón”,”lt”:”lituano”, “mt”:”maltés”,”pl”:”polaco”,”pt”:”portugués”,”ro”:”rumano”,”sk”:”eslovaco”, “sl”:”esloveno”,”es”:”español”,”sv”:”sueco”,”ru”:”ruso”,”uk”:”ucraniano”, } print(f”\nIdiomas admitidos ({len(LANGS)}):”, “, “.join(LANGS.keys())) from nemo.collections.asr.models import ASRModel print(“\nCargando nvidia/canary-1b-v2 …”) t0 = time.time() asr_model = ASRModel.from_pretrained(model_name=”nvidia/canary-1b-v2″).to(DEVICE).eval() print(f”Modelo cargado en {time.time()-t0:.1f}s”)