Investigadores de la CMU presentan MMMU-Pro: una versión avanzada del modelo de referencia de comprensión y razonamiento multimodal multidisciplinario masivo (MMMU) para evaluar la comprensión multimodal en modelos de IA
Los modelos de lenguaje multimodales de gran tamaño (MLLM) se aplican cada vez más en diversos campos, como el análisis de imágenes médicas, los diagnósticos de ingeniería e incluso la…