Deepseek AI presenta Deepseek-V3-0324: Blazing Fast Performance en Mac Studio, calentando la competencia con Operai

La inteligencia artificial (IA) ha logrado avances significativos en los últimos años, pero los desafíos persisten en lograr modelos eficientes, rentables y de alto rendimiento. El desarrollo de modelos de idiomas grandes (LLM) a menudo requiere recursos computacionales sustanciales e inversión financiera, lo que puede ser prohibitivo para muchas organizaciones. Además, garantizar que estos modelos posean fuertes capacidades de razonamiento y se puedan implementar de manera efectiva en el hardware de grado de consumo sigue siendo un obstáculo.

Deepseek AI ha abordado estos desafíos de frente con el lanzamiento de Deepseek-V3-0324, una actualización significativa a su V3 modelo de lenguaje grande. Este nuevo modelo no solo mejora el rendimiento, sino que también funciona a una velocidad impresionante de 20 tokens por segundo En un Mac Studio, un dispositivo de grado de consumo. Este avance intensifica la competencia con líderes de la industria como OpenAi, que muestra el compromiso de Deepseek de hacer que los modelos de IA de alta calidad sean más accesibles y eficientes. ​

Deepseek-V3-0324 presenta varias mejoras técnicas sobre su predecesor. En particular, demuestra mejoras significativas en las capacidades de razonamiento, con puntajes de referencia que muestran aumentos sustanciales:

  • MMLU-Pro: 75.9 → 81.2 (+5.3)
  • GPQA: 59.1 → 68.4 (+9.3)
  • AIME: 39.6 → 59.4 (+19.8)
  • LivecodeBench: 39.2 → 49.2 (+10.0)

Estas mejoras indican una comprensión y procesamiento más sólidas de tareas complejas. Además, el modelo ha mejorado las habilidades de desarrollo web front-end, produciendo más código ejecutable y páginas web e interfaces web estéticamente agradables. Su dominio de escritura china también ha visto avances, alineándose con el estilo de escritura R1 y mejorando la calidad del contenido de forma media a larga. Además, se ha aumentado la precisión de llamadas de funciones, abordando los problemas presentes en versiones anteriores.

El lanzamiento de Deepseek-V3-0324 bajo la licencia MIT subraya la dedicación de Deepseek AI a la colaboración de código abierto, lo que permite a los desarrolladores de todo el mundo utilizar y construir sobre esta tecnología sin restricciones restrictivas de licencia. La capacidad del modelo para ejecutarse de manera eficiente en dispositivos como Mac Studio, logrando 20 tokens por segundo, ejemplifica su aplicabilidad y eficiencia práctica. Este nivel de rendimiento no solo hace que la IA avanzada sea más accesible, sino que también reduce la dependencia del hardware costoso y especializado, lo que reduce la barrera de entrada para muchos usuarios y organizaciones. ​

En conclusión, la liberación de Deepseek AI de Deepseek-V3-0324 marca un hito significativo en el paisaje de IA. Al abordar los desafíos clave relacionados con el rendimiento, el costo y la accesibilidad, Deepseek se ha posicionado como un competidor formidable para entidades establecidas como OpenAI. Los avances técnicos del modelo y la disponibilidad de código abierto prometen democratizar aún más la tecnología de IA, fomentando la innovación y la adopción más amplia en varios sectores.


Verificar el Modelo en la cara abrazada. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro 85k+ ml de subreddit.


Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.