DeepSeek presenta un nuevo modelo de IA que 'cierra la brecha' con los modelos de frontera
Resumen
El laboratorio chino de IA DeepSeek ha lanzado dos versiones de su nuevo modelo V4: Flash y Pro. Ambos utilizan una arquitectura de mezcla de expertos y cuentan con ventanas de contexto de 1 millón de tokens. El modelo V4 Pro destaca por sus 1.6 billones de parámetros, superando a sus predecesores y compitiendo con los modelos líderes en razonamiento y codificación. Aunque el laboratorio reconoce estar ligeramente por detrás en pruebas de conocimiento general, subraya que su propuesta es significativamente más asequible que la de los principales competidores del sector.
(Fuente:TechCrunch)