El nuevo modelo de DeepSeek procesa grandes volúmenes de información con menos recursos, manteniendo precisión en búsqueda y codificación
01.10.2025 • 14:50hs • inteligencia artificial
inteligencia artificial
La IA que piensa mejor y cuesta menos: cómo funciona el nuevo modelo con atención dispersa de DeepSeek
La empresa china DeepSeek acaba de presentar su nuevo modelo experimental de inteligencia artificial, DeepSeek V3.2-Exp, que introduce una técnica innovadora denominada "atención dispersa".
Este enfoque, al que la compañía llamó DeepSeek Sparse Attention (DSA), busca optimizar el rendimiento de los sistemas de IA en contextos de procesamiento extensos y al mismo tiempo reducir los costos operativos.
Este lanzamiento es un nuevo movimiento de la compañía para posicionarse como un actor competitivo frente a gigantes como OpenAI y Anthropic, en medio de un escenario atravesado por tensiones geopolíticas y restricciones tecnológicas.
El modelo V3.2-Exp se construye sobre la base de su predecesor, V3.1-Terminus, pero incorpora una arquitectura que prioriza la eficiencia en el entrenamiento y la inferencia.
La clave del sistema DSA es el módulo "indexador Lightning", que identifica y selecciona fragmentos relevantes dentro de grandes ventanas de contexto.
Estos fragmentos luego son refinados a través de un proceso de selección de tokens de grano fino, algo que permite al modelo enfocarse en la información más pertinente sin procesar la totalidad del contenido.
DeepSeek atención dispersa: precios bajos y alto rendimiento
Esta estrategia mejora la velocidad de respuesta y reduce la carga computacional, al permitir una disminución superior a 50% en los precios de su API2.
Según DeepSeek, su nuevo modelo V3.2-Exp mantiene el rendimiento de su predecesor en tareas como búsqueda, codificación y resolución matemática, aunque experimental.
El nuevo modelo ya está disponible en su app, versión web y API, con un precio bonificado para quienes lo usen por esta última vía.
El lanzamiento se da mientras China promueve la independencia tecnológica frente a las restricciones de EE.UU. DeepSeek planea adaptar sus modelos a chips locales y posicionarse como referente en IA eficiente y accesible.
Desde su debut en enero con el modelo R1, la empresa se destacó por su enfoque disruptivo basado en aprendizaje por refuerzo, que favorece el razonamiento emergente.
Con la introducción de la atención dispersa, DeepSeek propone una arquitectura más rápida, económica y adaptable, reafirmando que la innovación en IA no depende solo de la potencia de cálculo, sino también del diseño inteligente.