Lo confirmó Sam Altman en X. El modelo, que competirá con alternativas open source, podrá ejecutarse de forma local y permitirá personalización
03.04.2025 • 08:32hs • TECNOLOGÍA
TECNOLOGÍA
OpenAI lanzará un modelo de IA "open-weight" con capacidades de razonamiento avanzado
OpenAI, la empresa detrás de ChatGPT, anunció el lanzamiento de un nuevo modelo de lenguaje con "pesos abiertos" (open-weight) y capacidades avanzadas de razonamiento, que estará disponible en los próximos meses.
Así lo confirmó el CEO de la compañía, Sam Altman, a través de una publicación en X (ex Twitter), donde señaló que se tratará del primero de su tipo desde GPT-2, y destacó que fue una decisión largamente considerada y que ahora se ha vuelto prioritaria.
"Estamos planeando lanzar nuestro primer modelo de lenguaje de ponderación abierta desde GPT-2. Hemos estado pensando en esto durante mucho tiempo, pero otras prioridades tuvieron precedencia. Ahora parece importante hacerlo", escribió.
"Antes del lanzamiento, evaluaremos este modelo de acuerdo con nuestro marco de preparación, como lo haríamos con cualquier otro modelo, y realizaremos trabajo adicional, dado que sabemos que este modelo se modificará después del lanzamiento", agregó.
A diferencia de los modelos de inteligencia artificial de código abierto, donde los desarrolladores tienen acceso al código fuente, los datos de entrenamiento y la arquitectura completa, un modelo open-weight presenta más limitaciones en ese sentido.
Si bien permite a los usuarios realizar ajustes y personalizaciones, no se proporciona el código de entrenamiento, el conjunto de datos original, los detalles de la arquitectura ni la metodología utilizada.
De esta forma, este tipo de modelos de IA no puede reconstruirse desde cero, ya que no se tiene acceso a componentes esenciales como los datos originales o el diseño arquitectónico completo.
Esta decisión de OpenAI se produce en un contexto de creciente competencia dentro del ecosistema IA, con rivales como Meta y su familia de modelos Llama, Google con su reciente Gemma (de capacidades multimodales) y la empresa china DeepSeek, cuyo modelo open source habría superado, según afirman, a la versión o1 de OpenAI.
Pese al entusiasmo que generó el anuncio, OpenAI no ha dado a conocer detalles clave sobre el modelo. Se desconoce, hasta el momento, cuántos parámetros tendrá, el tamaño de su ventana de contexto, los métodos de entrenamiento utilizados o la licencia exacta con la que será lanzado.
Como primera medida, la empresa publicó un formulario en su sitio web para recopilar opiniones de desarrolladores, investigadores y la comunidad en general, con el objetivo de "hacer que este modelo sea lo más útil posible".