TECNOLOGÍA
TECNOLOGÍA

OpenAI promete un modelo con pesos públicos que se podrá ejecutar localmente

Aunque no será enteramente abierto, es el primer modelo reciente de la compañía que no es completamente propietario

OpenAI promete un modelo con pesos públicos que se podrá ejecutar localmente
Actualizado

A pesar de su nombre, OpenAI no puede presumir de ser abierta. Todos los modelos de lenguaje recientes de los responsables de ChatGPT son cerrados y propietarios, algo por lo que ha sido ampliamente criticada, incluso por el propio Elon Musk, uno de sus fundadores y ahora rival directo.

Pero la compañía parece dispuesta a cambiar esa narrativa. Su actual máximo responsable, Sam Altman, ha anunciado que OpenAI pronto lanzará un nuevo modelo de lenguaje con pesos abiertos que podrá ser ejecutado localmente, en lugar de exclusivamente en los servidores de la empresa. El último modelo que OpenAI lanzó con estas características fue GPT-2, que vio la luz hace seis años.

En un modelo de lenguaje largo -la pieza que hace posible las modernas aplicaciones de inteligencia artificial generativa-, un peso es un parámetro numérico que determina la importancia de una conexión entre dos neuronas en la red neuronal del modelo.

Estos pesos se calculan durante el entrenamiento del modelo mediante un proceso llamado aprendizaje máquina e influyen en cómo el modelo procesa y genera texto.

En los modelos abiertos, estos pesos son conocidos. En los cerrados, son un secreto celosamente guardado porque pueden permitir a un rival crear un modelo comparable gastando una fracción en la fase de entrenamiento, una de las partes más complejas y costosas del desarrollo.

En sus mensajes, Altman da a entender que a pesar de tener los pesos públicos, el modelo podría no ser de código abierto completamente. Aún así, supondría un paso importante en una dirección que OpenAi parecía haber abandonado completamente.

La empresa se enfrenta a una creciente presión por parte de algunos rivales que han optado por dar acceso libre a sus modelos. El más famoso es posiblemente DeepSeek, un modelo chino que ha sorprendido a la industria en los últimos meses por la calidad de su razonamiento.

La decisión de lanzar este modelo, en cualquier caso, no es una prioridad para OpenAI, que acaba de cerrar una nueva ronda de financiación que ha valorado la compañía en 300.000 millones de dólares y planea seguir desarrollando modelos propietarios. Está buscando opiniones y sugerencias de investigadores y desarrolladores para decidir qué características tendrá finalmente y planea lanzarlo "en los próximos meses".

La ronda de financiación llega en un momento dulce para la compañía. Tras el lanzamiento de su nuevo modelo generativo GPT-4o, millones de usuarios inundaron las redes sociales con ilustraciones generadas por ChatGPT con el estilo del famoso estudio de animación japonés Studio Ghibli.

El crecimiento en usuarios de la herramienta se disparó, llegando a registrar más de un millón de nuevos usuarios en tan solo una hora y obligando a OpenAI a imponer límites en las cuentas gratuitas debido a la carga que suponía la creación de estas imágenes para los servidores de la empresa.