OpenAI ha dado un paso importante en el campo de la inteligencia artificial con el lanzamiento de un nuevo modelo denominado OpenAI o1, también llamado “Strawberry”. Este modelo supone un cambio de enfoque en el desarrollo de la IA y destaca que el tamaño no es el único factor determinante en el avance de esta tecnología.
El año pasado, OpenAI presentó GPT-4, un modelo que amplió significativamente el tamaño de sus redes neuronales. Sin embargo, la introducción de OpenAI o1 señala una evolución en la capacidad de pensar de forma lógica. A diferencia de otros modelos que tienden a generar respuestas de inmediato, o1 es capaz de razonar y pensar en voz alta antes de llegar a una conclusión, de forma muy parecida a un ser humano.
Mira Murati, directora de tecnología de OpenAI, explica que este modelo no pretende sustituir al GPT-4, sino complementarlo. Actualmente, la compañía está trabajando en GPT-5, que será significativamente más grande que su predecesor. Murati aclara que hay dos paradigmas en juego: el del escalamiento y esta nueva forma de pensar, y la intención es integrarlos.
Los modelos de lenguaje como LLM (Large Language Models) se basan en enormes redes neuronales que se entrenan con enormes cantidades de datos. Aunque dominan las tareas de lenguaje y razonamiento, a menudo encuentran dificultades con problemas aparentemente simples, como operaciones matemáticas básicas. OpenAI o1 utiliza el aprendizaje por refuerzo para mejorar sus habilidades de pensamiento y proporcionar comentarios positivos o negativos según la precisión de sus respuestas. Este tipo de aprendizaje ha demostrado ser eficaz en aplicaciones como el diseño de chips y la creación de chatbots más sofisticados.
Mark Chen, vicepresidente de investigación de OpenAI, demostró el potencial de o1 al resolver problemas complejos que GPT-4 no podía resolver, incluidas cuestiones químicas y complicados acertijos matemáticos. Chen enfatiza que el nuevo modelo aprende a pensar de forma autónoma, en lugar de simplemente imitar el pensamiento humano, como era el caso de los modelos anteriores.
En términos de rendimiento, OpenAI o1 ha demostrado ser superior en varios campos como codificación, matemáticas, física, biología y química. Por ejemplo, en un examen de matemáticas para estudiantes, GPT-4 resolvió el 12% de los problemas, mientras que o1 logró un impresionante 83%.
Sin embargo, el nuevo modelo también tiene desventajas. Es más lento que GPT-4 y no puede realizar búsquedas en Internet, lo que limita sus capacidades en determinadas tareas. Mejorar el pensamiento en los LLM es un tema de creciente interés en la investigación, y competidores como Google están explorando enfoques similares.
OpenAI cree que su nuevo modelo podría contribuir a un comportamiento más seguro y coherente con las normas sociales. Murati señala que al pensar en las consecuencias de sus acciones, o1 puede evitar resultados dañinos que podrían conducir a una IA menos peligrosa.
Expertos en inteligencia artificial como Oren Etzioni destacan la importancia de entrenar modelos para resolver problemas complejos y utilizar herramientas adecuadas. A pesar de los avances, persisten desafíos como las “alucinaciones” y la precisión de la información generada.
Chen concluye que el argumento no sólo es apasionante, sino que también promete hacer que la IA sea más accesible y asequible, lo que está en consonancia con la misión de OpenAI de democratizar el acceso a la IA.