OpenAI ha lanzado o1-preview, una serie de modelos de lenguaje LLM que marca un avance notorio en el razonamiento y la resolución de problemas complejos.
Disponible desde la versión 9.12, estos modelos están diseñados para dedicar más tiempo a pensar antes de responder, permitiendo abordar tareas complicadas en ciencias, codificación y matemáticas con una mayor precisión.
Funcionamiento de OpenAI o1
La clave del rendimiento superior de o1-preview radica en su entrenamiento especializado.
Los modelos de lenguaje pasan más tiempo refinando su proceso de pensamiento, evaluando distintas estrategias y reconociendo errores antes de ofrecer una respuesta final.
En pruebas rigurosas, los modelos demostraron un desempeño comparable al de estudiantes de doctorado en física, química y biología.
Por ejemplo, en un examen de la Olimpiada Internacional de Matemáticas, el modelo o1-preview resolvió el 83% de los problemas, en contraste con el 13% de GPT-4o.

Seguridad y gobernanza en los modelos de lenguaje
El nuevo enfoque de seguridad en o1-preview aprovecha sus capacidades de razonamiento para seguir y aplicar las pautas de seguridad de manera más efectiva.
En pruebas de resistencia a intentos de eludir estas reglas (jailbreaking), o1-preview obtuvo una calificación de 84 sobre 100, superando considerablemente a versiones anteriores.
OpenAI ha reforzado sus prácticas de seguridad y colaboración con institutos de seguridad en EE. UU. y el Reino Unido, estableciendo un proceso robusto para evaluar futuros modelos.
Acceso y perspectivas
A partir de hoy, los usuarios de ChatGPT Plus, Team, Enterprise y Edu pueden acceder a o1-preview y a o1-mini, una versión más económica y rápida especialmente diseñada para la codificación.
OpenAI también planea introducir mejoras adicionales, como navegación web y carga de archivos, para expandir aún más la utilidad de estos modelos en el futuro.
Con información de OpenAI.
Más historias
AlphaEvolve: IA que diseña mejores algoritmos
Google lanza IA de imagen a video en los nuevos Honor 400
Claude mejora su modo de investigación y añade integraciones