VEKTRA 374

Tecnología

GPT-4o: El progreso de la interacción Humano-Computador

Carmen Vektra

mayo 15, 2024

OpenAI presenta GPT-4o, su modelo más avanzado, diseñado para razonar en tiempo real a través de audio, visión y texto.

Este cambio marca un hito en la interacción humano-computador, permitiendo una comunicación más natural y eficiente.

Capacidades del modelo GPT-4o

GPT-4o («o» de «omni») acepta y genera combinaciones de texto, audio, imagen y video, ofreciendo respuestas en tan solo 232 milisegundos.

Al modelo de lenguaje lo convierte en una IA mucho más rápida y eficiente en comparación con sus predecesores.

Por lo tanto, mejora notablemente el rendimiento en idiomas distintos del inglés y en la comprensión de audio y visión.

Algunas de las demostraciones más destacadas de GPT-4o incluyen:

Dos GPT-4os interactuando y cantando.
Preparación de entrevistas.
Juego de piedra, papel, tijera.
Comprensión y generación de sarcasmo.
Resolución de problemas matemáticos.
Armonización musical entre dos GPT-4os.
Traducción en tiempo real y aprendizaje de idiomas.
Interacciones de servicio al cliente.

Seguridad y limitaciones del modelo

La LLM ha sido diseñado con seguridad integrada en todas sus modalidades.

Se han implementado técnicas de filtrado de datos y refinamiento post-entrenamiento para garantizar la seguridad de sus salidas.

Las evaluaciones de ciberseguridad, persuasión y autonomía del modelo indican que GPT-4o no supera el riesgo medio en ninguna categoría.

La inteligencia artificial fue sometida a pruebas rigurosas con más de 70 expertos externos en psicología social, equidad y desinformación para identificar y mitigar riesgos potenciales.

Las modalidades de audio, por ejemplo, se limitarán inicialmente a voces preestablecidas para cumplir con las políticas de seguridad.

Disponibilidad de GPT-4o

El modelo está disponible a partir de hoy en ChatGPT, con capacidades de texto e imagen desplegándose inicialmente para usuarios gratuitos y Plus.

Los desarrolladores también pueden acceder a la IA en la API y disfrutar de un modelo dos veces más rápido y la mitad de costoso que GPT-4 Turbo.

En las próximas semanas, se lanzarán nuevas capacidades de audio y video a un grupo selecto de socios de confianza.

La iteración es solo el comienzo, ya que en OpenAI continúan explorando y expandiendo las posibilidades de GPT-4o para mejorar la interacción humano-máquina.

GPT-4o es un paso enorme hacia el futuro de la inteligencia artificial, con una usabilidad práctica y eficiencia que promete transformar diversas industrias y aplicaciones.

Con información de OpenAI.

Tagged in :

Más entradas

Tecnología
IA y NASA: Predicción de eventos solares
septiembre 30, 2025
.
Carmen Vektra
La inteligencia artificial ayuda a predecir eventos solares y proteger satélites de posibles interrupciones.
Tecnología
Google renueva Play Store con IA y nuevas funciones
septiembre 23, 2025
.
Carmen Vektra
Google anunció una importante actualización de su Play Store, orientada a mejorar la interacción de sus más de 4 mil millones…
Tecnología
Meta lanza Hyperscape convirtiendo espacios en mundos virtuales
septiembre 19, 2025
.
Carmen Vektra
En Meta Connect, la compañía de Mark Zuckerberg presentó varias actualizaciones sobre el metaverso, resaltando el lanzamiento de Hyperscape.

VEKTRA 374

GPT-4o: El progreso de la interacción Humano-Computador

Capacidades del modelo GPT-4o

Seguridad y limitaciones del modelo

Disponibilidad de GPT-4o

Más entradas

IA y NASA: Predicción de eventos solares

Google renueva Play Store con IA y nuevas funciones

Meta lanza Hyperscape convirtiendo espacios en mundos virtuales