OpenAI ha anunciado dos actualizaciones de su API dirigidas a desarrolladores. El nuevo modelo gpt-realtime-1.5 para la Realtime API está diseñado para ejecutar comandos de voz de forma más fiable. Según pruebas internas de OpenAI, la precisión en la transcripción de números y letras mejoró en más de un 10%, el rendimiento en tareas lógicas de audio aumentó un 5% y el seguimiento de instrucciones creció un 7%. El modelo de audio subyacente también fue actualizado a la versión 1.5.
Además, la Responses API ahora admite WebSockets. Esto permite conexiones persistentes en las que solo se envían los datos nuevos, en lugar de reenviar todo el contexto en cada solicitud. Según OpenAI, este cambio acelera agentes de IA complejos con un uso intensivo de herramientas entre un 20% y un 40%.
Senior AI Research Analyst
Es investigador y analista senior con base en España. Su trabajo se centra en el estudio de modelos tecnológicos a gran escala, su integración en infraestructuras empresariales y las implicaciones económicas y sociales de su adopción.