Google lanza Lyria 3: música con IA y voces dentro de Gemini
Google lanza Lyria 3, un generador de música con IA, dentro de la app Gemini. El modelo crea pistas de 30 segundos con voces.
Google lanza Lyria 3, un generador de música con IA, dentro de la app Gemini. El modelo crea pistas de 30 segundos con voces.
ByteDance ha lanzado una nueva versión de su modelo de generación de video con IA, Seedance 2.0. El modelo admite ocho idiomas.
Claude Opus 4.6 es actualmente el mejor modelo de IA—al menos hasta que Artificial Analysis evalúe el Codex 5.3 de OpenAI, que se espera que lidere en tareas de programación. Por ahora, el nuevo modelo de Anthropic ocupa el primer puesto en el Artificial Analysis Intelligence Index, que agrega los resultados de diez benchmarks que abarcan programación, tareas basadas en agentes y razonamiento científico. Opus 4.6 lidera en tres categorías: tareas de trabajo agenticas, programación en terminal y problemas de investigación en física
Anthropic ha presentado un nuevo Fast Mode para Claude, que ofrece una latencia significativamente menor a un coste considerablemente más alto. En el caso de Claude Opus 4.6, Fast Mode tiene un precio de hasta seis veces la tarifa estándar.
Un nuevo producto de IA de Anthropic provocó una venta masiva en los mercados
Anthropic ha presentado Claude Opus 4.6, un nuevo modelo insignia. Por primera vez, incorpora una ventana de contexto de un millón de tokens y está diseñado para localizar información relevante en documentos muy extensos con mucha más fiabilidad que los modelos anteriores.
OpenAI ha lanzado su modelo de programación más reciente, GPT-5.3-Codex. Según la compañía, combina las capacidades de codificación de GPT-5.2-Codex con las fortalezas de razonamiento y conocimiento de GPT-5.2, al tiempo que es un 25 % más rápido que su predecesor.
Mistral AI busca undercut a la competencia en precio en el reconocimiento de voz con Voxtral Transcribe 2. La segunda generación de sus modelos de conversión de voz a texto parte desde 0,003 dólares por minuto y, según Mistral, ofrece una mayor precisión que modelos como GPT-4o mini Transcribe, Gemini 2.5 Flash y Deepgram Nova. La familia de modelos incluye dos variantes: Voxtral Mini Transcribe V2, diseñada para procesar archivos de audio de gran tamaño, y Voxtral Realtime, orientada a aplicaciones en tiempo real con una latencia inferior a 200 milisegundos. Voxtral Realtime, que tiene un coste el doble de alto, utiliza una arquitectura de streaming dedicada que transcribe el audio a medida que llega, y está pensada para casos de uso como asistentes de voz, subtítulos en directo y análisis de centros de llamadas