Los modelos más antiguos de la serie 2.5 mostraron una mejora significativamente menor, lo que Google atribuye a capacidades de razonamiento más débiles. Sin embargo, un estudio de Vercel sugiere que las instrucciones directas mediante AGENTS.md podrían ser aún más eficaces. Por ello, Google también está explorando enfoques alternativos, incluidos los servicios MCP.

Tasa de éxito de los modelos Gemini con y sin Agent Skill en 117 tareas de programación: los modelos más nuevos de la serie 3.x se beneficiaron más gracias a mejores capacidades de razonamiento. | Imagen: Google
Tasa de éxito de los modelos Gemini con y sin Agent Skill en 117 tareas de programación: los modelos más nuevos de la serie 3.x se beneficiaron más gracias a mejores capacidades de razonamiento. | Imagen: Google

Conclusión:

La nueva Agent Skill para la API de Gemini refleja una transición hacia sistemas de IA dinámicos capaces de acceder a conocimiento actualizado en tiempo real. Este enfoque mejora significativamente el rendimiento de los agentes de programación y reduce la dependencia del entrenamiento estático.