Microsoft libera Harrier como open source y lidera el ranking de modelos de embeddings multilingües

Detalles: By Javier Morales; Categoría: Modelos; 1 m; 08 Abril 2026; 67

El equipo de Bing de Microsoft - sí, en serio - ha publicado como código abierto el modelo de embeddings Harrier. Harrier es compatible con más de 100 idiomas, ofrece una ventana de contexto de 32.000 tokens y fue entrenado con más de dos mil millones de ejemplos, así como con datos sintéticos generados por GPT-5. Según el equipo, Harrier ocupa el puesto número 1 en el benchmark multilingüe MTEB-v2 y, de acuerdo con Microsoft, supera a modelos propietarios de OpenAI y Amazon.

Una interfaz futurista de búsqueda con IA, flujos de texto en varios idiomas, visualizaciones vectoriales y paneles de datos que representan tecnología de embeddings y recuperación de información.

Posición (Borda)	Modelo	Zero-shot	Parámetros activos (B)	Parámetros totales (B)	Dimensión del embedding	Máx. tokens
1	harrier-oss-v1-27b	78%	25.6	27.0	5376	131072
2	KaLM-Embedding-Gemma3-12B-2511	73%	10.8	11.8	3840	32768
3	llama-embed-nemotron-8b	99%	7.0	7.5	4096	32768
4	Qwen3-Embedding-8B	99%	6.9	7.6	4096	32768
5	gemini-embedding-001	99%	3072	2048
6	Qwen3-Embedding-4B	99%	3.6	4.0	2560	32768
7	Octen-Embedding-8B	99%	6.9	7.6	4096	32768
8	F2LLM-v2-14B	88%	13.2	14.0	5120	40960
9	F2LLM-v2-8B	88%	6.9	7.6	4096	40960
10	harrier-oss-v1-0.6b	78%	0.440	0.596	1024

Además del gran modelo de 27 mil millones de parámetros, existen dos variantes más pequeñas (0.6B y 270M) para hardware más modesto. Todos los modelos están disponibles en Hugging Face bajo la licencia MIT. El equipo planea integrar esta tecnología en Bing y en nuevos servicios de grounding para agentes de IA en el futuro.

Los modelos de embeddings se encargan de buscar, recuperar y organizar información para que los sistemas de IA puedan ofrecer respuestas precisas. Según Microsoft, están ganando cada vez más importancia en la era de los agentes de IA, ya que estos deben buscar información de forma independiente, actualizar el contexto a través de múltiples pasos y conservar memoria.

About The Hosts

Javier Morales

Senior AI Research Analyst

Es investigador y analista senior con base en España. Su trabajo se centra en el estudio de modelos tecnológicos a gran escala, su integración en infraestructuras empresariales y las implicaciones económicas y sociales de su adopción.