El nuevo modelo de lenguaje pequeño Phi-4 de Microsoft despunta en el razonamiento complejo

Archivo - Logotipo de Microsoft
Archivo - Logotipo de Microsoft - Peter Kneffel/dpa - Archivo
Actualizado: viernes, 13 diciembre 2024 16:45

   MADRID, 13 Dic. (Portaltic/EP) -

   Microsoft ha presentado el modelo de lenguaje pequeño Phi-4, de 14.000 millones de párametros, que ofrece resultados de alta calidad en tareas que requieren un razonamiento complejo, como las matemáticas.

    Phi-4 es la última incorporación a la oferta de modelos de lenguaje pequeños de Microsoft. Con ella, Microsoft ofrece un modelo de alto rendimiento en tareas que requieren un razonamiento completo, como ocurre con las matemáticas.

    En este área, y según las pruebas realizas por la compañía, Phi-4 demuestra tener un rendimiento comprable al de modelos más grandes (como Llama 3.3 70B instruct, Claude 3.5 Sonnet y Gemini 1.5 Pro), pese a contar con 14.000 millones de parámetros (14B).

   Esto se debe a los avances hechos en todos los procesos, "incluido el uso de conjuntos de datos sintéticos de alta calidad, la curación de datos orgánicos de alta calidad y las innovaciones posteriores al entrenamiento", como explica en el blog de la comunidad técnica.

    Phi-4 está actualmente disponible en Azure AI Foundry bajo un Acuerdo de licencia de investigación, y se facilitará en Hugging Face la próxima semana.

Leer más acerca de: