Phi-4-mini y Phi-4-multimodal son los modelos más recientes de la familia de modelos Phi open. Estos dos modelos unen Phi-4 como los siguientes modelos de la serie.
Phi-4-mini incluye un vocabulario de 200 000 palabras que permite una mayor compatibilidad multilingüe, atención de consultas agrupadas, llamadas de función integradas, instrucciones mejoradas y inserción compartida (en comparación con Phi-3.5-mini).
Phi-4-multimodal es el primer modelo de la familia Phi que admite entradas de texto, audio y visión que permiten interacciones naturales y contextuales. Este modelo incluye un vocabulario de 200 000 palabras en más de 20 idiomas y se especializa en reconocimiento de voz, traducción, resumen, Q&A y comprensión de audio. También proporciona funcionalidades completas de análisis de imágenes, como OCR, interpretación de gráficos y tablas, y comparación de varias imágenes y varios fotogramas.