Phi-4-mini e Phi-4-multimodal sono i modelli più recenti della famiglia di modelli aperti Phi. Questi due modelli si uniscono a Phi-4 come modelli successivi della serie.
Phi-4-mini include un vocabolario di 200.000 parole che consente un maggiore supporto multilingue, attenzione alle query raggruppate, chiamate di funzioni predefinite, istruzioni migliorate e incorporamento condiviso (rispetto a Phi-3.5-mini).
Phi-4-multimodal è il primo modello della famiglia Phi che supporta input di testo, audio e visione artificiale che consentono interazioni naturali e compatibili con il contesto. Questo modello include un vocabolario di 200.000 parole in più di 20 lingue ed è specializzato in riconoscimento vocale, traduzione, riepilogo, domande&risposte e riconoscimento audio. Offre anche funzionalità complete di analisi delle immagini, tra cui OCR, interpretazione di grafici e tabelle e confronto tra più immagini/frame.