A több módban működés, a multimodalitás megváltoztatja a nagy mesterségesintelligencia-modelleket. A rendszerek jobban értik az utasításokat, szövegek és képek társítását, összességében pedig kreatívabbak.