Qu'est-ce que l'IA multimodale ? Au-delà du texte, des images et de l'audio