Alors que l’intelligence artificielle se démocratise, les acteurs majeurs du secteur multiplient leurs travaux et conçoivent de nouveaux modèles de langage. Mais qu’est-ce que c’est et à quoi servent-ils ? On fait le point.
Pixtral Large Payant Mistral Platform Modèle multimodal texte-image Génération d’images à partir de descriptions détaillées
Euh, Pixtral c’est un modèle I2T, pas T2I. Pour la génération d’images, Mistral utilise FLUX-1.
1 « J'aime »
Pourquoi il n’y a pas l’excellent Deep Seek ou Qwen dans le comparatif ?
Le fait que Deep Seek a coûté 5.5M USD à être entrainé n’est que partiellement correct. Il faut rajouter 1.3 milliard d’USD pour l’infrastructure !