Commentaires : GPT-4V (Vision) : comment fonctionne la reconnaissance d'image de ChatGPT?

Après Code Interpreter, DALL-E 3, Bing et les plugins, ChatGPT se dote d’un nouveau modèle. Ce nouveau modèle, c’est ChatGPT 4 Vision, un modèle de reconnaissance d’images basé sur la version 4 de GPT. Ce modèle permet l’ajout d’images dans les conversations avec ChatGPT, pour qu’il puisse les analyser et fournir des informations sur celles-ci. Les cas d’usage sont très vastes, au point que les possibilités soient quasi illimitées.

En un mot, il y a une marge d’erreur assez conséquente.
Mais bon, je suis pour les IA. Alors, vive GPT !! :kissing_heart:

L’image est redimensionnee et aussi passée en niveau de gris. Ensuite est passé à gpt. Car donner une image de 20mo en couleur, ça va tuer gpt

à quand des reconnaissances et générateurs de vidéos ?