ChatGPT et la Génération d’Images : Une Révolution en Cours
Publié le 22 octobre 2023
Dans le monde en constante évolution de l’intelligence artificielle, ChatGPT fait un pas en avant significatif avec l’intégration de la génération d’images grâce à un modèle amélioré, GPT-4o. OpenAI affirme que ce changement apporte des visuels d’une qualité supérieure, offrant des rendus « plus précis » et « plus détaillés », surpassant ainsi l’ancien modèle Dall-E.
Vers une Nouvelle Dimension Visuelle
Auparavant, la génération d’images dans ChatGPT reposait sur Dall-E, mais désormais, la fonction « Images in ChatGPT » prend le relais. Bien que Dall-E reste disponible pour les GPT personnalisés, les utilisateurs peuvent s’attendre à une qualité nettement améliorée avec le nouveau système. Les images sont créées directement dans le fil de la conversation, ce qui permet une interactivité sans précédent.
GPT-4o, le modèle sur lequel se base Images in ChatGPT, est décrit comme autorégressif. Bien qu’il nécessite un temps de traitement légèrement plus long, il promet un meilleur rendu textuel, éliminant les imperfections souvent rencontrées avec les modèles par diffusion comme Dall-E. Ce développement permet de gérer beaucoup plus efficacement les attributs des objets, avec la capacité de rendre jusqu’à 20 objets de manière précise.
Édition et Personnalisation des Images
Une autre avancée majeure concerne la possibilité d’éditer les images générées. Les utilisateurs pourront retoucher des éléments au premier ou à l’arrière-plan, une fonctionnalité connue sous le nom d’« inpainting ». OpenAI a conçu ce modèle en utilisant des données accessibles publiquement et en s’associant à des entreprises telles que Shutterstock pour enrichir ses capacités.
Bien que le manque de reconnaissance des droits d’auteur ait souvent été pointé du doigt, OpenAI défend sa stratégie en affirmant qu’elle respecte les droits des artistes. La plateforme offre des mécanismes d’« opt-out » pour que les créateurs puissent choisir d’exclure leurs œuvres des données d’entraînement.

L’Absent de Watermark
Les visuels produits par ChatGPT ne portent pas de filigrane, rendant leur origine moins visible. Cependant, OpenAI a annoncé que des métadonnées conformes au standard C2PA, qui vise à améliorer la traçabilité des images, seront intégrées dans un avenir proche.
Accessibilité et Limitations
La fonction de génération d’images est déjà accessible aux utilisateurs professionnels s’abonnant à la formule à 200 $ par mois. Par la suite, elle sera proposée à tous les abonnés à la formule Plus, ainsi qu’aux développeurs via l’API. Toutefois, les utilisateurs gratuits auront accès à un nombre limité d’images générées chaque jour, comme c’était le cas avec Dall-E.