Avec l’évolution rapide des intelligences artificielles génératives, OpenAI continue de redéfinir les frontières du possible. Son dernier ajout à l’écosystème ChatGPT est un générateur d’images inattendu et impressionnant, désormais intégré à leur modèle GPT-4o. Ce développement marque une avancée notable, propulsant ChatGPT au même niveau que d’autres acteurs dominants comme Midjourney dans le domaine de la production d’images basées sur l’IA.
Une innovation en image
OpenAI a révélé une série d’exemples, illustrant la capacité du générateur d’images à produire des rendus graphiques réalistes et fidèles aux commandes textuelles. Imaginez-vous recréer une scène emblématique comme l’expérience du prisme de Newton et la voir se déployer en plein cœur de Manhattan. L’une des grandes forces de ChatGPT est sa précision à interpréter et à exécuter les instructions données par l’usager, une compétence alimentée par sa solide expérience en traitement de texte.
Ce qui distingue le générateur de ChatGPT des autres, c’est sa capacité à rendre non seulement des éléments visuels mais également textuels de manière précise sur des supports comme des signalisations ou des graphiques complexes. Cette prouesse s’avère inestimable pour générer des infographies ou des bandes dessinées.
Les atouts remarquables du générateur
Tout en produisant des rendus visuellement frappants, le générateur excelle aussi dans le photoréalisme, offrant une large palette d’applications possibles pour divers secteurs, de l’éducation au divertissement.
Des considérations à long terme et des limites
Bien que le potentiel du générateur soit vaste, OpenAI reconnaît certains défis persistants, notamment la manipulation d’images particulièrement longues, comme les affiches, où une anomalie quant au rendu des bords a été observée. OpenAI s’engage à corriger ces imperfections courant du temps.
Côté éthique et sécurité, OpenAI a intégré des balises C2PA qui certifieront toute image issue de GPT-4o, garantissant la transparence et empêchant la création d’images potentiellement nuisibles ou interdites, telles que des contenus offensants ou des deepfakes.
Accessibilité et disponibilité
La version actuelle de ce générateur est accessible dès maintenant pour les utilisateurs des offres Plus, Pro, Team et Free de ChatGPT, avec une extension anticipée aux niveaux Enterprise et Edu. Toutefois, pour ceux qui préfèrent l’expérience d’images antérieure avec DALL-E, cette option reste valable via une connexion dédiée dans ChatGPT.
Avec sa capacité de révolutionner la façon dont les images numériques sont générées et interprétées, le nouveau modèle d’OpenAI promet de transformer les attentes tout en stimulant la créativité utilisateur dans une multitude de disciplines. Un indicatif fort que nous ne sommes qu’au début d’une ère où l’intelligence artificielle remodelera encore plus notre interaction avec le monde visuel.