20 générateurs d’images par IA que vous pouvez utiliser dès maintenant

En 2018, la célèbre maison de vente aux enchères Christie’s est devenue le premier établissement du genre à vendre une œuvre d’art générée par une intelligence artificielle. Intitulée “Edmond de Belamy, from La Famille de Belamy”, l’œuvre d’art a été accrochée à New York parmi une gravure d’Andy Warhol et une œuvre en bronze de Roy Lichtenstein. Elle a été vendue pour la somme astronomique de 432 500 dollars, soit plus du double du prix des deux œuvres voisines réunies, et environ 40 fois plus que la valeur initialement estimée par Christie’s.

Les générateurs d’images par IA à connaître

  • Artbreeder
  • DALL-E 2
  • DeepAI
  • Jasper
  • Lensa
  • Midjourney
  • NightCafe
  • Point-E
  • Stable Diffusion
  • Visionnaire

Depuis lors, les images générées par l’IA sont devenues l’un des domaines d’innovation les plus en vogue dans le milieu de l’intelligence artificielle. Des gens ont utilisé cette technologie pour créer tout ce qu’ils voulaient, des histoires illustrées pour enfants aux œuvres d’art primées. Le développement récent de douzaines de générateurs d’images par IA a permis à n’importe qui de créer des images uniques et de haute qualité avec rien de plus qu’un texte rapide ou une photo téléchargée.

Grâce aux dernières avancées en matière de génération d’images par l’IA, il est possible de créer des images virtuelles à partir de rien. Il n’est plus nécessaire d’avoir des aptitudes artistiques naturelles ou des talents techniques pour créer des œuvres d’art incroyables.

Qu’est-ce qu’un générateur d’image par IA ?

Les générateurs d’image par IA sont des logiciels qui utilisent l’intelligence artificielle et ses nombreuses facettes (apprentissage automatique, réseaux neuronaux, etc.) pour créer automatiquement des images. Ils se présentent souvent sous deux formes : texte-image ou image-image.

Les générateurs texte-image sont capables de créer des images uniques à partir d’un texte saisi par l’utilisateur, ce que l’on appelle communément un prompt. Ces outils d’IA sont formés sur des ensembles de données massives qui associent du texte et des images. Quant aux générateurs d’images, ils permettent aux utilisateurs de télécharger une photographie ou une image existante, puis de la modifier ou de la transformer grâce à la puissance de l’intelligence artificielle.

Comment fonctionnent les générateurs d’image par IA ?

La pile technologique qui compose un générateur d’art par l’IA varie d’un outil à l’autre, et les algorithmes qui les alimentent sont assez massifs et complexes.

Toutefois, en ce qui concerne la conversion de texte en image, la plupart des outils commencent par être alimentés par des chercheurs qui leur fournissent des millions et des millions d’images. Ils annotent également ces ensembles de données, fournissant à la machine une référence textuelle. L’appareil est ensuite ajusté, calibré et entraîné jusqu’à ce qu’il puisse reconnaître ces photos de manière cohérente. Au bout d’un certain temps, il peut commencer à analyser les différences entre les différentes images et générer les siennes avec une certaine précision.

À partir de là, la plupart des générateurs de texte à partir d’images fonctionnent de la même manière du côté de l’utilisateur : Une personne saisit un texte dans l’outil (“lapin en imperméable peint dans le style de Frida Kahlo”, par exemple) et l’outil produit une création qui représente fidèlement l’image décrite. Cette nouvelle image a été générée par un algorithme d’intelligence artificielle et les résultats peuvent varier considérablement si la moindre modification est apportée à l’invite.

Les générateurs d’image à image sont un peu plus simples et utilisent souvent un processus appelé transfert de style neuronal – une technique d’optimisation qui prend une image de contenu (téléchargée par l’utilisateur) et une image de référence de style (œuvre d’art d’un peintre célèbre, par exemple) et les mélange de manière à ce que l’image résultante ressemble à la fois à l’image de contenu et à l’image de référence de style. Au final, un utilisateur peut transformer une photo de son chien en une peinture de style Renaissance, un selfie en une esquisse au crayon, etc.

En général, parce qu’il se passe tellement de choses sous le capot de l’IA générative que même certains experts ne comprennent pas, il y a beaucoup d’incertitude quant aux types d’images qu’un outil peut produire. En même temps, de nombreux générateurs d’art d’IA utilisent des technologies tierces en coulisses, ce qui signifie qu’il peut y avoir des douzaines d’entreprises d’art produit par l’IA qui utilisent exactement le même système d’IA en interne. En outre, la pile technologique qui alimente la génération d’art par l’IA est souvent accessible au grand public, ce qui permet d’innover encore davantage.

Bien qu’impressionnante, cette technologie n’a pas été sans susciter des réactions négatives (en particulier parmi les artistes) et a obligé la société à réexaminer ce que peut être l’art et à se demander si la créativité est intrinsèquement humaine.

Pourtant, l’intérêt pour l’art généré par l’IA n’a jamais été aussi grand, et ces outils repoussent les limites du possible.

20 générateurs d’art par IA à connaître

Artbreeder

A screenshot of Artbreeder's community gallery.
La plateforme d’Artbreeder permet aux utilisateurs de collaborer et de partager leurs œuvres avec d’autres utilisateurs.

Artbreeder est une sorte de croisement entre un éditeur d’art et un générateur de texte à partir d’images. Les utilisateurs peuvent dessiner des images et des formes rudimentaires, taper une description du type d’image qu’ils souhaitent créer, et Artbreeder peut lui donner vie grâce à son intelligence artificielle et à ses capacités d’apprentissage automatique. Les utilisateurs peuvent également modifier et améliorer des images existantes, générer plusieurs itérations d’une image donnée et même transformer des images fixes en figures animées. La plateforme héberge également une communauté assez active de créateurs, qui peuvent montrer leur art généré par l’IA et collaborer les uns avec les autres.

Big Sleep

An image of "Artificial Intelligence" generated by the AI art generator, Big Sleep.
Big Sleep est basé sur Python et son utilisation est gratuite sur GitHub.

Contrairement à de nombreux autres générateurs d’image IA, Big Sleep est basé sur Python, et s’adresse donc à des créateurs ayant une expérience du codage. Bien que les images ne soient pas aussi avancées que certaines des nouvelles technologies d’IA disponibles aujourd’hui, les créateurs peuvent utiliser des scripts Python sur Big Sleep pour générer des images réalistes générées par l’IA à partir de zéro. Big Sleep est un logiciel libre, dont l’utilisation est gratuite et qui est disponible sur GitHub.

Craiyon

An image of "Artificial Intelligence" generated by the AI art generator, Craiyon.
Craiyon peut générer des images à partir d’un simple texte et son utilisation est gratuite.

Anciennement appelé DALL-E mini, Craiyon est un modèle d’IA qui peut générer des images à partir de n’importe quel texte et dont l’utilisation est totalement gratuite. Le modèle, qui s’améliore constamment, est entraîné en examinant des millions d’images sur l’internet et les légendes qui leur sont associées. Au fil du temps, Craiyon apprend à générer des images à partir d’un simple texte. Certains de ces concepts sont appris de mémoire, tandis que d’autres sont tout à fait uniques et n’ont jamais existé auparavant, et sont rendus possibles par la combinaison de plusieurs concepts. Comme le modèle a été formé à partir de données non filtrées provenant d’Internet, il peut générer des images contenant des stéréotypes ou des préjugés nuisibles, mais l’étendue et la nature de ces préjugés continuent d’être étudiées et corrigées par l’équipe de développement de Craiyon.

DALL-E 2

An image of "A fox sitting in a field in the style of Monet" generated by the AI art generator, Big Sleep.
DALL-E 2 permet aux utilisateurs n’ayant aucune compétence artistique de créer des œuvres d’art.

Créé par la société de recherche à but non lucratif OpenAI, DALL-E 2 est devenu l’année dernière l’un des noms les plus connus dans le domaine de la génération d’œuvres d’art par l’IA. Sa capacité à créer des images précises et réalistes à partir d’un simple texte est rendue possible grâce à un processus appelé diffusion, qui commence par un motif de points aléatoires et le modifie progressivement en une image une fois qu’il en reconnaît des aspects spécifiques. Au final, les utilisateurs qui n’ont aucune aptitude artistique naturelle peuvent tout créer, de la peinture d’un renard dans le style de Claude Monet à l’image photoréaliste d’un ours polaire jouant de la guitare. Comme son prédécesseur DALL-E, DALL-E 2 a commencé comme un projet de recherche et est maintenant disponible pour tous avec des options gratuites et d’abonnement.

DeepAI

An image of "Artificial Intelligence" generated by the AI art generator, Deep AI.
DeepAI peut créer des images en quelques secondes à partir d’un texte et d’un style sélectionnés.

Développé en 2016, DeepAI est l’un des plus anciens générateurs d’image IA actuellement disponibles. Il est assez simple à utiliser : Il vous suffit de saisir une idée d’image et de sélectionner le style que vous souhaitez pour l’image dans la bibliothèque de la plateforme. La plateforme est alors en mesure de créer l’image en quelques secondes grâce à la puissance de l’intelligence artificielle. DeepAI peut également être utilisée pour coloriser des images existantes et détecter des objets spécifiques dans des images grâce à une offre appelée Zendo. Cela peut être particulièrement utile pour les véhicules autonomes et l’imagerie médicale.

Deep Dream Generator

Screenshots of art generated by the AI art generator, Deep Dream.
Deep Dream Generator utilise des réseaux neuronaux pour générer de nouvelles images à partir d’images existantes.

Après s’être entraîné avec des millions d’images à l’aide d’algorithmes et de techniques d’IA avancés, Deep Dream Generator utilise des réseaux neuronaux pour générer de nouvelles images à partir d’images existantes, ce qui le différencie des divers générateurs d’art d’IA de type texte-image disponibles sur le marché. Les utilisateurs téléchargent simplement une image existante, choisissent le style artistique qu’ils souhaitent pour l’image de sortie, puis une nouvelle image est produite. La plateforme propose également un service de conversion de texte en image. Si certaines de ses créations semblent photoréalistes, Deep Dream Generator est peut-être plus connu pour les images psychédéliques et surréalistes qu’il produit.

Dream by Wombo

A screenshot of Dream by Wombo's AI art generator.
Dream by Wombo permet aux utilisateurs de transformer leur art généré par l’IA en NFT.

Dream by Wombo permet aux utilisateurs de transformer des photos existantes en dessins animés ou en fausses peintures, ainsi que de transformer des mots et des phrases en œuvres d’art uniques grâce à un algorithme complexe. Toutes ces créations peuvent ensuite être transformées en NFT. Cet outil a été créé par Wombo, qui permet aux utilisateurs de créer des deepfakes avec synchronisation labiale d’eux-mêmes, d’amis et même de personnes célèbres.

Fotor

Fotor's AI art generator changing an image of a man into an oil painting.
Fotor est un générateur d’images IA qui peut transformer des photographies en n’importe quel style d’art, du croquis à la peinture à l’huile en passant par l’aquarelle.

Fotor est un générateur d’images par intelligence artificielle qui permet de transformer des photographies en n’importe quel style artistique, du croquis à la peinture à l’huile en passant par l’aquarelle. La plateforme s’est également fait une place dans la création d’œuvres d’art NFT, permettant aux utilisateurs de créer rapidement des œuvres d’art numériques générées par l’IA, de les exporter sous forme de NFT (jeton non fongible), puis de les vendre sur les places de marché NFT.

Jasper

Jasper permet aux utilisateurs de détailler autant qu’ils le souhaitent leurs créations grâce à des invites textuelles et à de multiples menus déroulants.

Jasper permet aux utilisateurs de détailler autant qu’ils le souhaitent leurs créations, en proposant non seulement une zone de texte pour les invites, mais aussi divers menus déroulants dictant le style, le support et même l’humeur. En plus de son générateur d’art IA, la société peut également créer des textes personnalisés, fournissant aux utilisateurs des blogs générés par l’IA, du contenu pour les médias sociaux et bien d’autres choses encore, avec seulement un court message. Jasper n’est qu’un des nombreux acteurs du jeu de la création automatisée de contenu, comme Writer, GPT-3 et ChatGPT.

Lensa

Magic Avatars generated by the AI art generator, Lensa.
Lensa permet à ses utilisateurs de créer des versions artistiques de selfies sur la base de plans visuels fournis par les utilisateurs.

Si vous avez parcouru vos fils Instagram ou Twitter au cours des derniers mois, il y a de fortes chances que vous soyez tombé sur quelques images de profil artistiques partagées par des personnes de votre réseau – avec l’aimable autorisation de Lensa. La récente fonction Magic Avatar du générateur d’art IA a pris d’assaut les médias sociaux, en utilisant un modèle IA avancé pour générer des versions artistiques de selfies sur la base de plans visuels fournis par les utilisateurs. La plateforme a été créée par Prisma Labs, dans le but d’amener la photographie mobile et la création vidéo “à un niveau supérieur” en utilisant des techniques de réseaux neuronaux, d’apprentissage profond et de vision par ordinateur, selon le site web de l’entreprise. Avec Lensa, les utilisateurs peuvent procéder à des modifications mineures telles que le floutage de l’arrière-plan et l’application de filtres, mais aussi créer des rendus entièrement uniques à partir d’une seule photo.

Midjourney

Midjourney's community gallery of AI generated art.
Les capacités de Midjourney en matière de génération d’œuvres d’art par l’IA sont si impressionnantes qu’elles ont été récompensées lors d’un concours d’art.

À première vue, Midjourney ressemble à beaucoup d’autres générateurs d’art par IA de cette liste : Il s’agit d’un outil de conversion de texte en image qui produit des créations à partir de zéro en quelques minutes. Mais l’art qu’il peut produire est si réaliste et impressionnant qu’il s’agit de la seule plateforme de ce type à avoir remporté un concours d’art, suscitant à la fois l’admiration et la controverse. Midjourney est désormais disponible en version bêta, mais son accès est réservé à quelques privilégiés. Pour l’utiliser, vous devez vous inscrire sur la liste d’attente officielle. Une fois accepté, vous recevrez une invitation à son serveur Discord, grâce auquel vous pourrez interagir avec l’outil.

NightCafe

Images of pineapples generated by the AI art generator, NightCafe
NightCafe utilise un système de crédit que les utilisateurs peuvent utiliser pour générer de nouvelles images.

NightCafe est l’un des générateurs d’art par IA les plus populaires sur le marché aujourd’hui, et on dit qu’il possède l’un des plus grands référentiels d’algorithmes et de fonctionnalités. Comme d’autres outils, NightCafe crée des œuvres d’art originales à partir de messages écrits par les utilisateurs. Sa particularité réside dans le fait qu’il fonctionne sur la base d’un système de crédits. Plus un utilisateur a de crédits, plus il peut générer d’images. Les crédits peuvent être achetés ou gagnés en participant à la communauté de NightCafe.

Photosonic

Images created by the AI art generator, Photosonic.
Le modèle utilisé par Photosonic est basé sur la diffusion latente, c’est-à-dire qu’il transforme progressivement une image de bruit aléatoire en une image cohérente correspondant à un texte donné.

Comme sur beaucoup d’autres plateformes, vous pouvez générer de l’art de deux manières sur Photosonic. La première consiste à saisir un texte décrivant le type d’image que vous souhaitez créer, la seconde à convertir une image existante en une image d’art AI. Le modèle utilisé par Photosonic est basé sur la diffusion latente, ce qui signifie qu’il transforme progressivement une image de bruit aléatoire en une image cohérente qui correspond à un texte donné. Les utilisateurs peuvent contrôler la qualité, la diversité et le style des images générées en ajustant la description et en relançant le modèle. Si les utilisateurs détiennent tous les droits sur les images qu’ils créent sur la plateforme, il en va de même pour l’entreprise et ses autres utilisateurs. Cela signifie que tous les utilisateurs de Photosonic peuvent librement reproduire, afficher, distribuer et créer des œuvres dérivées basées sur n’importe quelle image du site, sans aucune obligation de redevance ou d’attribution.

Point-E

An image of "artificial intelligence" created by the AI art generator, Point-E.
Point-E peut produire des nuages de points en 3D directement à partir de textes.

Point-E est la dernière version d’OpenAI, qui promet d’être comme DALL-E 2, mais avec une modélisation en 3D. La modélisation tridimensionnelle est essentielle dans de nombreux secteurs et applications, qu’il s’agisse des effets CGI dans les films et les jeux vidéo, des missions de cartographie des cratères lunaires de la NASA ou de la création du métavers. Mais la création d’images 3D photoréalistes reste un processus long et coûteux. C’est là que Point-E intervient. La plateforme peut produire des nuages de points 3D directement à partir d’invites textuelles en exploitant “un vaste corpus” d’images associées à du texte, tandis que le modèle est entraîné sur un ensemble de données d’images associées à des rendus 3D, a écrit l’équipe d’OpenAI dans un article publié le mois dernier. “Pour produire un objet 3D à partir d’un texte, nous échantillonnons d’abord une image à l’aide du modèle texte-image, puis nous échantillonnons un objet 3D en fonction de l’image échantillonnée. Ces deux étapes peuvent être réalisées en quelques secondes et ne nécessitent pas de procédures d’optimisation coûteuses.”

Runway ML

A screenshot of a Runway dashboard.
Runway utilise l’IA pour créer des œuvres d’art, des animations et éditer des vidéos

Runway utilise des modèles d’apprentissage automatique pour générer des images uniques à partir d’invites textuelles. Mais son objectif principal est d’utiliser l’intelligence artificielle pour créer des animations et éditer des vidéos. Par exemple, l’outil peut être utilisé pour supprimer et remplacer un arrière-plan dans n’importe quel clip sans avoir recours à la technologie de l’écran vert. Il permet également aux utilisateurs de créer leurs propres animations et modèles 3D et d’utiliser l’analyse du mouvement relatif pour améliorer les animations graphiques.

Spark

Art created using the AI art generator, Runway.
Spark dispose d’une série d’outils d’IA, dont un générateur de texte à partir d’images, un créateur d’imprimés et un rédacteur

Développé par la place de marché de ressources numériques Creative Fabrica, Spark propose une série d’outils d’IA, notamment un générateur de texte à partir d’images, un créateur d’imprimés et un rédacteur publicitaire, qui peuvent être utilisés pour créer automatiquement des textes pour des articles, des livres, des publicités et bien d’autres choses encore. À l’instar d’autres ressources numériques sur la plateforme, les utilisateurs peuvent publier leurs créations en vue d’une utilisation payante par d’autres membres, ce qui en ferait la première plateforme d’IA générative permettant également aux créateurs de gagner de l’argent.

Stablecog

A screenshot of Stablecog's AI art gallery.
Stablecog permet à ses utilisateurs de créer des œuvres d’art et de les exposer dans une galerie communautaire.

Stablecog est un générateur d’images IA open-source qui permet aux utilisateurs de créer des images réalistes à partir de zéro. Le site propose également une galerie assez active avec les créations des utilisateurs, d’un lapin astronaute à la Pixar à un chat aux yeux écarquillés peint dans le style de Vincent Van Gogh.

Stable Diffusion

A screenshot of the AI art generator, Stable Diffusion
La licence de Stable Diffusion permet l’utilisation commerciale et non commerciale de l’outil sans frais.

Stable Diffusion est un outil d’IA générateur d’images créé par Stability AI. Il offre des capacités de conversion de texte en image et d’image en image, et son utilisation est entièrement gratuite. De plus, sa licence permet l’utilisation commerciale et non commerciale de l’outil sans frais. Le modèle artistique d’IA sous-jacent est utilisé par certains des outils figurant également sur cette liste, notamment Deep Dream Generator et NightCafe.

StarryAI

An image of the " Enchanted Kingdom of Sinbad" created by the AI art generator, Starry AI.
StarryAI n’a pas besoin de l’intervention d’un utilisateur pour générer des images et peut servir de générateur NFT gratuit.

StarryAI est un générateur d’art qui ne nécessite aucune intervention de la part de l’utilisateur. Il traite les images à l’aide d’un algorithme d’apprentissage automatique. L’un des principaux arguments de vente de la plateforme est qu’elle agit comme un générateur NFT gratuit, donnant aux utilisateurs la pleine propriété des images qu’ils créent. Contrairement à de nombreux autres outils de cette liste, StarryAI n’est disponible que sous la forme d’une application mobile pour les utilisateurs d’iOS et d’Android.

Visionist

A screenshot of AI generated art made by Visionist.
Visionist permet à l’utilisateur d’appliquer des styles artistiques d’IA à n’importe quelle photo.

Avec Visionist, les utilisateurs peuvent appliquer des styles artistiques d’IA à n’importe quelle photo, y compris des filtres abstraits, des portraits découpés et bien plus encore. La plateforme a été créée par des enseignants et des étudiants diplômés de la Parsons School of Design de la New School. Elle sert non seulement de bibliothèque et d’outil pour les créatifs, mais aussi de lieu de recherche sur la relation entre la créativité et l’IA. Visionist expérimente également l’écriture manuscrite générée par l’IA, les sons générés par l’IA, la transformation des mots en motifs uniques, etc.