Comment créer des images avec l’IA ?
8 conseils pour intégrer cette méthode
dans votre communication
- Lexique de la création d'images avec l'IA
- Préalable : s'assurer des droits d'utilisation des images créées via l'IA
- Conseil n°1 : avoir conscience des limites de l'IA
- Conseil n°2 : restreindre le nombre d'éléments distincts à représenter
- Conseil n°3 : trouver le bon équilibre entre les éléments à représenter et le style à utiliser
- Conseil n°4 : améliorer ses prompts
- Conseil n°5 : faire évoluer ses images
- Conseil n°6 : exploiter sa culture artistique
- Conseil n°7 : être son propre curateur
- Conseil n°8 : adopter une approche intelligente vis-à-vis de l'intelligence artificielle
Comment créer des images avec l’IA ? Lorsque l’on évoque la création d’images via l’intelligence artificielle (ou IA), c’est souvent la capacité de l’IA à surprendre qui est mise en avant. En effet, le débutant s’extasie d’avoir généré une image qui représente une scène, en écrivant une description et en cliquant sur un bouton. Dans le même élan enthousiaste, le novice s’étonne de « l’imagination » de l’IA. Comme par magie, l’IA a créé un décor et une mise en situation du ou des sujets principaux (personne(s), personnages(s) et/ou objet(s)) au sein de ce décor. En somme, les premiers essais ont le charme de la surprise.
Toutefois, quand le charme de ces premiers essais s’est évaporé, plusieurs question se posent si l’on cherche à progresser. Comment maîtriser l’IA ? Comment obtenir une image qui correspond vraiment à celle que l’on souhaite ? Comment donner les bonnes instructions à l’IA, avec le bon paramétrage ?
Une entreprise peut envisager d’utiliser l’IA afin de créer des visuels de communication. Ces visuels devront être exploitables, c’est-à-dire cohérents avec l’identité de l’entreprise ou de la marque. Par conséquent, la maîtrise de ce nouvel outil est indispensable. C’est la condition avant de pleinement intégrer l’IA dans les méthodes de travail de l’entreprise.
Si la création d’images via l’IA est destinée à illustrer de manière professionnelle un média (journal, magazine, blog…), ou à enrichir les publications sur les réseaux sociaux d’une entreprise, d’une marque ou d’un média, maîtriser l’IA est tout aussi crucial.
Les conseils développés dans cet article découlent de ma pratique de la création via l’IA d’images destinées à la communication d’une marque ou d’une entreprise. Ils constituent une feuille de route pour les entreprises qui souhaitent intégrer cette nouvelle méthode de création à leur communication digitale ou à la communication print.
Les images qui serviront d’exemples au fil de l’article sont des images que j’ai créées avec la plateforme Nightcafé. Les paramètres qui seront cités sont donc ceux de la plateforme Nightcafé. Bien sûr, il existe d’autres plateformes de création d’images via l’IA, comme Midjourney. Pour celles et ceux qui souhaitent utiliser (ou qui utilisent déjà) Midjourney ou une autre plateforme, les conseils donnés ici sont néanmoins facilement transposables.
Lexique de la création d’images avec l’IA
Avant d’entrer dans le vif du sujet, voici quelques définitions et précisions concernant des termes clés que j’utiliserai par la suite :
Prompt
Les instructions données à l’intelligence artificielle pour générer une image.
Modèle
Le modèle est en quelque sorte la main qui dessine ou peint, ou l’iris qui capte l’image. Le modèle peut être polyvalent ou spécialisé dans un style. Au moment de la rédaction de cet article, les modèles les plus puissants disponibles sur Nightcafé sont SDXL 1.0 (modèle très polyvalent), Mysterious XL v4 (une variante SDXL tournée vers l’art fantasy et l’esthétique asiatique), Juggernaut XL v5 (une variante SDXL visant le réalisme et un style cinématographique) et DreamShaper XL alpha2 (une variante polyvalente.) D’autres modèles SDXL disponibles sont des modèles entraînés pour générer des images dans un style spécifique, comme Splatter Graffiti qui propose une combinaison entre l’illustration et les éclaboussures de peinture.
Poids de prompt
Il est possible de combiner plusieurs lignes de prompt pour une même création. Plus un poids positif est important, plus le prompt concerné aura un impact sur la création. On donne un poids négatif à un prompt lorsque l’on souhaite éviter certains éléments, comme l’apparition d’une signature, un défaut anatomique, un mauvais cadrage…
Temps de traitement
On peut allouer à la création d’image un temps court, moyen ou long (cela reste de l’ordre de quelques secondes). Plus l’IA dispose de temps pour créer l’image, plus celle-ci est susceptible d’être précise,
Format
Carré ou rectangulaire (avec une orientation horizontale ou verticale, en 3:4 ou en 9:6),
Poids global du prompt
À ne pas confondre avec le poids de prompt énoncé plus haut, le poids global de prompt définit la liberté laissée à l’IA par rapport aux instructions données dans le prompt (ou la combinaison de prompts dans sa globalité.) Plus ce poids est faible, plus l’IA est susceptible de s’écarter des instructions données,
Image de départ et Évolution
Il est possible de créer une image à partir d’une autre image. Cette image peut avoir été créée par l’IA ou bien avoir été téléchargée par vos soins. Une image créée par l’IA à partir d’une autre image est une évolution. J’expliquerai plus amplement l’importance du concept d’évolution dans le conseil numéro 5.
Noise weight
Lorsqu’une image est créée à partir d’une autre image, plus le noise weight est important, plus l’IA est autorisée à s’écarter de l’image de départ.
Préalable : s’assurer des droits d’utilisation des images créées via l’IA
Un critère important dans le choix de la plateforme d’intelligence artificielle concerne les droits d’utilisation. En effet, si vous destinez les images créées à votre communication, donc à un usage commercial, il est requis que la plateforme choisie concède à ses utilisateurs les droits d’utilisation commerciale des images.
Par exemple, Nightcafé stipule, dans sa page des FAQ : « Tant que vous possédez (ou avez la permission d’utiliser) toutes les images de départ que vous avez utilisées, nous vous attribuerons des droits d’auteur. Pour le transfert de style (c’est-à-dire la création de modèle, note de l’auteur), vous devez avoir l’autorisation de copyright pour le contenu et les images de style. Pour les créations texte-image, vous devez disposer des droits d’auteur pour les images de départ et d’arrivée. Si votre création n’utilise aucune autre image, vous pouvez l’utiliser à des fins commerciales. » [Extrait de la page des FAQ : « That means, as long as you own (or have permission to use) any input images you used, you will be assigned Copyright by us. For style transfer, you must have copyright permission for the content and style images. For text-to-image artworks, you must have copyright permissions for any start and target images. If your creation doesn’t use any other images, you’re welcome to use it for commercial purposes. »]
Conseil n°1 : avoir conscience des limites de l’IA
Le constat
Il est important de comprendre que l’IA, en dépit de sa puissance de calcul, n’est pas infaillible. Parfois, l’IA produit des résultats inattendus, voire indésirables et non exploitables.
Par exemple, une image comportant une ou plusieurs personnes semble d’abord conforme aux attentes, mais un examen plus attentif révèle que les mains ne sont pas dessinées correctement. Le problème des mains est fréquent : nombre de doigts, dessin des doigts, articulation de la main, placement par rapport au reste du corps… Les bras, jambes et pieds sont aussi des sources fréquentes de problème.
- Exemple d’image imparfaite générée par l’IA : la main droite comporte 4 doigts, le bras droit est mal dessiné, tandis que le pied droit est mal placé et mal dessiné.
Le conseil
Comme dans d’autres domaines, prenez en compte les limitations de la technologie. Les créations ratées sont une partie naturelle du processus de création.
Ayez des attentes réalistes par rapport aux capacités de l’IA. De cette façon, vous vous placerez dans une démarche constructive. Ce qu’il faut viser, c’est l’amélioration de votre méthodologie.
Conseil n°2 : restreindre le nombre d’éléments distincts à représenter
Le constat
Une erreur fréquente commise par le débutant en création d’images via l’IA est de vouloir représenter un nombre trop important d’éléments sur une même image. Pour le moment, il est difficile pour l’IA, même avec les algorithmes les plus performants, de concilier sur une même image un nombre important d’éléments distincts, surtout s’ils appartiennent à des univers sans rapport les uns avec les autres. En effet, l’IA cherche à établir une certaine cohérence entre les éléments représentés. Ceci peut l’amener à ignorer certains éléments, ou à les déformer.
Le conseil
Il est possible de représenter dans une même image des éléments qui paraissent inconciliables. Maîtrisez l’écriture du prompt, choisissez le bon algorithme et faites évoluer une image. Je détaille ces points dans la suite de l’article.
- Illustration d’une scène du roman Kafka par le rivage de Haruki Murakami, où l’un des personnages principaux découvre une pluie de poissons. Ici, le défi était d’inclure dans l’image le personnage du roman de Murakami levant les yeux vers le ciel, avec une expression de surprise marquée, une rue de ville japonaise, des passants eux aussi éberlués, et bien sûr les poissons tombant du ciel !
Écrivez des prompts concis et précis. Ces prompts aideront l’IA à comprendre les intentions de l’utilisateur et à se concentrer sur des éléments spécifiques.
Bon à savoir
Les instructions saisies à la fin d’un prompt excessivement long seront parfois sous-pondérées, voire ignorées par l’IA. Une raison de plus pour faire preuve de concision !
Conseil n°3 : trouver le bon équilibre entre les éléments à représenter et le style à utiliser
Le constat
Beaucoup d’images générées via l’IA, visibles dans les bibliothèques partagées de Nightcafé, de Midjourney ou d’autres plateformes, manquent cruellement de style. Ceci vient du fait que l’utilisateur a créé une image en laissant le modèle choisi (un modèle de type SDXL, DALL-E ou autre) appliquer son style par défaut.
Or, les images utilisées par une entreprise au sein de sa communication ne doivent pas ressembler à des milliers d’images présentes sur le web (voire des millions d’images, compte-tenu du rythme effréné de la production d’images via l’IA.)
Le conseil
L’IA a la capacité de puiser dans toutes les disciplines pratiquées dans le monde réel : illustration, peinture, photographie…
Dans chacune de ces disciplines, l’IA a effectué un apprentissage de tous les courants artistiques. Il serait dommage de s’en priver !
Par conséquent, soyez concis.e tout en donnant des instructions suffisantes. Conciliez un style original et les éléments à représenter, c’est-à-dire les sujets principaux (personne(s), personnages(s) et/ou objet(s)) et le décor qui les entourent.
- Il convient d’éviter une instruction vague comme : « un chat endormi sur un fauteuil. » Car l’IA génère un chat certes adorable, mais cette image ressemble fortement à un nombre considérable d’autres images créées via l’IA.
- Le résultat est bien plus original en utilisant le même modèle d’IA, mais un prompt où le chat est décrit avec précision, ainsi que le décor qui l’entoure, et le style (un dessin à l’encre, combinant le style de 3 illustrateurs)
Je reviendrai plus précisément sur le style dans le conseil numéro 6 de cet article.
Conseil n°4 : améliorer ses prompts
Le constat
J’ai pris l’habitude de me demander, à propos d’une image que je viens de créer via l’IA et qui correspond aux instructions que j’ai données à l’IA en termes d’éléments représentés et de style : est-ce que je pourrais améliorer mon prompt afin d’obtenir un meilleur résultat ?
Mon constat est simple : un nouveau prompt qui paraît satisfaisant garde toujours une belle marge de progression.
Le conseil
Affinez et améliorez vos prompts. Vous influencerez les résultats générés par l’IA de manière significative.
Pour améliorer un prompt ou mieux l’utiliser, vous pouvez suivre la méthodologie suivante :
– Tester le même prompt avec différents algorithmes : si un algorithme semble plus prometteur pour ce prompt (notamment en termes de style), concentrez vos efforts d’amélioration du prompt sur cet algorithme. Il est important de se familiariser avec un algorithme/modèle donné, afin de mieux comprendre comment il réagit à certaines instructions. Multipliez les tests avec celui-ci, puis passez à un autre algorithme/modèle, et comparez les résultats,
– Tester le même prompt et le même algorithme avec différentes combinaisons de paramètres (noise weight et autres paramètres, voir le lexique en début d’article) : si une combinaison vous semble plus prometteuse, concentrez vos efforts d’amélioration du prompt sur cette combinaison,
– Tester l’impact d’une modification de l’ordre des briques d’instruction qui composent le prompt,
– Tester l’impact de l’ajout d’une nouvelle brique d’instruction,
– Tester le retrait d’une brique secondaire, c’est-à-dire une brique qui amène une précision à une brique essentielle.
Comment créer des images avec l’IA ? Le principe général est l’itération et l’expérimentation. Plutôt que de vous contenter d’un prompt parce qu’il semble satisfaisant, testez quelles variations produisent les meilleurs résultats. En ajustant progressivement les instructions en fonction des résultats obtenus, il est possible d’affiner le processus pour améliorer l’image obtenue.
- Cette illustration fait partie d’une série que j’ai consacrée au célèbre Taj Mahal. Chaque image de cette série se distingue par un style différent. Ici, le style s’inspire de l’estampe japonaise. Le prompt à l’origine de cette image contient seulement 21 mots, répartis sur 9 briques d’instruction. La preuve qu’un prompt concis et précis est capable de générer des images originales.
Conseil n°5 : faire évoluer ses images
Le constat
Beaucoup d’images générées via l’IA, visibles dans les bibliothèques partagées (sur Nightcafé, Midjourney…) ou les réseaux sociaux, sont insuffisamment travaillées. Elles ne présentent aucune originalité.
Clairement, elles ne sont pas un atout en termes de communication et ne peuvent pas être utilisées par une marque ou une entreprise.
Le conseil
Faites évoluer vos images. C’est une stratégie puissante et créative dans le contexte de la création d’images via l’intelligence artificielle.
En quoi consiste l’évolution d’image ? L’évolution d’images consiste à générer une image à partir d’une image générée via l’IA.
Le but de l’évolution d’image ?
– Améliorer une image déjà créée, c’est-à-dire supprimer certains défauts ou affiner les détails. Exemple :
- Portrait d’un personnage du roman Chroniques de l’oiseau à ressort de Haruki Murakami. Cette image est l’évolution d’une autre image que j’avais aussi générée via l’IA. L’évolution intègre de manière plus dynamique les méduses, et rend plus expressif le visage.
– Obtenir une image sensiblement différente en modifiant le sujet représenté et le style. Exemple :
- Ce bourdon représenté dans un vitrail a été construit à partir d’une autre image que j’avais créée via l’IA, qui est… un dessin de labyrinthe ! J’ai utilisé ce labyrinthe comme trame pour donner au vitrail sa forme globale.
- Le labyrinthe à partir duquel j’ai créé l’image du bourdon. Cette image de départ a été créée avec l’algorithme SDXL 1.0.
Comment faire évoluer une image créée par l’IA ?
– Conserver le même prompt, le même algorithme, les mêmes paramètres. Cela peut paraître contre-intuitif, mais il est surprenant de constater à quel point l’IA peut affiner une image de cette manière,
– Demander à l’IA de faire évoluer l’image en modifiant le prompt et/ou l’algorithme, et/ou les paramètres. Cette méthode peut être utilisée pour affiner une image, ou bien en obtenir une autre sensiblement différente.
À noter qu’il est possible, et même recommandé, de faire évoluer une image une première fois, puis de faire évoluer l’évolution de cette image, et ainsi de suite.
En matière de communication, l’évolution d’image est particulièrement intéressante. En effet, elle permet de créer une série d’images à partir d’une image de départ. Les images appartenant à la série vont former un ensemble cohérent, tout en ayant leurs spécificités. Par exemple, l’illustration qui se trouve au début de cet article fait partie de la série d’images que j’ai créées avec l’IA pour illustrer plusieurs pages de ce site. Les prompts utilisés comportent les mêmes instructions en termes de style. Bien que les scènes représentées soient différentes, elles forment un ensemble cohérent en termes de style et de ton.
Conseil n°6 : exploiter sa culture artistique
Le constat
Beaucoup d’images générées via l’IA, visibles sur le web, se ressemblent. Soit l’image a été créée à partir d’un prompt sans instruction de style, donc son style est uniquement celui de l’algorithme. Soit les instructions de style utilisées ne comportent aucune combinaison originale. Par exemple, l’instruction comporte une référence à un seul illustrateur, ou un seul peintre, ou un seul photographe…
Les images utilisées dans le cadre de la communication d’une entreprise ou d’une marque ne peuvent en aucun cas ressembler à d’autres images présentes sur le web. Il est impératif qu’elles soient originales.
Le conseil
Exploitez votre connaissance de divers créateurs pour combiner leurs styles artistiques.
En combinant les styles de différents créateurs, le style de l’image n’est pas celui de A, de B ou de C, mais le style inédit de A+B+C.
Puisez ces références dans toutes les disciplines : peinture, illustration publicitaire, photographie, bande dessinée, mode, dessin animé, cinéma…
- Reprenons l’exemple de la série d’images que j’ai créées pour illustrer les pages principales de ce site. Les instructions de style comportent notamment la combinaison de 3 créateurs. Le style obtenu est différent du style de chacun de ces créateurs, puisqu’il est le résultat de la fusion de leurs styles respectifs. Les images obtenues sont donc des images originales.
En termes de combinaison de styles, la seule limite est votre imagination, votre intuition quant aux bonnes combinaisons et l’étendue de votre culture artistique. Cependant, il convient de vérifier que l’IA a bien effectué un apprentissage du style d’un créateur donné (en testant un prompt où sera précisé uniquement ce créateur.) En effet, même si l’IA a affiné jusqu’à maintenant l’apprentissage du style d’un nombre impressionnant de créateurs, il arrive qu’un créateur ne fasse pas encore partie des styles que l’IA a assimilés.
Voici une méthodologie pour tester les combinaisons de style :
– Combiner les styles de créateurs faisant partie d’un même courant, dans la même discipline (photographie, ou illustration, ou peinture, ou…), chacun apportant ses nuances,
– Combiner les styles de créateurs de la même discipline, mais de courants différents. Par exemple, combiner un peintre impressionniste et un maître flamand,
– Combiner les styles de créateurs de disciplines différentes, par exemple un dessinateur d’anime, un dessinateur d’affiches publicitaires et un photographe.
Conseil n°7 : être son propre curateur
Le constat
La création d’images via l’IA permet d’obtenir à tous les coups, rapidement, une image. Même si cette image ne correspond pas vraiment au résultat attendu, même si elle ressemble à s’y méprendre à une autre image créée par quelqu’un d’autre via l’IA ou un autre moyen, même si elle ne présente aucune originalité, une illusion peut se mettre en place.
Cette illusion consiste à considérer que l’on est à armes égales avec tous les autres créateurs d’images via l’IA, puisque c’est l’IA qui, du point de vue du débutant, « fait tout. » Le réflexe d’auto-curation peut être endormi par cette illusion, d’où la profusion d’images créées via l’IA qui sont publiées, notamment sur les réseaux sociaux.
Or, comme tout outil quand il n’est pas maîtrisé, l’IA génère des images sans originalité, de manière aléatoire. À l’opposé, la maîtrise de l’IA permet d’obtenir des résultats précis, conformes aux besoins et objectifs de communication d’une marque ou d’une entreprise.
Le conseil
Adoptez un regard critique sur vos créations. Repérez les défauts. Identifiez les axes d’amélioration. À cette fin, prenez de la distance par rapport à la qualité de vos créations. Soyez votre curateur !
Conseil n°8 : adopter une approche intelligente vis-à-vis de l’intelligence artificielle
Le constat
L’intelligence artificielle ne peut pas reproduire le processus créatif et l’expertise d’un graphiste, d’un illustrateur, d’un photographe humain. L’IA est un outil puissant, mais elle ne peut pas remplacer complètement l’approche artistique et l’émotion que les créateurs humains apportent à leurs œuvres.
Les créations artistiques humaines sont souvent le résultat d’une pensée créative complexe, d’une intention profonde et d’une expérience émotionnelle. La sensibilité, la compréhension ou l’intuition des émotions humaines jouent un rôle essentiel dans l’impact qu’ont ces créations. En revanche, l’IA génère des images en se basant sur des modèles de données, sans cette profondeur émotionnelle ou cette intention artistique.
D’autre part, les créateurs humains sont capables de comprendre le contexte spécifique d’un projet, les besoins du client, ainsi que les nuances culturelles et sociales qui peuvent influencer l’orientation de la création. L’IA ne peut pas saisir avec la même finesse ces subtilités contextuelles.
Le conseil
Au lieu de considérer l’IA comme un concurrent des créateurs humains, envisagez l’IA comme un outil à apprivoiser.
Comme tout outil, l’IA demande des efforts et une expertise de la part de l’utilisateur humain. Même avec les progrès fulgurants de l’IA, saisir une phrase descriptive et cliquer sur un bouton ne permet pas de produire des créations originales qui peuvent être utilisées dans le cadre de la communication d’une entreprise ou d’une marque.
Pour tirer le meilleur de la création d’images via l’IA, la mobilisation de l’intelligence humaine reste et restera l’élément déterminant.