Comment éviter les visages déformés en génération IA
Cadrage, résolution, négatifs utiles, inpainting et itérations sans tout casser.

Un visage déformé n’est pas une fatalité ni une preuve que « l’IA ne sait pas ». C’est un signal que le problème est mal posé : trop de contraintes contradictoires, pas assez de pixels sur la zone critique, ou un angle que le modèle tente de deviner au lieu de recevoir une instruction claire.
Quand tu travailles pour un client, un visage raté coûte plus cher qu’un décor raté. Le public pardonne parfois une chaise bizarre ; il ne pardonne presque jamais une bouche qui fond. Priorise donc la géométrie du visage dans ton ordre de contrôle qualité, même si tu dois simplifier le décor. C’est presque toujours un mauvais compromis entre résolution, angle, complexité du prompt, et surcharge de détail. Les modèles ont des zones sensibles : yeux, bouche, dents, oreilles, mains près du visage. Ton travail consiste à réduire la pression sur ces zones avant de cliquer cinquante fois au hasard.
Ce guide liste des gestes concrets : cadrage, lumière, résolution de travail, négatifs ciblés, inpainting, et moments où il vaut mieux changer d’angle que forcer.
Tu peux l’utiliser comme checklist avant chaque session : cinq cases à cocher (cadrage, lumière, résolution, négatifs, plan B angle). Si une case manque, tu acceptes volontairement un risque plus élevé sur le visage.
Le vocabulaire « qualité ultime » autour de l’image générée n’aide pas à diagnostiquer une oreille manquante. Ici, on nomme des symptômes et des leviers, pas des jugements de valeur sur ton talent.
Pourquoi le visage casse en premier
Le cerveau humain est spécialisé dans la lecture des visages. Une légère asymétrie naturelle passe. Une asymétrie incohérente entre les deux yeux, une bouche qui fond dans la joue, ou une dent qui fusionne avec la lèvre déclenche le rejet immédiat. Tu es un critique sévère sans formation, parce que ton espèce a passé des millénaires à lire des regards.
Les générateurs optimisent des statistiques globales. Quand tu pousses trop de détail, trop de style, ou un angle difficile, la distribution statistique se casse localement sur le visage. D’où l’intérêt de simplifier le problème.
Pour stabiliser l’identité sur une série, comment écrire un prompt pour un personnage réaliste et constant reste la référence complémentaire : moins de traits contradictoires, plus d’ancrage répétable.
Angles et cadrage : le levier gratuit
Face caméra avec une lumière douce latérale est souvent plus stable que profil complet ou trois quarts extrême. Si tu n’as pas besoin du profil, ne le demande pas. Si tu en as besoin pour le récit, prévois un chapeau, une mèche, ou une ombre qui simplifie la zone problématique. Ce n’est pas tricher : c’est du cadrage de plateau.
Le gros plan extrême révèle les erreurs de peau et de bouche. Recule d’un cran de cadrage : plan américain ou poitrine. Tu gagnes en stabilité et tu perds peu en émotion si la lumière et le regard tiennent.
Pour que le style global ne sabote pas les traits, comment contrôler le style visuel dans une génération IA aide à séparer look graphique et lecture du visage.
Résolution, guidance, et checkpoints
Travaille à une résolution où le visage a assez de pixels pour exister, mais pas tant que le modèle invente des micro structures. Si tu es trop bas, les yeux deviennent des taches. Si tu es trop haut trop tôt, la surdéfinition transforme la peau en grille.
Guidance trop haute fige des traits impossibles. Baisse par paliers. Checkpoints orientés « beauty » ou « fantasy » peuvent déformer les proportions réalistes. Teste une base plus neutre sur le même prompt court.
Le choix du moteur importe. Flux vs SDXL : quelle IA choisir pour des images réalistes encourage un test A B honnête sur ton angle et ton éclairage.
Lumière et ombres du visage
Une key latérale avec ombre sous le nez lisible structure le volume. Une lumière frontale dure aplatit puis fait fondre les transitions sous les yeux quand le modèle cherche du contraste. Pour du naturel, comment créer des lumières naturelles en image IA donne des repères de fenêtre et de fill.
Les catchlights doivent correspondre aux sources. Un reflet rectangulaire sur une scène « bougie seule » ment. Harmonise ou simplifie.
Les ombres sous les yeux trop vectorielles donnent un look maquillage 3D. Demande des transitions douces, une micro variation de couleur dans les cernes, pas une bande dure. Les joues ont des couches, pas des calques.
La symétrie parfaite du visage est rare chez les humains. Une légère asymétrie crédible peut aider à éviter le mannequin. Par contre, des yeux de tailles différentes ou une bouche décalée de façon incohérente cassent l’image : là, tu n’es plus dans l’asymétrie naturelle, tu es dans l’erreur.
Expression et performance
Neutre ou légère expression est plus stable que rire ou cri au premier essai. Si tu veux une émotion forte, obtiens d’abord une structure faciale stable en expression calme, puis pousse l’émotion par img2img ou inpainting avec une force modérée.
Le regard caméra versus regard hors champ change la pression sur les yeux. Le hors champ peut cacher une asymétrie, mais si tu montres trop de blanc des yeux sans raison, le résultat part en caricature.
Âge, proportions, et « morphing » involontaire
Les très jeunes et les très âgés ont des proportions que certains checkpoints rendent mal : joues trop lisses ou trop marquées, yeux trop grands. Si ton sujet est sensible, utilise des références textuelles mesurées : « adulte », « quarante ans environ », plutôt qu’une pile d’adjectifs.
Quand tu mélanges « enfant » et « détail extrême », tu augmentes le risque de proportions animées. Simplifie le décor et la lumière avant d’ajouter du détail sur le visage.
Mains, cheveux, accessoires
Les mains près du visage multiplient les erreurs. Éloigne les mains, mets les hors champ, ou floute légèrement l’avant plan. Les lunettes ajoutent reflets et géométrie fine : angle de caméra où le reflet ne montre pas un décor impossible.
Les cheveux sur le visage demandent une transition propre. Si le modèle mélange mèche et peau, change de coiffure dans le prompt ou recadre.
Workflow
Étape 1 : géométrie du plan
Plan, focale, hauteur de caméra, direction du regard. Retire les adjectifs « cinematic » si la géométrie disparaît avec eux.
Étape 2 : lumière en trois lignes
Key, fill, fond. Une phrase chacune.
Étape 3 : génération à résolution de labo
Itère vite. Choisis la meilleure structure de visage avant beauté.
Étape 4 : zoom yeux bouche
Rejette tôt les images où les yeux ne partagent pas la même géométrie. Vérifie aussi la cohérence des paupières : une paupière qui coupe l’iris de façon différente de l’autre côté est un défaut fréquent avant même que la bouche ne bouge.
Étape 5 : inpainting ciblé
Yeux ou bouche seulement si le reste tient. Masque doux, prompt court.
Étape 6 : upscale tardif
Quand les traits sont stables.
Étape 7 : sélection rapide avec critères
Sur un batch, élimine d’abord tout ce qui a une erreur de géométrie faciale, même si la lumière est belle. Ensuite seulement compare l’esthétique. Sinon tu retombes sur une image séduisante mais fausse que tu essaieras de sauver pendant une heure.
Étape 8 : plan B angle
Si trois itérations honnêtes échouent sur un profil, change l’angle ou le storytelling : montrer le personnage dans un miroir, derrière une vitre, en silhouette. Le récit peut porter l’absence de profil parfait.
50mm eye-level medium close-up, single soft window key camera left.
Adult face, relaxed expression, eyes open toward lens, natural asymmetry.
Natural skin texture, subtle pores, no beauty retouch.
Negative: deformed eyes, melted mouth, fused teeth, extra fingers near face, plastic skin, watermark, text.
35mm medium shot, subject turned 30 degrees, hat brim shadows upper eyes slightly (stylized but stable).
Soft fill from opposite side, low contrast shadows on cheeks.
Negative: profile collapse, duplicated ears, warped jaw, cartoon features.
Négatifs utiles
Cible ce que ton modèle produit souvent : yeux de tailles différentes, bouche trop basse, dents fusionnées. Évite une liste de trente négatifs qui se contredisent.
Quand tu ajoutes « perfect face » ou « symmetrical face » comme positif, tu peux paradoxalement forcer une sur régularisation qui ressemble à une poupée. Préfère des formulations physiques : deux yeux ouverts, bouche fermée, lèvres humides naturelles, paupières relaxed.
Sommeil, fatigue visuelle, et relecture
Après trente minutes sur des visages, tu acceptes des erreurs que tu verrais en dix secondes le matin. Fais une pause ou change de tâche. Le contrôle qualité visage est fatigant ; ce n’est pas de la procrastination que de dormir sur une sélection.

Références, contrôle, et limites des outils
Si ton pipeline permet une image de référence pour l’identité, garde la stable et bien cadrée. Si la référence est floue ou de profil alors que tu génères face, tu mélanges des signaux. Documente le poids de la référence : trop fort fige parfois des défauts de la source, trop faible ne tient pas l’identité.
Les outils de pose peuvent aider, mais une pose extrême sur un modèle statique peut forcer des torsions faciales impossibles. Préfère des poses sobres pour les premiers essais.
Cas difficiles : foule, miroir, écran
Foule. Plus il y a de visages, plus la probabilité d’erreur monte. Réduis le nombre de visages nets, éloigne la foule, ou floute les arrière plans.
Miroir. Le reflet doit correspondre au sujet. Si tu n’as pas besoin du miroir, retire le. Si tu en as besoin, simplifie l’angle pour que le reflet montre moins de géométrie.
Écrans et téléphones devant le visage : surfaces réfléchissantes et texte illisible. Souvent plus simple de les retirer du prompt.
Post léger
Tu peux corriger une légère asymétrie des sclères ou une micro ombre sous une paupière en retouche locale. Tu ne sauveras pas une mâchoire liquide par du sharp. Sépare les problèmes de géométrie des problèmes de grade couleur.

Table de diagnostic visage
| Défaut | Cause fréquente | Premier levier |
|---|---|---|
| Yeux différents | gros plan + CFG haut | recule, baisse guidance |
| Bouche fondue | key frontale dure | key latérale |
| Dents en fusion | sourire large demandé | bouche presque fermée |
| Oreille manquante | profil extrême | trois quarts modéré |
| Main sur joue | contact peau peau | éloigne la main |
Un visage crédible tient souvent par un cadrage plus sage et une lumière plus claire, pas par vingt adjectifs.
Si tu livres une série d’images pour une campagne, garde une référence visage interne : une capture du personnage validé. Chaque nouvelle image se compare à cette référence avant validation. Sinon tu obtiens « le même personnage » avec cinq mâchoires différentes à la fin de la semaine.
Éthique courte : ressemblance et stéréotypes
Évite les prompts qui ciblent des personnes réelles par nom pour obtenir une copie. Évite aussi les chaînes de stéréotypes « ethniques » réducteurs : décris la lumière sur la peau, la coiffure, les vêtements, le contexte, sans transformer l’identité en liste de clichés. Ce n’est pas seulement une question morale : les clichés produisent souvent des visages génériques et instables parce que le modèle mélange des motifs contradictoires.
Trench warfare
Changer de seed en boucle sans changer le prompt. Tu tires à la roulette.
Demander « hyper realistic » sans géométrie. Le modèle compense par du plastique.
Profil + sourire large + mains + lunettes au premier essai. Tu empiles les risques.
Sharp global sur une bouche déjà fragile. Tu cristallises l’erreur.
Croire qu’un upscaler « répare » une mâchoire liquide. L’upscale extrapole ; il ne reconstruit pas une anatomie cohérente.
La vallée de l’étrange décrit ce rejet quand une figure humaine est presque convaincante mais pas tout à fait. En génération, tu la traverses souvent quand les traits sont presque bons mais les micro incohérences s’accumulent. Réduis une couche de complexité à la fois pour revenir sur le rivage du « presque vrai mais stable ».
Quand tu montres une image à un non initié, observe où il regarde en premier. Si ce n’est pas le regard du personnage alors que l’histoire le demande, ton cadrage ou ton contraste guide mal l’attention, et les défauts faciaux deviennent secondaires mais réels.
FAQ
Foire aux questions
Réponses rapides aux questions les plus fréquentes sur cet article.
Je dois toujours du face caméra ?
Non, mais c’est plus stable pour commencer. Introduis les angles difficiles quand la base tient. Si ton histoire exige un profil, prévois du temps supplémentaire ou un plan de secours stylistique.
L’inpainting détruit la lumière : pourquoi ?
Force trop haute ou masque trop large. Réduis les deux. Copie la partie du prompt qui décrit la key dans le prompt d’inpainting pour ré ancrer la lumière.
Les fixeurs externes ?
Utiles en post ciblé. Ils ne remplacent pas un mauvais cadrage. Utilise les comme dernier kilomètre, pas comme première ligne.
Pourquoi les yeux « brillent » trop ?
Catchlights durs et saturation élevée sur le blanc. Adoucis localement. Vérifie aussi si le modèle ajoute un contour noir trop marqué autour de l’iris : c’est un signal fréquent de faux regard.
Les dents ?
Souvent : demander moins de sourire, ou bouche presque fermée, ou ombre sur les dents. Évite les rangées complètes visibles en très gros plan au début.
Résolution minimale pour un portrait ?
Assez pour que chaque œil ait une structure, pas seulement une tache. Teste sur ton outil. Si tu es trop bas, monte la résolution avant d’ajouter du détail dans le prompt.
Plusieurs visages ?
Réduis le nombre, augmente la distance entre sujets, ou traite chaque visage en inpainting séparé si nécessaire. Sinon, accepte que le second plan soit légèrement moins parfait que le premier.
La vidéo après ?
Fige le visage en image pilote stable, mouvement modeste, amplitude basse. Si le visage pulse, reviens à l’image fixe : la vidéo ne corrige pas une géométrie déjà fausse. Pour du dialogue, préfère des plans courts et des réactions plutôt qu’un seul long plan qui expose les micro dérives.
Approfondissement terrain : Comment éviter les visages déformés en génération IA
Ce chapitre prolonge l’angle « Cadrage, résolution, négatifs utiles, inpainting et itérations sans tout casser. » pour le sujet réel derrière comment-eviter-visages-deformes-generation-ia. L’objectif n’est pas d’empiler des adjectifs, mais d’installer une boucle QA courte que tu peux réutiliser sur chaque livrable : capture, note, compare, tranche, archive. La plupart des créateurs perdent du temps parce qu’ils mélangent trois variables en une session, puis blâment le modèle. Quand tu sépares lumière, composition, texture, intention, tu retrouves un diagnostic honnête et une progression mesurable.
Protocole « une variable » (30 minutes)
Minute 0 à 5 : écris la phrase « ce que le spectateur doit croire sans légende ». Minute 5 à 12 : liste trois preuves visuelles possibles (ombre portée, prop d’usage, reflet cohérent). Minute 12 à 22 : génère deux images qui ne diffèrent que par une de ces preuves. Minute 22 à 28 : teste en miniature mobile et en plein écran. Minute 28 à 30 : choisis A ou B et nomme le critère gagnant dans le fichier projet. Ce protocole évite la dérive où chaque regen change tout sauf le problème initial.
Scénarios A, B, C avec pivot
Scénario A. Rendu trop propre, trop vitrine. Pivot : ajoute une trace d’usage localisée et une lumière latérale plus marquée, sans toucher au sujet si la géométrie est bonne. Scénario B. Image chargée sans hiérarchie. Pivot : retire deux objets du prompt, recentre le contraste sur le sujet, ou resserre le cadrage. Scénario C. Image spectaculaire mais froide. Pivot : baisse légèrement la saturation globale, ajoute un grain fin homogène en post, puis regénère seulement si la géométrie ou la perspective ment encore.
Trench warfare : dix pièges fréquents
- Tout corriger en même temps. Tu ne sais plus ce qui a sauvé l’image.
- Comparer seulement en plein écran. Le mobile trahit souvent le faux luxe.
- Ignorer le rythme en amont vidéo. Même en amont, pense au découpage et à la respiration des plans.
- Copier-coller des prompts sans brief local. Les mots doivent coller à ton sujet réel.
- Sharpen global agressif. Les contours criards lisent « numérique ».
- Trop d’adjectifs contradictoires. Une intention dominante suffit au début.
- Pas de fichier texte d’archive. Tu perds seed, version, et raison du choix.
- Valider fatigué. La fatigue rend « beau » ce qui est seulement familier.
- Multiplier les modèles le même jour. Tu compares des chaînes différentes, pas des réglages.
- Livrer sans A/B. Le client ou toi futur ne saura pas ce qui était acceptable.
Tableau de décision rapide
| Si tu observes | Action prioritaire |
|---|---|
| incohérence lumière | simplifier les sources |
| sujet noyé | cadrage ou hiérarchie de contraste |
| texture plastique | grain fin ou moins de HDR |
| mains impossibles | hors champ ou action triviale |
| décor catalogue | micro usure et prop fonctionnel |
| ciel vide | volume nuageux ou brume motivée |
| reflets impossibles | réduire les sources contradictoires |
Atelier client ou commanditaire
Même pour toi-même, rédige un mini brief : public, canal, durée de lecture attendue, interdits (violence, marques, visages réels). Pour une équipe, ajoute une colonne « preuve de conformité » : capture des CGU du service, version du modèle, date d’export. Cette colonne te sauve quand un diffuseur demande d’où vient l’image.
FAQ élargie
Dois-je livrer deux versions ? Oui, A et B avec une phrase de différence nommée, sinon la discussion reste floue. Faut-il documenter les prompts ? Oui, même partiellement : c’est ton assurance qualité interne. Que faire si le modèle change ? Fixe un brief test et compare avant de poursuivre une série. La retouche manuelle triche-t-elle ? Non si tu assumes la chaîne et les limites contractuelles. Combien de temps par image sérieuse ? Souvent plus long en validation qu’en génération brute, prévois-le au devis. Faut-il une cible technique ? Oui : résolution finale, espace colorimétrique, marge sur hautes lumières si compression sociale. Et la propriété intellectuelle ? Vérifie les CGU et les droits sur les références incluses dans le prompt.
Poste de contrôle multi-écrans
Chaîne minimale : moniteur principal, laptop standard, smartphone. Si tu n’as que deux écrans, envoie un export test sur ton téléphone via un canal propre (pas un messager qui recompresse à l’infini). Note la différence perçue sur les peaux, les contours, et les micro-contrastes. Beaucoup d’images « IA » le deviennent surtout après une deuxième compression involontaire.
Liens internes utiles
Croise avec pourquoi ton prompt ne marche pas, et comment le corriger, les erreurs de prompt qui rendent une image IA artificielle, et comment contrôler le style visuel dans une génération IA. Si ton sujet touche la vidéo, relie aussi à comment structurer une vidéo IA comme un vrai film et à comment améliorer le réalisme des mouvements en vidéo IA.
Journal de fin de session (modèle)
Date :
Slug / fichier :
Hypothèse du jour :
Variable testée :
Résultat A vs B :
Décision :
Prochain test :
Synthèse opérationnelle
Pour comment-eviter-visages-deformes-generation-ia, retiens trois lignes dans ton carnet : intention en une phrase, loi lumière en une phrase, preuve matérielle en une phrase. Si l’une manque, tu n’es pas prêt à regénérer massivement : tu es prêt à diagnostiquer. La qualité long terme vient de cette discipline, pas du dernier modèle sorti mardi.
Vidéo de référence
Ce qu’il faut regarder:
- comment passer d’une demande vague à une instruction actionnable,
- comment clarifier les critères de réussite avant génération,
- comment éviter les itérations “au hasard” qui aggravent les défauts.
Dernier réflexe utile, fais toujours une vérification à froid avant validation finale.
Continuer la lecture
Comment créer un storyboard avec l'IA étape par étape
Pour créer un storyboard IA étape par étape sans rendu plastique ni galerie décorative : découpage script, bible visuelle, prompts stables, QA séquentielle et livrable production.
Comment optimiser son workflow IA pour gagner du temps
Méthode concrète pour optimiser workflow IA et gagner du temps : diagnostic des fuites, timeboxing, organisation des assets, QA et itérations sans dispersion.
Comment organiser ses assets IA comme un pro
Méthode complète pour organiser assets IA, dossiers, nommage, métadonnées, versions et livraison sans perdre le fil entre image, vidéo, voix et montage.


