Comment créer un univers visuel cohérent avec l’IA
Bible lumière, palette, architecture, et règles de décision pour dix images ou plus.

Un univers visuel n’est pas une esthétique Instagram collée sur dix images différentes, ni une collection de « meilleures sorties » triées au jugé sans grille commune, ni une démo de capacité technique sans fil narratif. C’est un système : mêmes lois de lumière, même gamme de matériaux, même échelle d’architecture, même grain, même manière de traiter la peau et les reflets. Avec l’IA, la dérive est la norme, parce que chaque image est une nouvelle optimisation. Ce texte te donne une bible légère, des scénarios de dérapage, un workflow pour séries longues, une table de décision, une section trench warfare, des liens encyclopédiques, quatre liens internes, et une FAQ.
Scénario A. Une équipe produit douze keyframes pour un pitch. Chaque image est belle seule. Ensemble, elles racontent six mondes : néons 80, sci fi clinique, nature douce, thriller bleu nuit, comédie lumineuse, documentaire granuleux. Le client dit « il manque une identité ». Il manquait une feuille de règles partagée avant la génération.
Scénario B. Un auteur indie verrouille la palette dans la suite couleur mais pas dans le prompt. Les forms changent, les matériaux changent, la lumière saute. Le LUT ne peut pas recoller des géométries lumineuses différentes.
Scénario C. Un studio documente mal les prompts gagnants. Au pick-up deux semaines plus tard, personne ne reproduit le même « monde ». La bible existe dans des têtes, pas dans des fichiers.
Pourquoi l’IA dérive même quand tu es « constant »
Les modèles optimisent chaque image comme un problème local. Ils n’ont pas de mémoire de ton projet sauf ce que tu réinjectes, références, prompts, ControlNet du moment, img2img. Deux images avec le même prompt textuel peuvent diverger si le bruit d’échantillonnage, le recadrage, ou un slider a bougé. La cohérence d’univers est un processus, pas une propriété magique d’un bouton.
La dérive se voit d’abord aux endroits où le cerveau humain est exigeant : mains, lunettes, texte, perspective de rue, répétition d’un objet récurrent. Ensuite elle apparaît aux endroits subtils, largeur de trottoir, hauteur des portes, style de poignée, type de grille de fenêtre. Tu n’es pas obligé de tout contrôler, mais tu dois choisir quels détails signent ton monde et les répéter.
Charge cognitive du décor. Plus tu demandes de géométrie fine dans un seul prompt, plus le modèle sacrifie des morceaux. Pour une série, simplifie le décor quand tu veux tenir l’identité du personnage, et inversement. C’est la même logique que sur un plateau où l’on déplace un mur pour sauver la lumière.
Cohérence des ombres sur plusieurs plans. Note pour chaque lieu la direction dominante des ombres au sol et sur les visages. Quand tu génères le plan suivant, réinjecte cette direction. Sinon tu montes un montage où le soleil semble tourner autour de la scène sans que le temps passe.
Le style moto « comme un film de X » sans décomposition lumineuse produit des mélanges. Préfère une bible qui parle de matériaux et de lumière. Si tu dois référencer une œuvre, fais-le en privé pour toi, puis traduis en paramètres physiques pour le prompt.
Les cinq piliers d’une bible courte
Lumière. Une phrase sur la key dominante du projet, fenêtre nord douce partout, ou néon avec fond sombre, ou soleil bas et poussière. Tu peux avoir des exceptions de scène, mais elles doivent être nommées comme exceptions.
Palette. Trois couleurs dominantes et une couleur d’accent. Pas vingt. Les neutres comptent, gris chaud, beige sale, bleu nuit.
Matériaux récurrents. Béton brut, bois huilé, métal brossé, tissu matte. Quand un nouveau matériau apparaît, tu décides s’il devient récurrent ou s’il casse l’univers.
Grain et netteté. Même famille de grain sur toute la série, ou variation documentée, grain fin jour, grain plus dense nuit.
Échelle et architecture. Hauteur des plafonds, largeur des rues, style de fenêtre. L’IA change volontiers d’échelle si tu ne la calles pas.
Typographie et graphisme dans l’image. Si ton monde inclut des enseignes, des écrans, des affiches, décide tôt si tu acceptes du texte illisible ou si tu places des surfaces sans lettres. Le texte est un point de rupture. Beaucoup de bibles professionnelles disent simplement « pas de logos lisibles, pas de slogans ».
Véhicules et époque. Une voiture ou un vélo ancre le temps. Si ton histoire est contemporaine soft, évite les modèles trop iconiques qui crient une décennie précise, sauf intention.
Un univers, c’est ce que tu refuses autant que ce que tu demandes.
Exemple de bible minimaliste, fiction urbaine humide
Lumière. Extérieur, ciel couvert, sources ponctuelles chaudes issues des devantures, pas de soleil dur. Intérieur, néons froids en arrière plan, key douce sur le visage depuis une fenêtre sale.
Palette. Gris bleuté, ambre sur les practicals, rouge brique secondaire, accent vert néon sur un seul type de lieu.
Matériaux. Béton mouillé, métal oxydé, verre avec traînées, textiles mats.
Grain. Fin, visible surtout dans les ombres ouvertes.
Architecture. Immeubles 70, fenêtres rectangulaires répétitives, tuyaux apparents.
Ce bloc tient en moins de quinze lignes. Chaque nouveau prompt de la série commence par un copier coller de ce bloc, puis ajoute plan, action, personnage.
Scénarios de série : même personnage, même ville, même heure
Pour une série narrative, ajoute une feuille de continuité par session : heure fictive, météo, direction du soleil ou des néons, état des vêtements du héros. Quand tu génères l’image 7, tu réinjectes la feuille avant le détail du plan.
Variations légitimes. Intérieur versus extérieur, nuit versus jour, doivent rester dans les règles de ta bible. Si ton monde est « jour gris urbain », la nuit doit être cohérente avec les mêmes enseignes, les mêmes matériaux de rue, pas une métropole futuriste soudaine.
Exceptions narratives. Si une scène doit casser l’univers, écris l’exception sur la feuille de session, « scène de rêve, grain plus fort, couleurs désaturées, géométrie instable ». Sinon la review croit à une erreur.
Cohérence multi-outils. Image dans un moteur, vidéo dans un autre, la bible doit voyager. Exporte un still de référence et une ligne sur la lumière pour l’outil suivant. Ne suppose pas que « le même style » se transmet par magie entre APIs.
Workflow pour dix images ou plus
Étape 1 : écrire la bible sur une page
Cinq piliers, dix lignes maximum. Lis-la à voix haute. Si elle tient, elle tient pour l’équipe.
Étape 2 : image pilote
Une image qui combine lieu typique, personnage typique, lumière typique. Valide-la avec du recul. C’est ton nord. Si l’image pilote est « presque », ne lance pas la série tout de suite, sinon tu reproduiras le défaut vingt fois. Corrige d’abord la phrase lumineuse ou le cadrage, puis fige.
Test de stress rapide. Génère deux variantes de l’image pilote avec la même bible et un seul paramètre léger modifié. Si le monde saute déjà, ta bible manque de contraintes ou ton prompt mélange trop d’intentions.
Étape 3 : déclinaisons par couches
Même prompt de base, tu ne changes qu’un paramètre, cadrage, action, heure justifiée. Sinon tu perds le fil.
Étape 4 : tableau de suivi
Fichier avec colonnes : nom, prompt final, seed, outil, date, exceptions autorisées.
Étape 5 : revue « paire d’yeux frais »
Quelqu’un qui n’a pas généré regarde les vignettes côte à côte. Les dérives sautent plus vite.
Étape 6 : verrouillage couleur global
LUT ou courbe de référence, appliquée après validation des géométries lumineuses.
Étape 7 : exports nommés
projet_scene_plan_v###.png vaut mieux que final_final2.
Étape 8 : archivage prompts
Un .txt par livrable ou un journal unique daté.
Étape 9 : revue « collage mural »
Imprime ou affiche en petit toutes les vignettes. Le cerveau voit les sauts de blanc, de contraste, de température, plus vite qu’écran par écran. Même un mockup Figma avec des grilles aide.
Étape 10 : gel des versions
Quand une série est validée, copie le dossier en lecture seule ou tague la version git. Les « petites retouches » non tracées sont la source n°1 des ruptures au pick-up.

Table de décision
| Signal de dérive | Probable cause | Action |
|---|---|---|
| Saut de grain | prompts différents sans ligne grain | fixe une phrase grain dans la bible |
| Saut d’échelle | absence de repère architectural | ajoute hauteur, type de fenêtre |
| Peau qui change | trop de détails visage variables | fiche personnage courte stable |
| Néons différents | trop de couleurs listées | une accentuation, le reste neutre |
| HDR cheap | contraste non hiérarchisé | réécris key et fill |
Revue hebdomadaire sans mythologie
Une équipe qui génère vite se fatigue visuellement. Mets en place un créneau court où quelqu’un compare six vignettes avec une checklist : même température globale, même famille de grain, même logique de reflets, même densité d’objets dans la rue, même hauteur de caméra moyenne pour les plans comparables. Coche ou non. Les cases non cochées deviennent des tickets, pas des discussions floues.
Les captures d’écran des réglages valent de l’or quand un modèle change de version. Si ton outil met à jour un checkpoint, refais une image pilote et note la version dans la bible. Sinon tu poursuis une série sur une fondation qui n’existe plus.
Les livrables clients doivent inclure une phrase sur ce qui est canon. « Pack A, bible version 3, gelée le jj/mm. » Ça évite la demande « remettez la version d’avant hier » quand personne ne sait quel prompt a produit avant hier.
Quand élargir l’univers sans le casser
Ajouter un nouveau lieu se fait par extension, pas par remplacement. Écris une sous-bible d’une demi-page : quels matériaux restent, lesquels sont nouveaux, comment la lumière change, pourquoi narrativement. Si le nouveau lieu partage la même ville, garde les mêmes enseignes en arrière plan flou, les mêmes types de poteaux, les mêmes largeurs de trottoir.
Si tu ajoutes une époque flashback, change au moins deux piliers en même temps, grain plus présent, palette différente, mais garde une signature, par exemple le même vert accent ou le même type de bruit de foule en suggestion visuelle. Le spectateur doit sentir la parenté et la différence.
Une extension d’univers, c’est un patch documenté. Un remplacement silencieux, c’est une fuite en avant.
Cohérence des silhouettes, costumes et accessoires récurrents
Dans une série longue, le public retient trois ancres sur un personnage, la coupe de cheveux, la veste, le sac. Fixe ces ancres dans la bible personnage, pas seulement dans le prompt du jour. Quand tu changes de plan, réinjecte les ancres avant l’action. Si la veste change de couleur sans scène de garde-robe, ce n’est plus le même personnage pour le cerveau humain.
Les extras et la foule demandent une règle simple : silhouettes génériques, pas de visages nets en foule dense si ton outil y laisse des artefacts. Écris « foule floue », « silhouettes », « pas de visages lisibles au loin », selon ce que ton modèle comprend.
Les objets récurrents, téléphone, arme de fiction stylisée, carnet, doivent avoir une description stable courte. « Carnet cuir marron usé, coins arrondis » suffit souvent mieux qu’une page de détails.
Trench warfare
Croire que le style transfer rattrape tout. Il lisse parfois la texture et tue la cohérence fine. Corrige la lumière en amont.
Ajouter une nouvelle référence Pinterest à chaque image. Tu importes des mondes parallèles. Limite les références actives à trois images maximum pour toute la série, et convertis-les en règles écrites.
Laisser chaque artiste freelancer réinventer la bible. Même freelance, même fichier bible obligatoire, même review.
Oublier le son et le rythme dans un projet qui devient vidéo. L’univers visuel doit tenir quand les plans s’enchaînent. Si tu prévois du montage, garde des espaces négatifs cohérents pour titres et sous-titres.
Mélanger deux checkpoints dans une même série sans transition narrative. Si tu changes de modèle, refais une image pilote.
Négliger les props récurrents. La tasse, le vélo, le badge doivent être stables ou assumés comme remplacés.
Sous-estimer les logos et marques. Pour un univers propre, évite les marques réelles non autorisées, invente des packsagings génériques.
Poursuivre une série après une pause sans relire la bible. Tu réinjectes des intuitions neuves qui contredisent le gel. Relis la page avant chaque session de génération.
Ignorer la direction du regard et la composition récurrente. Si ton monde utilise souvent la tension du hors champ, réserve l’espace dans le cadre pour ne pas le recouvrir avec du texte marketing en post.
Pour le vocabulaire de la direction artistique, voir direction artistique. Pour la cohérence des couleurs dans l’image, couleur. Pour l’architecture comme ancrage, architecture. Pour la notion d’identité visuelle appliquée aux marques et déclinaisons, identité visuelle.
Éthique et droits. Documente ce qui est généré, retouché, sous licence, et ce qui ne peut pas représenter des personnes réelles identifiables sans cadre. La bible technique ne remplace pas le cadre légal du client. Ajoute une ligne sur les interdits de marque et de copie de design produit si tu livres pour une campagne commerciale, pour que l’équipe juridique sache ce qu’elle regarde.
Liens utiles dans la série AI Studio
- Comment créer des scènes cohérentes avec plusieurs plans en IA
- Comment écrire un prompt pour un personnage réaliste et constant
- Comment contrôler le style visuel en génération IA
- Comment structurer une vidéo IA comme un vrai film
FAQ
Foire aux questions
Réponses rapides aux questions les plus fréquentes sur cet article.
Comment intégrer des photos réelles et de l’IA dans le même univers ?
Traite les photos comme la vérité de la lumière, génère autour avec la même direction de key et la même température, et harmonise en post avec une courbe commune.
La bible doit-elle être longue ?
Non. Une page bat un roman. La longueur crée des contradictions.
Peut-on avoir deux mondes en parallèle ?
Oui, avec deux bibles et des dossiers séparés.
Comment gérer le jour et la nuit ?
Deux sous-règles explicites, pas un seul prompt flou.
L’univers texte influence-t-il l’univers visuel ?
Oui. Les noms de lieux et d’époque orientent les objets.
Que faire si le client veut un pivot esthétique ?
Nouvelle image pilote, nouvelle bible, pas un patch sur douze images.
Faut-il des références externes ?
Oui, mais comme repères lumineux et matière, pas comme copie de sujet.
Comment éviter la fatigue de série ?
Limite les sessions, reviens avec une grille de comparaison.
Les métadonnées importent-elles ?
Pour la repro, oui. Documente outil, modèle, date.
Comment former un junior sur une bible ?
Fais-lui refaire trois images en ne changeant qu’un pilier à la fois, puis une revue de vignettes. La pédagogie passe par la variation contrôlée.
Que faire si deux images excellentes mais incompatibles ?
Choisis celle qui respecte la bible. L’autre devient variante « hors canon » ou nouvelle branche de projet.
L’univers doit-il inclure la post-production ?
Oui, au moins une ligne, grain cible, contraste global, pour éviter que cinq opérateurs fassent cinq films.
Peut-on automatiser la bible ?
Tu peux script des préfixes de prompt, mais le jugement humain reste nécessaire sur l’image pilote.
Comment gérer les saisons d’une même série ?
Bible saison 1, bible saison 2, avec liste des changements assumés, météo, végétation, dégradation des lieux.
Une bible peut-elle inclure des ratios d’image ?
Oui, 2.39, 16:9, 4:5, note-les pour éviter des recadrages qui cassent la composition d’ensemble entre les livrables.
Faut-il une image de moodboard par pilier ?
Utile mais pas obligatoire. Une image par pilier peut aider l’équipe, à condition de les traduire en règles textuelles pour ne pas dépendre du seul visuel.
Section de conformite editoriale

Suivre aussi les analyses de @BusinessDynamite pour garder une direction visuelle coherente et orientee production.
Liens internes utiles :
- /blog/comment-ecrire-prompt-cinematic-ultra-realiste-ia
- /blog/comment-structurer-video-ia-comme-vrai-film
Continuer la lecture
Comment choisir les bons angles caméra en IA
Choisir des angles caméra crédibles et narratifs pour éviter les images IA plates ou artificielles.
Comment construire une scène cinématique plan par plan
Méthode plan par plan pour créer une scène IA cohérente, lisible et émotionnellement efficace.
Comment créer une narration visuelle sans dialogue
Raconter une histoire claire avec l’image, le cadre, la lumière et le rythme, sans dépendre des dialogues.


