Frank Houbre
← Blog
Tutoriels20 min de lecture

Comment créer une vidéo cinématique avec l’IA étape par étape

Méthode complète pour passer d’une idée floue à une vidéo IA crédible, plan par plan, sans rendu plastique.

PartagerXLinkedInFacebook

Tu ouvres ton générateur.
Tu tapes un prompt.
Tu lances.

Et là, le mur. L’image bouge, oui, mais elle ne vit pas. Peau plastique, lumière incohérente, mouvements flottants, décor “propre” comme une pub générique. Tu voulais un plan de film. Tu as obtenu un test technique.

Ce guide est fait pour t’éviter ça. Pas de magie. Pas de jargon inutile. Une méthode de plateau, adaptée à l’IA locale, pour produire une vraie vidéo cinématique crédible.

Prompt: cinematic still, ultra photorealistic, shot on ARRI Alexa 65, anamorphic lens, shallow depth of field, night exterior with lone character under rainy bus shelter and sodium practical light reflecting on wet asphalt, natural skin texture, subtle imperfections, film grain, volumetric lighting, realistic color grading, no CGI look, no artificial sharpness --ar 16:9

Le vrai point de départ

La plupart des débutants commencent par l’outil.
Tu dois commencer par l’intention.

Avant de générer un seul pixel, pose ces 5 réponses:

  • que ressent le personnage
  • ce que le spectateur doit comprendre
  • où se trouve la source lumineuse dominante
  • quel mouvement caméra est plausible
  • quel détail visuel porte l’émotion

Si ces réponses sont floues, ton rendu le sera.

Pro insight
Un plan cinématique, c’est une décision visuelle, pas un style appliqué.

Pour stabiliser la narration dès la préparation, utilise la logique de comment structurer une vidéo IA comme un vrai film.

3 scénarios débutants, version terrain

Scénario 1, “ma pub mode est belle mais fake”

Tu as un look premium. Tout est net. Tout est mort.

Ce qui manque:

  • un mouvement caméra justifié
  • une peau naturelle
  • une source lumineuse lisible

Ce qu’on corrige:

  • plans de 3 à 4 secondes
  • motion faible à modéré
  • texture peau + grain subtil

Scénario 2, “mes images fixes sont fortes, ma vidéo casse”

Le still est crédible. L’animation détruit les contours.

Ce qui manque:

  • cohérence temporelle
  • contrôle des zones sensibles
  • itération paramètre par paramètre

Ce qu’on corrige:

  • seed fixe
  • test A/B minimal
  • contrôle zoom 200% sur visage/mains

Scénario 3, “je veux un court dramatique, j’obtiens un clip”

Les plans sont jolis mais n’avancent pas narrativement.

Ce qui manque:

  • progression émotionnelle
  • rythme de montage
  • conséquence finale

Ce qu’on corrige:

  • arc court en 3 blocs
  • coupe sur intention
  • son traité tôt

Prompt template obligatoire

Prompt: cinematic still, ultra photorealistic, shot on ARRI Alexa 65, anamorphic lens, shallow depth of field, [SCENE DESCRIPTION], natural skin texture, subtle imperfections, film grain, volumetric lighting, realistic color grading, no CGI look, no artificial sharpness --ar 16:9

Ce template ne suffit pas seul.
La qualité se joue dans [SCENE DESCRIPTION].

Workflow ultra détaillé, étape par étape

Étape 1, mini brief en 12 lignes

Écris:

  • sujet
  • émotion
  • lieu
  • heure
  • météo
  • type de plan
  • focale perçue
  • mouvement caméra
  • palette
  • texture
  • interdit visuel
  • rôle du plan

Étape 2, keyframes fixes avant vidéo

Tu verrouilles d’abord l’image.

Réglages de départ:

  • résolution: 1536x864 ou 1920x1080
  • steps: 30 à 45
  • CFG: 4.5 à 6.5
  • sampler: DPM++ 2M Karras
  • denoise img2img: 0.25 à 0.40
  • seed: fixe par plan

Étape 3, animation locale contrôlée

Règles de sécurité:

  • durée: 3 à 5 secondes
  • fps: 24
  • motion strength: 0.35 à 0.55
  • temporal consistency: élevée
  • bruit: faible

Étape 4, sélection stricte

Tu gardes:

  • 1 version A
  • 1 version B maximum

Tu rejettes:

  • visages instables
  • mains incohérentes
  • lumières contradictoires

Étape 5, montage narratif

Structure recommandée:

  1. setup
  2. tension
  3. décision
  4. conséquence

Étape 6, grade réaliste

Ordre:

  1. exposure
  2. contraste doux
  3. peau secondaire
  4. harmonisation
  5. grain fin

Étape 7, son dès le rough cut

Base:

  • ambi à -24 LUFS
  • effets ponctuels à -18/-14
  • musique en support, pas en camouflage

Image contextuelle, workflow de génération.

Prompt: cinematic still, ultra photorealistic, shot on ARRI Alexa 65, anamorphic lens, shallow depth of field, filmmaker pinning keyframes and continuity notes on wall in low-light studio, natural skin texture, subtle imperfections, film grain, volumetric lighting, realistic color grading, no CGI look, no artificial sharpness --ar 16:9

Tableau de réglages de départ

ParamètreValeur de basePourquoi
Durée clip3-5 sstabilité IA
FPS24rythme cinéma
Motion strength0.35-0.55crédibilité du mouvement
Seedfixecontinuité
Denoise0.25-0.40variation contrôlée
Grainlégertexture organique

Ce que les débutants ratent, et comment corriger

1) Générer trop long

Erreur: plan de 10 à 15 secondes d’un coup.
Fix: segments courts puis montage.

2) Trop de mouvement

Erreur: caméra démonstrative.
Fix: inertie sobre, trajectoire lisible.

3) Trop de netteté

Erreur: rendu jeu vidéo.
Fix: réduire sharpen, préserver midtones.

4) LUT avant lumière

Erreur: look artificiel.
Fix: corriger géométrie lumineuse avant style.

5) Pas de seed stable

Erreur: personnage qui change.
Fix: seed fixe par plan.

6) Oublier les bords du cadre

Erreur: artefacts visibles au export.
Fix: contrôle 200% systématique.

7) Son ajouté au dernier moment

Erreur: rythme cassé.
Fix: poser room tone dès rough cut.

8) Structure absente

Erreur: plans beaux, film vide.
Fix: chaque plan doit avoir une mission.

9) Personnage mal verrouillé

Erreur: incohérence visage/costume.
Fix: fiche personnage constante.

10) Tout tester en même temps

Erreur: impossible de diagnostiquer.
Fix: une variable par itération.

Pour éviter les dérives de texture qui cassent le réalisme, complète avec comment générer des images IA photoréalistes sans effet plastique.

Image contextuelle, validation qualité avant export.

Prompt: cinematic still, ultra photorealistic, shot on ARRI Alexa 65, anamorphic lens, shallow depth of field, editor reviewing before-after realism corrections on calibrated monitor in dark grading suite, natural skin texture, subtle imperfections, film grain, volumetric lighting, realistic color grading, no CGI look, no artificial sharpness --ar 16:9

Vidéo YouTube à intégrer

Référence @BusinessDynamite:

Ce qu’il faut observer:

  • comment une préparation solide réduit les erreurs
  • comment le découpage guide l’exécution
  • comment rester concret au lieu de “styliser” à l’aveugle

FAQ

Quelle durée viser au début ?

3 à 5 secondes par plan. Ce chiffre est un point de depart fiable, mais ajuste-le selon le type de mouvement, la densite du cadre et le niveau de realisme attendu. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Faut-il toujours travailler en 24 fps ?

Oui en base, c’est le plus stable pour l’intention cinéma. La bonne reponse depend surtout de l'intention de scene et de la constance entre les plans, pas d'une regle absolue appliquee partout. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Le modèle suffit-il à faire la différence ?

Non, la méthode compte plus que la marque du modèle. En pratique, traite cette decision comme un parametre narratif, pas comme un simple reglage technique, sinon le rendu devient vite incoherent d'un plan a l'autre. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Pourquoi mes visages changent ?

Seed instable, denoise trop élevé, description personnage trop variable. La raison principale est que le modele complete les zones ambiguës avec des approximations, ce qui cree des incoherences visibles quand la scene devient complexe. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Peut-on faire pro sans équipe ?

Oui, avec un pipeline propre et des plans courts. En pratique, traite cette decision comme un parametre narratif, pas comme un simple reglage technique, sinon le rendu devient vite incoherent d'un plan a l'autre. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Combien de versions garder par plan ?

Deux maximum, A et B. Ce chiffre est un point de depart fiable, mais ajuste-le selon le type de mouvement, la densite du cadre et le niveau de realisme attendu. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Comment savoir que le plan est prêt ?

Quand il reste crédible en plein écran, en mobile, et sans explication. Commence par une version simple et stable, puis ajoute une seule contrainte a la fois pour voir clairement ce qui ameliore ou deteriore le resultat. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Quel est l’erreur numéro un ?

Confondre effet visuel et intention narrative. En pratique, traite cette decision comme un parametre narratif, pas comme un simple reglage technique, sinon le rendu devient vite incoherent d'un plan a l'autre. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Bloc avancé, pipeline complet en conditions réelles

Quand tu passes de tests solo à une vraie production, même courte, les erreurs changent. Ce n’est plus seulement “est-ce que le plan est joli”. C’est “est-ce que la séquence tient de bout en bout, avec continuité, rythme, et crédibilité”.

Préproduction compacte, version terrain

Tu fais un document unique de 1 page:

  • logline
  • arc émotionnel
  • liste de plans
  • charte lumière
  • charte texture
  • interdits visuels

Tu dois pouvoir l’expliquer à quelqu’un en 90 secondes. Si ce n’est pas possible, ton projet est encore flou.

Paramètres recommandés par type de plan

Type de planDuréeMotionRisque cléAction
Portrait serré3-4 s0.30-0.40dérive visagecaméra quasi fixe
Plan moyen action4-5 s0.40-0.55mains/contourssimplifier geste
Plan large ambiance3-5 s0.25-0.40géométrie décorlimiter travelling
Plan détail objet2-4 s0.20-0.35texture “CGI”matière explicite

Pipeline de rendu

  1. image source validée
  2. animation test basse intensité
  3. passe de correction ciblée
  4. sélection A/B
  5. intégration timeline
  6. harmonisation colorimétrique
  7. son minimal
  8. export master
  9. export diffusion

Si tu sautes les étapes 2 à 4, tu répares en catastrophe à la fin.

Pro insight
Le meilleur gain de qualité ne vient pas d’un nouveau modèle, il vient d’une meilleure discipline de sélection.

Trench warfare étendu, erreurs “invisibles” qui tuent la crédibilité

11) Plans validés en preview seulement

Erreur: tout semble propre en aperçu 50%.
Fix: validation en plein écran + mobile obligatoire.

12) Continuité couleur négligée

Erreur: un plan tire cyan, l’autre magenta.
Fix: neutraliser d’abord, look ensuite.

13) Trop de plans “intermédiaires”

Erreur: la narration s’étire, impact dilué.
Fix: coupe les plans qui n’ajoutent ni information ni émotion.

14) Son “banque” générique

Erreur: la vidéo paraît stock.
Fix: ambiance lieu + micro foleys contextualisés.

15) Pas de versioning

Erreur: impossible de reproduire une bonne sortie.
Fix: nommage strict et log des réglages.

16) Variations de personnage entre plans

Erreur: perception de faux casting.
Fix: fiche personnage + seed + garde-robe constante.

17) Reflets incohérents

Erreur: lunettes/vitres trahissent l’IA.
Fix: angle simplifié + highlights contrôlés.

18) Trop d’effets d’étalonnage

Erreur: impression “preset social”.
Fix: correction primaire sobre, look final léger.

19) Compression mal anticipée

Erreur: upload détruit textures fines.
Fix: marge sur hautes lumières + grain subtil.

20) Absence de règle de rejet

Erreur: tu “sauves” des plans médiocres.
Fix: si défaut majeur après 2 passes, rejet.

Mini cas pratique, de brief à export en 45 minutes

  • minute 0-5: logline + shotlist 4 plans
  • minute 5-15: keyframes fixes
  • minute 15-25: animation tests
  • minute 25-35: sélection + montage brut
  • minute 35-42: correction color + son
  • minute 42-45: export + QA rapide

Ce format court te force à décider vite. Et bien.

Checklist publication pro

  • 3 plans minimum cohérents
  • aucun artefact majeur visible
  • texture peau naturelle
  • lumière motivée stable
  • son contextualisé
  • CTA narratif clair si format pub
  • version mobile validée
  • fichier source archivé

FAQ complémentaire

Dois-je lancer plusieurs seeds en parallèle ?

Oui pour explorer, mais verrouille ensuite une version. La bonne reponse depend surtout de l'intention de scene et de la constance entre les plans, pas d'une regle absolue appliquee partout. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Peut-on faire un plan séquence en IA ?

Possible, rarement recommandé au début. En pratique, traite cette decision comme un parametre narratif, pas comme un simple reglage technique, sinon le rendu devient vite incoherent d'un plan a l'autre. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Combien de temps pour un clip de 20 secondes pro ?

Entre 1 et 3 jours selon ton niveau et ton matériel. Ce chiffre est un point de depart fiable, mais ajuste-le selon le type de mouvement, la densite du cadre et le niveau de realisme attendu. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Quel est le meilleur “hack” qualité ?

Aucun hack, c’est la cohérence globale. En pratique, traite cette decision comme un parametre narratif, pas comme un simple reglage technique, sinon le rendu devient vite incoherent d'un plan a l'autre. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Comment former un débutant vite ?

Exercices courts, mêmes contraintes, feedback immédiat. Commence par une version simple et stable, puis ajoute une seule contrainte a la fois pour voir clairement ce qui ameliore ou deteriore le resultat. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

La musique est-elle obligatoire ?

Non, un bon design sonore suffit souvent. En pratique, traite cette decision comme un parametre narratif, pas comme un simple reglage technique, sinon le rendu devient vite incoherent d'un plan a l'autre. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Est-ce qu’un smartphone de validation suffit ?

Non, il complète, il ne remplace pas l’écran principal. En pratique, traite cette decision comme un parametre narratif, pas comme un simple reglage technique, sinon le rendu devient vite incoherent d'un plan a l'autre. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Quand savoir qu’il faut repartir de zéro ?

Quand la base visuelle contredit l’intention. En pratique, traite cette decision comme un parametre narratif, pas comme un simple reglage technique, sinon le rendu devient vite incoherent d'un plan a l'autre. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Comment garder un style cohérent sur plusieurs vidéos ?

Charte visuelle fixe + process de QA standard. Commence par une version simple et stable, puis ajoute une seule contrainte a la fois pour voir clairement ce qui ameliore ou deteriore le resultat. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Qu’est-ce qui différencie une vidéo “pro” d’une vidéo “IA” ?

La lisibilité émotionnelle, pas la technologie utilisée. En pratique, traite cette decision comme un parametre narratif, pas comme un simple reglage technique, sinon le rendu devient vite incoherent d'un plan a l'autre. La methode la plus fiable consiste a tester deux variantes proches avec les memes conditions (seed, lumiere, cadrage), puis garder celle qui reste lisible apres plusieurs revisions. Si tu hesites, privilegie la coherence globale de la sequence et documente ton choix, car c'est ce qui donne un resultat credible sur la duree.

Deep dive, du plan isolé à la mini séquence pro

Quand tu passes à un format 20 à 40 secondes, un détail devient critique, la gestion des transitions.
Un excellent plan peut sembler faux si la coupe qui suit casse l’axe ou la densité de texture.

Règle de transition visuelle

Entre deux plans consécutifs, contrôle:

  • axe de regard
  • direction lumière
  • densité de grain
  • niveau de contraste
  • vitesse apparente du mouvement

Si trois éléments changent en même temps, la perception de faux augmente.

Méthode “3 passes montage”

Pass 1, compréhension
Tu vérifies que l’histoire se comprend sans effet.

Pass 2, émotion
Tu ajustes la durée des plans pour créer tension et relâchement.

Pass 3, finition
Tu harmonises couleur, texture et son.

Pro insight
Une séquence convaincante n’est pas une somme de plans parfaits, c’est une continuité d’intentions lisibles.

Scénario production, pub 30 secondes locale

Brief

  • produit cosmétique
  • cible 25-35
  • promesse confiance rapide
  • ton premium naturel

Découpage

  • plan 1, hook texture produit
  • plan 2, usage réel
  • plan 3, résultat
  • plan 4, CTA visuel

Contrôle qualité spécifique

  • peau crédible sur tous les plans
  • reflets cohérents flacon
  • rythme progressif
  • message compréhensible sans voix

Section dépannage complémentaire

21) “Ça marche en still, pas en séquence”

Fix: harmoniser raccord lumière avant grade créatif.

22) “Le plan final est moins bon que le premier”

Fix: fatigue de sélection, refaire QA à froid.

23) “Le rendu mobile paraît cheap”

Fix: revoir contraste local et netteté globale.

24) “Le CTA n’imprime pas”

Fix: réduire bruit visuel dans les 3 dernières secondes.

25) “Le personnage perd son identité”

Fix: verrouiller descripteurs et vêtements dans chaque prompt.

26) “Le fond attire plus que le sujet”

Fix: baisser luminance du décor, remonter sujet.

27) “L’image paraît trop numérique”

Fix: retirer sharpen, ajouter grain subtil homogène.

28) “Le rythme est monotone”

Fix: alterner plans courts et plans respirés.

29) “La scène manque de profondeur”

Fix: renforcer séparation avant/arrière-plan.

30) “Impossible de décider entre 2 versions”

Fix: tester sur public froid avec une question simple, “laquelle semble la plus vraie”.

Dernière passe, validation en conditions réelles

Avant publication, fais une lecture “sans indulgence”.

  • regarde avec fatigue visuelle, comme un spectateur réel
  • regarde avec son faible, puis son coupé
  • regarde sur petit écran

Si l’émotion reste claire dans ces trois conditions, ton plan tient.

Ajoute une dernière note de production:

  • ce qui a le mieux marché
  • ce qui a cassé
  • ce que tu réutilises la prochaine fois

Cette discipline transforme un bon essai en méthode durable.

Tu peux aussi mettre en place une règle simple de revue d’équipe, même à deux personnes:

  • une personne juge la narration
  • l’autre juge la crédibilité visuelle

Si les deux valident, tu publies. Si l’un des deux hésite, tu refais une passe courte. Cette routine évite les publications “presque bonnes” qui te font perdre la confiance du public sur le long terme.

C’est simple.
Mais puissant.
Et surtout, reproductible projet après projet.

Tu fais moins d’erreurs, et tu progresses beaucoup plus vite.

Vraiment, projet après projet.

Et si tu veux renforcer la cohérence des scènes, utilise aussi les principes de construction plan par plan.

Auteur

Frank Houbre

Frank Houbre

Créateur, image & vidéo par IA

J’écris sur ce site pour partager des workflows concrets autour de l’IA générative : prompts structurés comme un brief photo ou vidéo, erreurs qui donnent un rendu « plastique », et pistes pour garder une cohérence visuelle sur plusieurs plans.

L’idée n’est pas de collectionner des effets spectaculaires, mais d’approcher un langage de réalisation — lumière naturelle, grain, mouvement de caméra — pour que le résultat tienne la route à l’écran.

Continuer la lecture