Comment utiliser Google Veo 3 : le guide complet pour générer des vidéos IA pro
Le guide étape par étape pour maîtriser Veo 3 (Google DeepMind) : accès, premier prompt vidéo, audio natif, image-to-video, Flow et Vids. Avec exemples de prompts qui marchent vraiment et 12 vidéos gratuites par jour.

- Veo 3 est le modèle de génération vidéo de Google DeepMind, capable de produire des clips de 8 secondes en 1080p avec audio synchronisé (voix, bruitages, musique).
- Accès gratuit via Google AI Studio avec quota quotidien, ou via Google Vids (intégré à Workspace).
- Veo 3.1 ajoute vidéos étendues, contrôle créatif renforcé et version Lite plus économique.
- Concurrents directs : Sora 2 (OpenAI), Runway Gen-4, Kling 2 (Chine), Pika 3.
Veo 3 est devenu le modèle vidéo IA de référence en 2026. Son secret : générer image et son ensemble, pas séparément. Voici comment en tirer le maximum, même sans formation cinéma.
Vous n avez jamais touché à un logiciel de vidéo ? Veo est fait pour vous. Vous décrivez ce que vous voulez voir en une phrase, l IA génère une mini-vidéo de 8 secondes avec son intégré. Pas de timeline, pas de calques, pas de transitions à régler. Juste du texte qui devient image.
- Veo 3, c est quoi exactement ?
- Comment y accéder gratuitement
- Votre première vidéo en 5 minutes
- Anatomie d un bon prompt vidéo
- L audio natif : la fonction qui change tout
- Image-to-video et continuité
- Google Flow : l éditeur IA pour pros
- Google Vids : l alternative no-code
- 10 cas d usage qui marchent vraiment
- Limites et pièges courants
- Quel plan choisir ?
1. Veo 3, c est quoi exactement ?
Veo est la famille de modèles de génération vidéo développée par Google DeepMind à Londres. La version Veo 3, sortie au sommet Google I/O de mai 2025, a marqué un saut majeur : elle est devenue le premier modèle commercial à générer image ET audio synchronisés dans une seule passe (les modèles précédents généraient l image, puis ajoutaient le son a posteriori).
Laboratoire IA de Google, fusion en 2023 de DeepMind (Londres) et Google Brain (Mountain View). 2 500 chercheurs, dirigé par Demis Hassabis. Édite Gemini, Veo, Imagen, Lyria. AlphaGo, AlphaFold sont aussi sortis de DeepMind.
Technique consistant à générer la piste audio (dialogues, bruitages, musique d ambiance) en même temps que les images, dans le même réseau de neurones. Avantage : la synchronisation est parfaite (le bruit de pas tombe pile sur le pied qui touche le sol). Inconvénient : la qualité audio est encore inférieure à celle d outils dédiés comme ElevenLabs.
| Version | Date | Nouveautés |
|---|---|---|
| Veo 1 | Mai 2024 | Premier modèle vidéo Google, 720p, 5 secondes |
| Veo 2 | Décembre 2024 | 1080p, 8 secondes, prompt understanding amélioré |
| Veo 3 | Mai 2025 | Audio natif, contrôles caméra, image-to-video |
| Veo 3.1 | Janvier 2026 | Vidéos étendues (jusqu à 60s), Flow, version Lite gratuite |
2. Comment y accéder gratuitement
Trois portes d entrée selon votre profil :
🟢 Pour découvrir (gratuit)
- Google AI Studio (aistudio.google.com)
- 12 vidéos Veo 3.1 Lite par jour
- Pas de carte bancaire requise
- Connexion Google Account suffit
🟡 Pour usage régulier
- Gemini Advanced (22 €/mois)
- Veo 3 full quality dans Gemini app
- Inclus si abonné Google One AI Premium
- Quotas plus généreux
🔵 Pour création pro
- Google Flow (60 €/mois)
- Éditeur vidéo IA avancé
- Multi-scènes, contrôle caméra fin
- Export 4K possible
🟣 Pour entreprises
- Google Vids (inclus Workspace Business)
- Veo intégré à Google Slides
- Avatars IA, voix off automatique
- Collaboration équipe native
3. Votre première vidéo en 5 minutes
- Ouvrez aistudio.google.com
Connectez-vous avec votre compte Google personnel ou pro. Si c est votre premier accès, acceptez les conditions d utilisation.
- Sélectionnez le modèle "Veo 3" ou "Veo 3.1 Lite"
Dans le menu déroulant en haut à droite, choisissez Veo. La version Lite est gratuite, la version Standard nécessite Gemini Advanced.
- Cliquez sur l onglet "Generate Video"
L interface affiche un grand champ de saisie pour votre prompt et des options : durée, ratio, son.
- Tapez votre premier prompt
Exemple simple pour démarrer : "A golden retriever puppy running through a field of sunflowers at sunset, slow motion, cinematic lighting". En français aussi accepté, mais l anglais marche mieux pour les nuances cinématographiques.
- Cliquez sur "Generate"
L attente est de 30 à 90 secondes. Veo construit la vidéo image par image puis ajoute l audio. Vous pouvez préparer le prompt suivant en attendant.
- Téléchargez ou partagez
Vidéo en MP4 1080p, environ 8 secondes. Bouton de téléchargement direct, ou copie de lien partageable.
Astuce gain de temps : générez plusieurs variantes en parallèle. Veo permet de lancer jusqu à 4 générations simultanées sur le même prompt avec des seeds différentes. Vous gardez la meilleure et jetez les autres.
4. Anatomie d un bon prompt vidéo
Un prompt qui marche bien sur Veo combine 5 ingrédients, dans cet ordre idéal :
Exemple de prompt complet :
"A young female chef plating a dish in a modern Parisian kitchen at golden hour, focused expression, light steam rising from a pan in the background. Cinematic, shallow depth of field, warm tones. Subtle ambient sound of plates and gentle jazz music."
| Mot-clé style | Effet |
|---|---|
| cinematic | Look pro, profondeur de champ, étalonnage soigné |
| documentary | Caméra à l épaule, lumière naturelle |
| anime style | Aspect dessin animé japonais |
| stop motion | Animation en saccades, look artisanal |
| vintage 8mm film | Aspect rétro, grain, vignette |
| drone shot | Vue aérienne, mouvement fluide |
| POV first person | Vue subjective |
| slow motion | Ralenti dramatique |
Tutoriel Google AI Studio : démarrer avec Veo 3 et structurer ses prompts vidéo.
5. L audio natif : la fonction qui change tout
Avant Veo 3, ajouter du son à une vidéo IA demandait un second outil (ElevenLabs pour la voix, Suno pour la musique, etc.) et beaucoup de synchronisation manuelle. Veo 3 génère l audio en même temps que l image. Trois types de son sont possibles :
L audio natif n égale pas encore les outils spécialisés. Pour une voix off pro à diffuser sur YouTube ou en pub, générez la vidéo dans Veo (image seule) puis ajoutez la voix avec ElevenLabs. Idem pour la musique : Suno ou Udio donnent toujours mieux.
6. Image-to-video et continuité
Veo 3 accepte une image de référence en entrée. Vous uploadez une photo (votre produit, votre logo, votre personnage), Veo l anime selon votre prompt textuel.
Cas d usage premium :
- Animer un produit e-commerce
Uploadez la photo packshot de votre produit. Prompt : "Slow 360 degree rotation, soft studio lighting, white background, subtle reflections." Vous obtenez en 30 secondes une vidéo de produit qui aurait coûté 500 € en studio.
- Faire bouger un portrait
Photo d une personne (acteur, mannequin, vous) + prompt "She turns her head slowly toward camera and smiles". Idéal pour des contenus marketing personnalisés.
- Continuer une scène existante
Veo 3.1 permet d uploader la dernière frame d une vidéo précédente pour générer la suite, créant ainsi des séquences de plus de 60 secondes par chaînage.
- Animer une illustration
Une image générée par Imagen ou Midjourney peut être animée par Veo. Idéal pour BD interactives, livres jeunesse augmentés.
7. Google Flow : l éditeur IA pour pros
Google Flow est l outil avancé pour qui veut créer des vidéos longues, multi-scènes, avec contrôles précis. Lancé en 2025, refondu en avril 2026 avec Veo 3.1 intégré.
Flow, c est un peu le "Photoshop de la vidéo IA" : interface visuelle, timeline, calques, transitions, contrôles caméra (travelling, zoom, panoramique), lip-sync sur dialogue. Là où AI Studio génère un clip isolé, Flow vous fait monter une mini-séquence cohérente de plusieurs scènes.
Workflow type dans Flow :
- Storyboard initial
Vous décrivez votre histoire en 4-8 plans. Flow propose pour chaque plan un thumbnail généré par Imagen.
- Génération scène par scène
Chaque plan est généré indépendamment via Veo, avec contrôles caméra spécifiques (par exemple : "wide shot, slow push-in").
- Continuité personnage
Flow utilise des "character references" pour garder le même visage et les mêmes vêtements d une scène à l autre. Limite actuelle : 3-4 personnages max.
- Audio synchronisé
Vous pouvez verrouiller la voix et la musique à travers les scènes pour de la cohérence narrative.
- Export final
1080p ou 4K (sur abonnement Pro), MP4 ou ProRes. Compatible montage classique (DaVinci Resolve, Premiere).
8. Google Vids : l alternative no-code
Si vous êtes plutôt côté entreprise / équipe, Google Vids est le bon outil. Intégré à Google Workspace depuis 2024, dopé à Veo 3.1 depuis avril 2026, c est l équivalent vidéo de Google Slides.
Si vous payez déjà Google Workspace Business Standard ou plus, Vids est inclus sans surcoût. C est le moyen le moins cher d avoir Veo en entreprise.
9. 10 cas d usage qui marchent vraiment
| Usage | Outil idéal | Difficulté |
|---|---|---|
| Pub Instagram / TikTok 8 secondes | AI Studio (Veo 3.1) | ⭐ |
| Vidéo produit e-commerce 360° | AI Studio + image-to-video | ⭐ |
| Intro YouTube animée | AI Studio | ⭐⭐ |
| Pitch investisseur 1 minute | Google Vids | ⭐⭐ |
| Formation interne avec avatar | Google Vids | ⭐⭐ |
| Reportage documentaire fictionnel | Flow | ⭐⭐⭐ |
| Court-métrage narratif (1-3 min) | Flow + Premiere | ⭐⭐⭐⭐ |
| Bande-annonce de produit | Flow | ⭐⭐⭐ |
| Vidéo musicale | Flow + Suno | ⭐⭐⭐⭐ |
| Réalité virtuelle 360° | Pas encore supporté | ❌ |
10. Limites et pièges courants
Texte dans l image : Veo a beaucoup progressé mais reste imparfait pour générer du texte lisible (logos, panneaux, écritures). Pour du texte garanti, ajoutez-le en post-production.
Mains et doigts : encore le talon d Achille. Si votre vidéo zoome sur des mains qui tapent au clavier ou jouent du piano, attendez-vous à des artefacts.
Cohérence personnage : entre 2 vidéos générées séparément, le même prompt donne souvent un visage légèrement différent. Utilisez Flow et ses character references pour résoudre ça.
Personnalités publiques : Veo refuse explicitement de générer des vidéos de personnalités politiques, célébrités ou marques déposées. Toute tentative est bloquée.
Watermark obligatoire : depuis l AI Act européen, toute vidéo Veo embarque un watermark invisible (SynthID) plus une mention visible "Generated by AI" pendant 1 seconde au début. Pas désactivable.
11. Quel plan choisir ?
| Plan | Prix | Quota Veo | Idéal pour |
|---|---|---|---|
| AI Studio Free | 0 € | 12 vidéos/jour Veo 3.1 Lite | Découverte, tests perso |
| Gemini Advanced | 22 €/mois | ~50 vidéos/jour Veo 3 full | Créateurs, freelances |
| Google Flow Pro | 60 €/mois | Illimité 1080p, 4K limité | Pros vidéo, agences |
| Workspace + Vids | 14 €/utilisateur/mois | Veo intégré aux outils | Équipes, communication interne |
| Vertex AI (API) | 0,75 $/seconde | Pay-per-use | Devs, automatisation à l échelle |
Notre recommandation 2026 : démarrez en Free dans AI Studio. Si vous générez plus de 10 vidéos par semaine, Gemini Advanced à 22 € est rentable immédiatement. Réservez Flow aux créateurs qui passent au moins 5 heures par semaine sur la vidéo.
Questions fréquentes
- Veo 3 est-il vraiment gratuit ?
- Oui, via Google AI Studio (aistudio.google.com) vous avez accès à Veo 3.1 Lite avec 12 vidéos par jour, sans carte bancaire. Suffisant pour découvrir et tester. Pour la version full quality et plus de quota, Gemini Advanced à 22 euros par mois est l option rentable.
- Quelle est la durée maximale d une vidéo Veo ?
- Veo 3 Standard génère des clips de 8 secondes en 1080p. Veo 3.1 (sortie janvier 2026) permet d étendre jusqu à 60 secondes par chaînage de scènes via Google Flow. Pour des vidéos plus longues, on assemble plusieurs clips en post-production.
- Peut-on utiliser Veo pour des vidéos commerciales ?
- Oui sans restriction sur les plans payants (Gemini Advanced, Flow Pro, Workspace). Sur le plan Free, l usage commercial est techniquement autorisé mais limité par le quota. Attention : depuis l AI Act, toute vidéo embarque un watermark SynthID et une mention visible Generated by AI au début, non désactivable.
- Veo refuse certains prompts, lesquels ?
- Veo refuse de générer : 1) des personnalités publiques (politiques, célébrités, marques déposées), 2) du contenu sexuel ou violent explicite, 3) des deepfakes nominatifs sans consentement, 4) des contenus visant des mineurs. La modération est plus stricte que sur Sora 2 ou Runway.
- L audio natif Veo est-il vraiment utilisable en production ?
- Oui pour les bruitages d ambiance et la musique de fond, où Veo est très convaincant. Pour les dialogues et voix off pro, la qualité reste inférieure à ElevenLabs ou OpenAI Voice. La meilleure pratique : générer la vidéo image-only sur Veo, puis ajouter voix off avec ElevenLabs et musique avec Suno.
- Comment garder le même personnage dans plusieurs scènes ?
- Utilisez Google Flow et sa fonctionnalité character references . Vous uploadez une image de référence du visage et Flow maintient la cohérence à travers les scènes. Limite actuelle : 3-4 personnages par projet. Pour des séries longues, complétez avec un fine-tuning Imagen sur le visage cible.
- Peut-on utiliser Veo via API pour automatiser la production ?
- Oui via Google Vertex AI. Tarif : environ 0,75 dollar par seconde générée. Idéal pour les e-commerçants qui veulent générer automatiquement des vidéos produits à partir de leur catalogue, ou pour les médias qui veulent automatiser des illustrations vidéo d articles.
Source : deepmind.google


