Extraction 2 (2023)
Réalisé par Sam Hargrave
Analyse Critique et Technique de la Séquence Continue dans Extraction 2 : Déconstruction d’un Monument du Cinéma d’Action Moderne
Introduction : l'avènement du cinéma de la sensation pure
Dans la cartographie contemporaine du cinéma d’action, une mutation profonde s’est opérée au cours de la dernière décennie. Nous avons glissé d’un paradigme du « montage-roi », hérité des années 90 et 2000 — où la frénésie des coupes (le fameux shaky cam de Paul Greengrass ou le montage épileptique de Michael Bay) créait le chaos — vers un paradigme de la « continuité immersive ». Cette nouvelle école, portée par des cinéastes souvent issus du monde de la cascade comme Chad Stahelski (John Wick) ou David Leitch (Atomic Blonde), privilégie la lisibilité spatiale et la performance physique ininterrompue. C'est dans ce contexte esthétique et industriel qu'il convient d'analyser Extraction 2 (2023), réalisé par Sam Hargrave et produit par les frères Russo pour Netflix.
Si le premier opus (Extraction, 2020) avait créé la surprise en devenant l'un des plus grands succès de la plateforme, notamment grâce à un plan séquence (ou « oner ») de 11 minutes et 29 secondes simulant une fuite éperdue dans les rues de Dhaka, sa suite se devait de répondre à l'impératif hollywoodien de la surenchère. Le résultat est une séquence gargantuesque de 21 minutes et 7 secondes, un morceau de bravoure qui traverse une prison géorgienne en émeute, une forêt enneigée, et se termine sur un train en mouvement attaqué par des hélicoptères.
Ce rapport se propose de mener une exégèse technique, narrative et esthétique de cette séquence. Il ne s'agit pas seulement de saluer la prouesse logistique, mais de comprendre comment ce choix formel radical redéfinit le pacte de lecture entre le film et son spectateur. En adoptant la méthodologie rigoureuse de l'analyse filmique experte, nous disséquerons cette œuvre en trois mouvements distincts : l'Objectif, qui interroge les intentions sémantiques et immersives derrière le dispositif ; les Coulisses, qui révèlent l'ingénierie invisible et les défis titanesques de la production ; et la Longueur, qui analyse la gestion du temps et du rythme sur une durée qui défie les standards de l'attention moderne.
Partie I : objectif — la métaphysique de l'action continue
Pourquoi s'imposer, et imposer au spectateur, une prise continue de 21 minutes? La réponse dépasse la simple volonté de performance technique. Le plan séquence, dans Extraction 2, devient le vecteur principal de la narration, fusionnant le fond et la forme pour atteindre une immersion totale.
1.1 L'immersion haptique et l'abolition du « Quatrième Mur » technique
L'objectif premier de Sam Hargrave est de générer ce que la théorie du cinéma nomme une « visualité haptique ». Contrairement à la vision optique traditionnelle qui permet une distance contemplative, la vision haptique sollicite le sens du toucher par le regard. En refusant la coupe, le réalisateur prive le spectateur de la distance de sécurité que procure le montage. Dans un film d'action classique, la coupe est une respiration, une ellipse qui signale inconsciemment que « ce n'est que du cinéma ». En supprimant ces micro-interruptions, Extraction 2 enferme le spectateur dans une temporalité absolue et implacable.
L'ambition est de synchroniser physiologiquement le public avec le protagoniste, Tyler Rake (Chris Hemsworth). La caméra ne se contente pas d'observer l'action, elle participe à l'effort. Elle tremble sous les impacts, elle est souillée par le sang et la boue, elle est éblouie par les explosions. Comme le souligne Hargrave, l'intention est de créer une expérience où le public ne peut pas détourner le regard car le film lui-même ne cligne jamais des yeux. Cette approche phénoménologique vise à transférer l'épuisement physique de l'acteur vers le spectateur. Il n'y a pas d'échappatoire temporelle : chaque seconde de douleur vécue par le personnage est une seconde de temps réel pour l'audience. C'est une stratégie d'empathie kinesthésique : nous ne comprenons pas la douleur de Rake intellectuellement, nous la ressentons par la durée de l'effort.
1.2 La ludification du langage cinématographique
Il est impossible d'analyser l'objectif esthétique de cette séquence sans aborder sa filiation directe avec le jeu vidéo, et plus spécifiquement le genre du TPS (Third-Person Shooter). L'industrie du cinéma et celle du jeu vidéo convergent depuis des années, mais Extraction 2 acté une fusion grammaticale.
Le positionnement de la caméra, flottant juste derrière l'épaule ou la tête de Chris Hemsworth, reproduit l'angle de vue canonique de franchises vidéoludiques comme Gears of War, Uncharted, ou le God of War de 2018 (lui-même conçu en un seul plan séquence). L'objectif est de parler la langue vernaculaire des générations Y et Z. Pour ce public, la continuité spatiale est la norme de l'expérience d'action interactive. Le montage fragmenté des années 2000 (type Jason Bourne) peut sembler aujourd'hui confus ou artificiel pour un œil habitué à la fluidité des moteurs graphiques modernes.
La structure de la séquence elle-même mime la progression par niveaux (level design) sans temps de chargement :
Niveau 1 (Infiltration/Donjon) : Les corridors sombres de la prison.
Niveau 2 (Horde/Survie) : La cour de la prison en émeute.
Niveau 3 (Véhiculaire) : La poursuite en forêt.
Boss Fight / Set Piece final : Le train et l'hélicoptère.
En adoptant cette grammaire, le film ne cherche pas à ressembler à un jeu vidéo par défaut de mise en scène, mais par choix délibéré d'immersion participative. Le spectateur devient le co-pilote passif d'un avatar indestructible.
1.3 La symbolique de la renaissance : du fleuve au feu
Au-delà de l'adrénaline, le plan séquence porte un objectif narratif lourd de sens, lié à l'arc de rédemption de Tyler Rake. Le premier film s'achevait sur une image d'anéantissement : Rake, mortellement blessé, tombait d'un pont dans un fleuve. Cette chute dans l'eau symbolisait un baptême inversé, une mort ou un retour au liquide amniotique. Le second film s'ouvre sur sa pénible rééducation, une renaissance physique et spirituelle.
La mission d'extraction dans la prison de Tkachiri n'est pas une simple opération tactique ; c'est une catabase, une descente aux enfers mythologique pour sauver des âmes innocentes (la famille de son ex-femme). Le plan séquence matérialise cette traversée du purgatoire. La continuité est essentielle ici : on ne ressort pas des enfers par une ellipse. Il faut marcher chaque pas.
L'obscurité initiale : Le début de la séquence dans les sous-sols de la prison évoque le monde souterrain d'Hadès.
L'épreuve du feu : Le moment iconique où Rake combat avec un bras en feu n'est pas qu'un gadget visuel. C'est une purification élémentaire. Après avoir « péri » par l'eau dans le premier film, il renaît par le feu dans le second.
La locomotion perpétuelle : Le passage final sur le train symbolise le transit, le mouvement inéluctable vers la vie. Le train est une flèche temporelle qui ne peut pas reculer.
L'objectif du plan séquence est de rendre cette résurrection tangible. Rake doit prouver, par l'endurance de ces 21 minutes, qu'il mérite de vivre à nouveau. C'est une épreuve de force herculéenne que le montage ne doit pas adoucir.
1.4 La stratégie de franchise et la surenchère industrielle
D'un point de vue purement industriel et commercial, l'objectif est le positionnement de marque (Brand Positioning). Dans la « guerre du streaming » et la saturation du marché de l'action, une franchise doit posséder une signature unique, un USP (Unique Selling Proposition). Pour John Wick, c'est le « Gun-Fu » et l'esthétique néon-noire. Pour Mission: Impossible, ce sont les cascades réelles de Tom Cruise défiant la mort. Pour Extraction, c'est devenu le « Oner ».
Joe Russo et Sam Hargrave ont consciemment conçu cette séquence comme l'argument marketing central. Joe Russo a proposé l'idée d'ouvrir le film avec ce plan géant avant même que le scénario ne soit finalisé. L'objectif était de créer un « événement » cinématographique capable de générer de la conversation organique sur les réseaux sociaux. En doublant la durée par rapport au premier film (21 min vs 11 min), la production envoie un message clair : Extraction est la franchise de l'excès technique et de l'ambition sans limites. Il s'agit de rivaliser avec l'histoire du cinéma, de se placer aux côtés des plans célèbres de Les Fils de l'homme ou Oldboy, et de s'imposer comme la référence technique des années 2020.
Partie II : dans les coulisses — l'architecture de l'impossible
Si l'objectif est la fluidité poétique, la réalité de la production est une mécanique industrielle brutale, faite de friction, de froid et de complexité logistique. La fabrication de ces 21 minutes relève moins du tournage traditionnel que de l'opération militaire combinée à de la chirurgie numérique de pointe.
2.1 Le défi géographique et climatique : le « Pivot » de Prague
La genèse de cette séquence a été marquée par une crise majeure qui illustre la résilience de l'équipe de production. Initialement, le film devait être tourné en Australie, avec des décors et des chorégraphies conçus pour ce territoire. Cependant, les protocoles sanitaires draconiens liés au COVID-19 et les confinements successifs ont rendu le tournage impossible sur place. La production a dû déménager en urgence à Prague, en République Tchèque.
Ce changement a contraint Sam Hargrave à repenser intégralement la séquence. Comme il le décrit, c'était comme « passer de la cinquième vitesse sur l'autoroute à un freinage d'urgence, faire marche arrière et repartir dans une autre direction ».
La Réalité Thermique : Au lieu de la chaleur australienne, l'équipe s'est retrouvée dans l'hiver tchèque. Le froid que l'on perçoit à l'écran n'est pas un effet spécial ; les oreilles rouges et la buée de respiration de Chris Hemsworth sont authentiques. Cela a eu un impact majeur sur la physiologie des acteurs : les muscles sont plus raides, le risque de blessure augmente, et l'endurance diminue par des températures négatives.
L'Adaptation des Lieux : Il a fallu trouver une suite de lieux à Prague (une prison désaffectée, des forêts, une voie ferrée) qui pouvaient être connectés géographiquement pour donner l'illusion d'un parcours continu, nécessitant des mois de repérages et de réécriture chorégraphique.
2.2 L'innovation matérielle : le « Sceptre Magique » et l'arsenal de caméras
Pour capturer une action aussi dynamique et variée, les outils traditionnels ne suffisaient pas. L'équipe technique a dû bricoler et inventer de nouvelles solutions de prise de vue.
Comparatif des Outils de Prise de Vue
ARRI Mini LF Majorité des plans larges et séquences de dialogue.
Qualité d'image cinéma, gestion des hautes lumières, capteur Large Format pour l'immersion.
RED Komodo Plans serrés, espaces confinés, poursuite voitureForme cubique compacte, permet de passer dans des trous de souris.
Le « Magic Scepter » Séquence de poursuite en voiture (forêt)
Une RED Komodo montée sur un gimbal au bout d'une perche en carbone. Permet à l'opérateur de faire entrer/sortir la caméra des véhicules en mouvement.
Drones & Cable Cams Transitions aériennes et plans de train. Suivi à haute vitesse, connexion entre les différents décors.
L'innovation la plus notable est sans doute ce « Magic Scepter » (Sceptre Magique). Lors de la poursuite en voiture, Sam Hargrave (souvent lui-même opérateur caméra sanglé sur le capot d'une voiture suiveuse) utilisait cette perche pour passer la caméra d'un opérateur à l'autre à travers les vitres des véhicules roulant à vive allure. Cela permet de conserver le dynamisme d'un drone FPV tout en gardant le cadrage organique et réactif d'un opérateur humain.
Une autre technique clé fut le relais de caméra. Un plan pouvait commencer sur une grue télescopique (Technocrane) pour une vue d'ensemble de la cour de prison, puis la caméra était physiquement détachée de la tête de grue par un opérateur au sol qui partait en courant avec l'appareil à l'épaule pour plonger dans la mêlée, le tout sans couper l'enregistrement. Cette fluidité entre le macro (l'émeute) et le micro (le coup de poing) est la signature visuelle du film.
2.3 Le facteur humain : 400 figurants et le danger réel
La gestion de la masse humaine dans la séquence de la prison (le "riot") est un tour de force de coordination. La scène implique environ 400 figurants et cascadeurs interagissant simultanément. Pour éviter le chaos, Hargrave a organisé l'action en cercles concentriques de compétence :
Le Noyau (The Core) : Chris Hemsworth et les acteurs principaux, dont la chorégraphie est millimétrée.
Tier 1 (Cascadeurs d'élite) : Un groupe de 15 à 20 experts qui interagissent directement avec le héros, encaissant les chutes et les coups complexes.
Tier 2 (Action périphérique) : 30 à 40 cascadeurs gérant les combats d'arrière-plan.
Background (Figurants) : La masse créant le volume et le mouvement de panique.
L'Épreuve du Feu :
L'authenticité est poussée à son paroxysme lors de la scène où Tyler Rake se bat avec le bras en feu. Contrairement aux pratiques actuelles favorisant le CGI pour la sécurité, Chris Hemsworth a insisté pour être réellement enflammé.
Le Protocole : Sa veste était enduite de gel inflammable et de couches protectrices.
Le Risque : Le feu brûlait vraiment. La difficulté n'était pas seulement la chaleur, mais la gestion aérodynamique : en donnant des coups de poing, le vent pouvait rabattre les flammes vers son visage.
La Prise : La scène a nécessité 7 ou 8 prises complètes. À chaque fin de prise, l'acteur devait souvent éteindre les flammes résiduelles lui-même, ajoutant une urgence réelle à sa performance.
L'Hélicoptère sur le Train :
L'autre sommet de dangerosité se trouve sur le train. Le pilote Fred North a réalisé l'impensable : atterrir un hélicoptère sur le toit d'un train roulant à environ 60 km/h (40 mph).
L'Origine : Le script prévoyait un vol stationnaire. North a proposé l'atterrissage pour plus d'impact.
La Technique : L'hélicoptère se pose sur les patins, luttant contre les turbulences du train et le vent relatif. Des cascadeurs sautent de l'appareil pendant qu'il est posé sur la cible mouvante. Aucune image de synthèse n'a été utilisée pour le contact entre l'hélicoptère et le train, garantissant une interaction physique réaliste (vibrations, poids) impossible à simuler parfaitement.
2.4 L'art de la couture invisible : les 49 coupes
Bien que vendu comme un « One Shot », le plan est techniquement un « montage invisible » composé de multiples segments cousus ensemble. Selon les analyses détaillées et les propos de l'équipe VFX, la séquence est un assemblage de 99 plans distincts (shots) fusionnés pour n'en former qu'un. Ces segments varient d'une durée de 30 secondes à plus d'une minute trente.
On dénombre environ 49 coupes cachées (stitches) principales. L'expertise du studio Digital Domain a été cruciale pour rendre ces transitions imperceptibles. Voici une typologie des techniques utilisées :
Typologie des Transitions Invisibles dans Extraction 2
Body Crossing (Passage Corps) Un figurant passe devant l'objectif, obstruant la vue momentanément.
Dans la cour de prison, un prisonnier court devant la caméra, permettant de changer de prise.
Whip Pan (Panoramique Filé) Mouvement de caméra très rapide créant un flou de mouvement (motion blur). Lors des combats rapprochés, la caméra pivote violemment d'un ennemi à l'autre.
Object Masking (Masquage) La caméra passe derrière un mur, une porte, ou le dos d'un personnage sombre.
Le passage à travers la porte de la cellule au début ; le dos de la veste en cuir d'un ennemi.
Seamless Stitching VFX Morphing numérique et reprojection de décors pour lier deux mouvements non raccords. La transition entre le saut du train et l'atterrissage au sol; les changements d'environnement (intérieur/extérieur voiture).
Face Replacement (Charlatan) Remplacement du visage d'un cascadeur par celui de l'acteur via IA.
Utilisé lors des cascades trop dangereuses pour Hemsworth, permettant une transition fluide sans couper.
2.5 L'architecture sonore : xixer le chaos
Le son est le ciment invisible qui tient l'édifice visuel. Sans une continuité sonore parfaite, l'illusion visuelle s'effondrerait. Alex Belcher, co-compositeur, et l'équipe de mixage ont dû relever des défis uniques pour ce format.
Le Chapitrage Musical : Dans un montage classique, la coupe visuelle signale le changement de scène. Ici, c'est la musique qui doit assumer ce rôle structurel. Elle évolue pour indiquer au spectateur que nous passons de l'infiltration (tension basse) à l'action (tension haute).
L'Usage Narratif du Silence : Un choix de mixage audacieux intervient au moment où Rake pénètre dans la cour principale de la prison. La musique s'arrête net. Elle laisse place à ce que Belcher appelle un « mur chaotique de cacophonie » : cris, coups, bruits de chair, explosions. Ce retrait de la musique "héroïque" ancre la scène dans un réalisme documentaire brutal. Le spectateur n'est plus protégé par une bande-son hollywoodienne; il est exposé à la crudité de la violence.
Dolby Atmos : Le mixage spatialisé est essentiel pour maintenir l'orientation du spectateur. Puisqu'on ne peut pas couper pour montrer un hélicoptère arrivant par la droite, le son doit placer cet hélicoptère dans l'espace 3D de la salle de cinéma avant qu'il n'entre dans le champ visuel. Le son guide le regard et prépare les mouvements de caméra.
Partie III : longueur — la chronobiologie d'une séquence
La durée précise de 21 minutes et 7 secondes n'est pas anecdotique. Elle transforme la nature même de la scène. Analyser la longueur, c'est comprendre comment le film manipule le temps subjectif et gère l'endurance attentionnelle du public sur une durée qui excède largement les standards physiologiques de l'excitation (généralement des séquences de 3 à 5 minutes).
3.1 Anatomie temporelle : une structure en trois actes
Contrairement à une scène d'action classique qui est un moment dans un acte, ce plan séquence est un film dans le film, possédant sa propre structure dramatique complète. On peut découper ces 21 minutes en trois mouvements symphoniques distincts :
Mouvement I : l'enfer carcéral (approx. 00:00 - 08:30)
Tonalité : Claustrophobie, chaos, combat rapproché (CQC).
Dynamique : Cela commence par une infiltration tendue (Stealth) dans les sous-sols, monte en pression avec la découverte, et explose dans la cour (Riot).
Enjeu Temporel : La densité de l'action est maximale ici. La caméra est collée aux corps. Le temps semble se dilater sous l'effet du stress et de la multitude d'adversaires. C'est l'épreuve de l'étouffement.
Mouvement II : la chasse véhiculaire (approx. 08:30 - 14:00)
Tonalité : Vitesse, ouverture spatiale, mécanique.
Dynamique : La sortie de la prison marque une respiration visuelle (passage du gris de la pierre au blanc de la neige et au vert de la forêt). C'est la poursuite en voitures et motos.
Enjeu Temporel : Le rythme s'accélère mécaniquement (vitesse des moteurs). La caméra devient plus fluide, plus aérienne. C'est une phase de transition cinétique qui permet au spectateur de reprendre son souffle par rapport à l'oppression de la prison.
Mouvement III : le train de la survie (approx. 14:00 - 21:07)
Tonalité : Linéarité, verticalité, climax.
Dynamique : L'action se confine à nouveau sur un axe unique (le train). L'arrivée des menaces aériennes (hélicoptères) ajoute une dimension verticale.
Conclusion : Le déraillement final du train agit comme un point d'orgue. C'est le seul moment où le film peut s'arrêter. Le crash offre la rupture nécessaire pour justifier le retour au noir et à la coupe.
3.2 La gestion des « micro-respirations »
Un plan de 21 minutes d'intensité maximale continue serait insoutenable pour le spectateur (phénomène de viewer fatigue). Le génie du montage interne réside dans l'intégration de « zones de calme » ou « safe rooms ».
Les moments de latence : Observez bien la séquence : il y a des plages de 10 à 30 secondes où Tyler Rake ne se bat pas. Il conduit, il recharge une arme, il aide les enfants à monter une échelle, il vérifie une blessure.
Fonction physiologique : Ces instants permettent au rythme cardiaque du spectateur de redescendre légèrement. Ils réinitialisent l'attention pour que le prochain pic de violence soit à nouveau impactant. Sans ces vallées, les sommets de l'action perdraient leur relief.
Développement in-situ : Ces pauses permettent aussi de micro-développements narratifs. La relation entre Rake et Nik (Golshifteh Farahani) ou la mère (Ketevan) se construit dans ces regards échangés au milieu du chaos. La longueur permet d'observer la peur et la détermination s'installer sur les visages en temps réel.
3.3 Comparaison benchmark : l'échelle de la surenchère
Pour saisir la démesure de ces 21 minutes, il convient de les placer sur l'échelle historique du plan séquence d'action.
Tableau Comparatif des Plans-Séquences d'Action Majeurs
Oldboy 200 33 min, Combat couloir (marteau)Plan latéral, peu de coupes cachées.
Les Fils de l'homme 2006 6 min, Zone de guerre urbaine, Caméra portée complexe, immersif.
Atomic Blonde 2017 10 min, Escalier / Appartement, Combats multiples, coutures invisibles.
Extraction 1 2020 11 min 30, Poursuite urbaine / Voiture, Introduction du style "drone".
Extraction 2 2023 21 min 07, Prison / Forêt / Train, Complexité logistique multipliée par trois.
Extraction 2 ne joue plus dans la même cour. Il double presque son propre record. Il s'approche des durées expérimentales de films comme Victoria (138 min) ou 1917 (119 min), mais avec une densité pyrotechnique infiniment supérieure. Là où 1917 utilise la marche pour temporiser, Extraction 2 remplit chaque minute d'une chorégraphie complexe.
3.4 Le réalisme par l'épuisement
Enfin, la longueur sert un objectif de réalisme paradoxal. Dans un film monté (type Taken ou Bond), le héros semble inépuisable car les coupes masquent ses temps de récupération. Ici, au bout de 15 ou 20 minutes, Tyler Rake est visiblement détruit. Il boite, ses coups sont moins précis, il respire lourdement.
Cette fatigue n'est pas seulement jouée ; elle est réelle pour Chris Hemsworth. L'acteur endure vraiment des prises de plusieurs minutes. La longueur du plan force l'apparition de la vérité physiologique : l'épuisement de l'acteur déteint sur le personnage. Le spectateur "croit" à la survie du héros non pas parce qu'il est invincible, mais parce qu'il l'a vu souffrir chaque seconde de l'effort nécessaire pour rester en vie. La durée devient la preuve de l'exploit.
Conclusion
Le plan séquence de 21 minutes d’Extraction 2 est un objet cinématographique total qui marquera la décennie. Il ne doit pas être vu comme un simple gadget marketing ou une démonstration de vanité technique, mais comme l'aboutissement logique d'une quête d'immersion débutée avec le jeu vidéo moderne et le cinéma de la sensation.
En analysant son objectif, nous avons compris qu'il opère une fusion entre la mythologie de la renaissance et l'esthétique haptique, transformant le spectateur en témoin charnel de l'action.
L'étude des coulisses a révélé une ingénierie de l'extrême, où l'artisanat traditionnel (le feu, les hélicoptères, les 400 figurants) est sublimé par une technologie de pointe (les coutures invisibles, le Dolby Atmos, le matériel caméra innovant). C'est le triomphe du « phygital » (physique + digital).
Enfin, l'analyse de sa longueur a démontré une maîtrise sophistiquée du temps, utilisant la durée comme une arme d'épuisement empathique, forçant le respect par la simple endurance.
Sam Hargrave et les frères Russo ont posé avec ce film une nouvelle borne kilométrique. Si le cinéma d'action a longtemps cherché à cacher l'effort par le montage, Extraction 2 fait le pari inverse : exposer l'effort dans sa continuité absolue. La question qui se pose désormais à l'industrie est vertigineuse : après 21 minutes, quelle est la prochaine étape? Le film d'action en plan séquence intégral est-il l'horizon indépassable, ou cette technique atteindra-t-elle bientôt son point de saturation narrative? Quoi qu'il en soit, Tyler Rake a prouvé que pour survivre à l'enfer, il ne faut jamais s'arrêter de tourner.