Nvidia DLSS 3 à l’essai : que vaut la nouvelle technologie d’upscale intelligent des GeForce RTX 40 ?

Depuis quelques années maintenant, le DLSS est devenu l’un des points différenciants les plus réputés et appréciés des processeurs graphiques RTX de Nvidia. En reconstruisant une image à définition donnée à partir d’un rendu 3D à définition plus basse (rendu interne en 1440p ou 1080p pour une image finale en 2160p, par exemple), il permet de gagner significativement en performance, en échange d’une dégradation de la qualité d’image extrêmement mineure, voire pratiquement inexistante, grâce à la sophistication des algorithmes d’intelligence artificielle chargée de réaliser la mise à l’échelle.

Mais avec sa nouvelle génération de GPU Ada Lovelace (RTX 40), Nvidia fait encore passer sa technologie à un niveau supérieur. Le DLSS 3 ajoute en effet une dimension temporelle au sur-échantillonnage effectué : il n’est plus seulement capable “d’ajouter des pixels” à chaque image constituant le flux vidéo, mais même d’interpoler des images complètes venant s’intercaler entre les trames calculées de manière traditionnelle par le GPU. Il fait pour cela usage de vecteurs de mouvement, d’une analyse poussée du “flux optique” de l’image, et bien sûr là encore d’inférence par apprentissage profond, pour réaliser cette interpolation avec autant de précision et de rapidité que possible. Le résultat final tient-il la route, et qu’a-t-on à gagner en jeu ? Faisons le point…

La carte graphique Gainward GeForce RTX 4090 Phantom GS

La carte utilisée pour les tests de performances illustrant cet article : la Gainward RTX 4090 Phantom GS

Performances : plus d’images par seconde, et un CPU ménagé

Cette nouvelle dimension temporelle du traitement, baptisée Frame Generation par Nvidia, fonctionne de façon complémentaire, mais parfaitement indépendante de sa composante spatiale (Super Resolution), cette dernière adoptant exactement le même fonctionnement qu’avec le DLSS 2 que l’on connaît déjà. Dans la nomenclature Nvidia, le terme DLSS 3 correspond à l’agrégation de ces deux technologies, ce qui permet à l’entreprise d’annoncer de gains de performance parfois faramineux, jusqu’à un facteur 4 dans le cas de titres avec ray-tracing particulièrement gourmands (Cyberpunk 2077, pour ne pas le nommer). Il est toutefois intéressant d’analyser ici uniquement la partie Frame Generation — que tous les titres DLSS 3 permettent d’activer seule, sans Super Resolution —, afin de bien isoler et comprendre ses apports concrets.

Publicité, votre contenu continue ci-dessous

Cyberpunk 2077 dans son futur mode graphique RT Overdrive avec DLSS 3 sur RTX 4090

Cyberpunk 2077 recevra prochainement une mise à jour lui apportant le mode graphique “RT Overdrive”, dans lequel l’intégralité des éclairages du jeu, sans exception, seront rendus par ray-tracing. Le DLSS 3 sera alors indispensable, même avec une RTX 4090, pour atteindre un framerate acceptable.

© CD Projekt / Nvidia

Comparaison Cyberpunk 2077 avec et sans DLSS 3

Pour ce genre de comparaison, Nvidia combine les gains de performance liés à la Super Resolution et à la Frame Generation du DLSS 3. Dans cet article, nous faisons le choix assumé de nous concentrer exclusivement sur la seconde.

© CD Projekt / Nvidia

Autant donc commencer par le commencement : quels gains de performances peut-on espérer en activant la Frame Generation ? D’un point de vue purement théorique, on pourrait au maximum atteindre une cadence d’image multipliée par deux, puisque pour chaque image calculée traditionnellement par le GPU, une image interpolée est ajoutée au flux vidéo final. La pratique n’est évidemment pas tout à fait aussi rose, puisque cette interpolation monopolise elle aussi quelques cycles d’horloge. En moyenne, sur les titres que nous avons pu tester, le framerate à tout de même bondi de 40 %.

Nvidia DLSS 3 à l'essai : que vaut la nouvelle technologie d'upscale intelligent des GeForce RTX 40 ?

Le gain peut même être encore très sensiblement plus spectaculaire que cela lorsque l’on part d’une situation où les performances sont bridées par le CPU et non le GPU. En effet, les images interpolées ne nécessitent absolument aucune simulation supplémentaire, et la Frame Generation ne place donc aucune surcharge sur le processeur central. Sur des titres comme Microsoft Flight Simulator et A Plague Tale: Requiem (deux productions du studio bordelais Asobo !), très exigeants envers le processeur central, nous avons pu constater des gains allant jusqu’à 80 % en associant notre RTX 4090 de test à un AMD Ryzen 7 5800X — un processeur ordinairement très compétent pour le jeu, mais qui se laisse tout de même facilement déborder par un GPU aussi démesurément rapide.

Publicité, votre contenu continue ci-dessous

Microsoft Flight Simulator en 4K réglages Ultra sur RTX 4090, avec DLSS 3 Frame Generation

Dans Flight Simulator, le survol d’une grande ville comme Paris est extrêmement demandeur pour le CPU.

© Microsoft

Comparatif Microsoft Flight Simulator avec et sans DLSS 3 Frame Generation sur RTX 4090

FG = Frame Generation. Encadré en rouge : taux d’occupation du GPU.

© Microsoft

A Plague Tale Requiem en 4K, réglages Ultra, sur RTX 4090 avec DLSS 3 Frame Generation

Dans A Plague Tale: Requiem, cette scène de marché demande de nombreuses simulations mettant à l’épreuve le processeur central.

© Focus Entertainment

Comparatif A Plague Tale Requiem avec et sans DLSS 3 Frame Generation sur RTX 4090

Rendu visuel : quelques anomalies, mais très difficiles à percevoir en pratique

Juger et rendre compte de la qualité visuelle d’un tel algorithme d’interpolation est un exercice périlleux, dans la mesure où ce jugement ne peut se faire que sur une image à vitesse réelle. Des images fixes, ou même au ralenti, peuvent être parlantes quant aux rouages internes du traitement, mais pas quant au ressenti visuel réel devant l’image en mouvement finale, dans laquelle les trames interpolées sont alternées avec des trames traditionnelles par essence immaculées ; elles correspondent à la “vérité terrain” dont l’algorithme d’inférence par apprentissage profond doit s’approcher au maximum.

Ce préambule étant clairement exposé, risquons-nous tout de même à analyser quelques images interpolées isolées, pour comprendre quelles sont les potentielles faiblesses du traitement. Le premier cas, le plus évident, est celui des changements de plan. Au moment d’une coupe, on comprend aisément que l’interpolation du mouvement des objets composant la scène n’a soudain plus aucun sens. Un changement de caméra dans F1 22, ou une coupe pendant une cinématique de A Plague Tale: Requiem s’en font l’exemple : ils s’accompagnent chaque fois d’une image “cassée” isolée.

Publicité, votre contenu continue ci-dessous

EA Sports F1 22 avec DLSS 3 Frame Generation

Un coup d’œil en arrière sur la grille de départ dans F1 22

© Electronic Arts

A Plague Tale Requiem avec DLSS 3 Frame Generation

Une coupe dans une cinématique de A Plague Tale: Requiem

© Focus Entertainment

La Frame Generation est également mise en difficulté par les transparences. Qu’il s’agisse d’éléments 2D (éléments d’interface mobiles) ou 3D (les voitures fantômes en mode contre-la-montre dans F1 22), des petites distorsions sont parfois à noter.

Interpolation d'image dans F1 22

Sur l’image interpolée, notez la distorsion de la partie de la ligne de trajectoire apparaissant en transparence à travers la voiture fantôme.

© Electronic Arts

Marvel's Spider-Man Remastered avec DLSS 3 Frame Generation

© Marvel / Sony Interactive Entertainment

Enfin, les phénomènes d’occlusion peuvent également créer de petites incohérences. Lorsqu’un objet passe derrière un autre le temps de quelques images, puis qu’il réapparaît ensuite, l’algorithme est alors chargé de deviner son apparence pour la reproduire correctement ; une tâche sensiblement plus ardue qu’un simple déplacement d’objet d’une image à l’autre. Des petites incohérences peuvent alors se produire.

Image interpolée par DLSS 3 Frame Generation dans Marvel's Spider-Man Remastered

Dans Spider-Man Remastered, sur cette image interpolée pendant un balancement à toute vitesse, l’algorithme d’inférence s’emmêle les pinceaux entre l’obélisque au premier plan et le bâtiment au fond, qui était précédemment occulté par ce même obélisque.

© Marvel / Sony Interactive Entertainment

Publicité, votre contenu continue ci-dessous

On se doit de le répéter, toutes ces anomalies doivent être vues à titre purement informatif. En jeu, elles se révèlent pratiquement imperceptibles, du fait de leur durée d’affichage extrêmement courte… en tout cas aux framerate faramineux produits par la RTX 4090. On y reviendra.

La question de la latence

Un autre prix peut-être plus inattendu, mais finalement extrêmement logique, est à payer pour l’activation de la Frame Generation : celui de la latence. La cause de cela est le fait qu’une image interpolée l’est non seulement à partir de celle qui la précède, mais aussi de celle qui la suit. Illustrons cela par une séquence de trois images démarrant par une image traditionnelle : avant que l’image 2 puisse commencer à être interpolée, l’image 3 doit d’ores et déjà avoir été complètement rendue par le GPU ; pendant tout ce temps, c’est encore l’image 1 qui est affichée à l’écran. De fait, la chaîne de rendu doit constamment garder au moins deux images en mémoire tampon — d’où le surplus de latence.

Pour compenser cela, Nvidia impose l’utilisation, en tandem avec le DLSS 3, de sa technologie Reflex, qui a pour principe de synchroniser au mieux les calculs effectués par le CPU et le GPU, précisément pour minimiser tant que possible la latence système. Le résultat est globalement probant, puisque la combinaison Frame Generation + Reflex arrive généralement au moins à une latence système proche de ce que l’on obtient sans activer aucune de ces technologies ; et la réactivité des commandes reste donc tout à fait acceptable. Il reste cependant toujours possible d’activer Reflex sans Frame Generation, ce qui donnera toujours les meilleurs résultats sur cette métrique. C’est toujours le meilleur choix à faire pour les jeux compétitifs — mais il est en revanche beaucoup moins critique, bien sûr, pour un titre tel que Flight Simulator.

Publicité, votre contenu continue ci-dessous

Toutes les mesures ci-dessous ont été réalisées avec rendu en 4K natif, préréglage graphique “ultra” (avec ray-tracing dans les cas de Cyberpunk 2077 et Spider-Man Remastered).

Cyberpunk 2077 Reflex off Reflex on
DLSS off 88 ms 52 ms
Frame Generation on 68 ms
Microsoft Flight Simulator Reflex off Reflex on
DLSS off 37 ms 31 ms
Frame Generation on 58 ms
A Plague Tale: Requiem Reflex off Reflex on
DLSS off 50 ms 35 ms
Frame Generation on 49 ms
Spider-Man Remastered Reflex off Reflex on
DLSS off 52 ms 37 ms
Frame Generation on 53 ms

Qu’est-ce que cela pourrait donner avec une carte moins rapide ? L’expérience A Plague Tale: Requiem en 6K

Tous les résultats exposés dans cet article jusqu’à présent sont valables pour des jeux effectuant leur rendu interne en 4K natif, et uniquement bien sûr pour la GeForce RTX 4090, seul GPU Ada Lovelace disponible à ce jour — en attendant la RTX 4080 prévue le 16 novembre 2022. Il est évident que tout cela méritera d’être réévalué en profondeur lorsque sortiront les GPU beaucoup plus modestes de la gamme, ceux pour qui le DLSS 3 aura le plus de sens, et ne servira pas simplement à pousser des framerates déjà très élevés vers des valeurs encore plus faramineuses. Mais pour déjà nous faire une idée de ce que la chose pourrait donner, nous nous sommes lancés dans une petite expérience : faire tourner A Plague Tale: Requiem, un titre graphiquement très ambitieux et extrêmement gourmand, en définition 6K native (5760 x 3240 px), en réglages graphiques “ultra”. Même la surpuissante 4090 doit alors se contenter d’un framerate, sans Frame Generation, errant entre 30 et 40 i/s — des valeurs qui nous paraissent dignes d’un GPU de milieu/haut de gamme en conditions “normales”. Comment s’en sort alors l’interpolation ?

Sans surprise, elle est moins à son aise. Côté performances, le contrat est rempli : l’activation de la Frame Generation suffit à nous approcher de la ligne bénie des 60 i/s — sans toutefois l’atteindre en permanence. En revanche, les erreurs d’inférence se font soudain un peu plus dérangeantes. D’une part, la persistance plus longue de chaque image à l’écran fait que les anomalies se perçoivent un peu plus facilement à l’œil comme des formes de saccades ; d’autre part, le pas d’animation plus long entre chaque image générée traditionnellement rend le processus d’interpolation plus complexe, amplifiant donc sensiblement les anomalies. Celles-ci commencent d’ailleurs à se propager vers certains effets de post-processing, comme le flou de mouvement.

Publicité, votre contenu continue ci-dessous

A Plague Tale Requiem en 6K natif avec DLSS 3 Frame Generation sur RTX 4090

La mauvaise interaction de la Frame Generation avec le flou de mouvement cause cette fois des artefacts très présents sur tout l’écran, et rend les rotations de caméra très visiblement “bruitées”.

© Focus Entertainment

A Plague Tale Requiem en 6K natif avec DLSS 3 Frame Generation sur RTX 4090

Le problème est un peu moins prononcé sans flou de mouvement, mais il est tout de même toujours présent.

© Focus Entertainment

Des débuts prometteurs, mais à confirmer

Il apparaît donc clairement que la Frame Generation du DLSS 3 est une technologie fascinante et extrêmement prometteuse, dont l’activation s’avère déjà très bénéfique dans certaines situations. Ces situations se font toutefois relativement peu nombreuses pour l’instant, en particulier bien sûr en raison du faible nombre de jeux compatibles à l’heure où nous écrivons ces lignes — le lot de toute nouvelle technologie dans ses premiers jours d’existence. Il faudra donc continuer à l’observer dans les prochains mois, voire années, à mesure non seulement que seront lancés les GPU de gamme inférieure dans la lignée Ada Lovelace, mais aussi à mesure que Nvidia mettra à jour les algorithmes d’inférence au cœur du traitement. Car si l’on en croit les profondes métamorphoses connues par le DLSS Super Resolution depuis sa toute première itération en 2018, il ne fait aucun doute que le DLSS Frame Generation est aujourd’hui très loin de sa forme finale.

Publicité, votre contenu continue ci-dessous

We would like to thank the author of this write-up for this awesome material

Nvidia DLSS 3 à l’essai : que vaut la nouvelle technologie d’upscale intelligent des GeForce RTX 40 ?

Our social media profiles here , as well as other pages on related topics here.https://www.ai-magazine.com/related-pages/