Nvidia привлекла внимание на выставке CES 2025, анонсировав RTX 5090, и, несмотря на многочисленные споры по поводу цены карты в 2000 долларов, она приносит с собой много новых технологий. Главным из них является DLSS 4, который обеспечивает многокадровую генерацию графических процессоров Nvidia и обеспечивает четырехкратное увеличение производительности в более чем 75 играх после запуска новых графических процессоров Nvidia RTX 50-й серии.
Однако я видел слишком много недоразумений относительно того, как на самом деле работает DLSS 4. Учитывая вводящие в заблуждение комментарии генерального директора Nvidia и радикальное изменение принципа работы DLSS, неудивительно, что циркулирует дезинформация о новой технологии, ее возможностях и, что наиболее важно, ее ограничениях.
Итак, давайте внесем ясность, по крайней мере, насколько я могу, прежде чем появятся новые видеокарты Nvidia, и мы все на собственном опыте испытаем то, что может предложить DLSS 4.
Получайте еженедельную информацию о технологиях, лежащих в основе компьютерных игр.
Нет, он не «предсказывает будущее».
Одна из основных проблем с правильным пониманием того, как работает DLSS 4, связана с комментарием, сделанным генеральным директором Nvidia Дженсеном Хуангом во время сеанса вопросов и ответов. Джаред Уолтон вон там Оборудование Тома Хуанг спросил, как DLSS 4 работает на техническом уровне, и Хуан категорически отрицал, что DLSS 4 использует интерполяцию кадров. Он сказал, что DLSS 4 «предсказывает будущее», а не «интерполирует прошлое». Это, конечно, яркая цитата. Жаль, что это неправильно.
В прошлом Хуанг поэтично высказывался о генерации кадров DLSS, и хотя этот тип кадрирования полезен для объяснения такой технологии, как DLSS 4, широкой аудитории, он также приводит к некоторым недоразумениям относительно того, как она на самом деле работает. После этой цитаты со мной связались несколько читателей и сказали, что я неправильно понимаю, как работает DLSS 4. Как оказалось, я не понимаю, как это работает, но понимаю, почему возникает такая путаница.
Генерация нескольких кадров в DLSS 4 использует метод, называемый интерполяцией кадров. Это тот же метод, который мы видели в DLSS 3, и тот же метод, который вы найдете в других инструментах генерации кадров, таких как масштабирование без потерь и AMD FSR 3. Интерполяция кадров работает следующим образом: ваша видеокарта визуализирует два кадра, а затем алгоритм вычисляет разницу между этими кадрами. Затем он «генерирует» промежуточный кадр и угадывает, как будет выглядеть промежуточный кадр, основываясь на разнице между двумя визуализированными кадрами.
А DLSS 4 использует интерполяцию кадров. Были проведены некоторые ранние исследования новых методов генерации кадров, в частности исследования Intel по экстраполяции кадров, но эта технология все еще находится в зачаточном состоянии. Есть некоторые подробности, которыми я пока не могу поделиться, но теперь я подтвердил из нескольких источников, что DLSS 4 действительно использует интерполяцию кадров. Это также имеет смысл. Эти типы инструментов рендеринга не появляются просто так из ниоткуда, и почти всегда требуется долгий объем исследований, прежде чем новая техника рендеринга станет рыночным продуктом, таким как DLSS 4.
Это не умаляет возможностей DLSS 4. Он может использовать ту же технику, что и DLSS 3, для создания новых кадров, но это не должно отвлекать вас от того, на что на самом деле способен DLSS 4.
Задержка — это не проблема, о которой вы думаете
Я понимаю, почему Nvidia не хочет много комментировать использование интерполяции кадров в DLSS 4. Это связано с тем, что интерполяция кадров приводит к задержке. Вам необходимо визуализировать два кадра, а затем выполнить интерполяцию, прежде чем появится первый кадр в последовательности. Поэтому, когда вы используете инструмент интерполяции кадров, вы, по сути, играете с небольшой задержкой. Я видел предположение, что эти дополнительные кадры линейно увеличивают задержку, но это не так.
The Verge выразил обеспокоенность Он хочет «посмотреть, как новая технология генерации кадров влияет на задержку». TechSpot объясняет что «пользователи опасаются, что многокадровый рендеринг может усугубить проблему». [latency] Проблема». Это естественная противоположность умножению «ложных» кадров, которые может выдавать DLSS 4. Если генерация одного кадра вызывает проблему с задержкой, то генерация трех кадров наверняка вызовет еще большую проблему с задержкой. Но это не так.
Вот почему так важно понимать, что DLSS 4 использует интерполяцию кадров. Идея игры с задержкой ничем не отличается между DLSS 3, производящим дополнительный кадр, и DLSS 4, производящим три дополнительных кадра — процесс по-прежнему включает в себя рендеринг двух кадров и сравнение различий между ними. Задержка существенно не увеличится, если вы вставите один, два или три дополнительных кадра между двумя визуализированными кадрами. Независимо от количества кадров между ними, задержка, добавляемая процессом интерполяции кадров, в основном одинакова.
Позвольте мне проиллюстрировать это. Допустим, вы играете в игру со скоростью 60 кадров в секунду (fps). Это означает, что между каждым кадром, который вы видите, проходит 16,6 миллисекунды. С DLSS 3 ваша частота кадров удвоится до 120 кадров в секунду, но задержка не уменьшится вдвое до 8,3 мс. Игра выглядит более плавной, но между каждым отрисованным кадром все равно остается 16,6 мс. С DLSS 4 вы можете получить до 240 кадров в секунду, что увеличивает частоту кадров в четыре раза, но задержка опять же не падает до 4,2 мс. Это все те же 16,6 мс.
Это очень уменьшенный взгляд на задержку ПК — существуют накладные расходы на генерацию кадров DLSS, а также задержка, добавляемая вашим монитором и мышью — но это полезно для понимания того, что задержка ядра не увеличивается линейно по мере добавления большего количества кадров к Процесс интерполяции кадров. Время между каждым визуализированным кадром не меняется. Задержка, с которой вы сталкиваетесь, по-прежнему во многом является результатом вашей базовой частоты кадров до генерации кадров DLSS и накладных расходов, которые имеет инструмент.
Вам не нужно просто верить мне на слово. Digital Foundry протестировала DLSS 4, включая задержку, и обнаружила именно то, что я только что описал. «Мне кажется, что большая часть дополнительной задержки по-прежнему связана с буферизацией этого дополнительного кадра, но добавление большего количества промежуточных кадров приводит к относительно минимальному увеличению задержки», — написал он. Ричард Ледбеттер из Digital Foundry. Небольшая дополнительная задержка обусловлена просто тем, что DLSS вычисляет больше кадров между двумя визуализированными кадрами, поэтому большая часть увеличения задержки в DLSS 4 существенно не отличается от DLSS 3.
Проблема с задержкой в DLSS 4 во многом такая же, как и в DLSS 3. Когда вы играете с низкой базовой частотой кадров, возникает несоответствие между вашим откликом и трением, которое вы видите. Это нарушение будет еще более значительным с появлением DLSS 4, но это не означает, что в результате произойдет резкое увеличение задержки. Вот почему впечатляющий новый Reflex 2 от Nvidia не нужен для DLSS 4; Как и в случае с DLSS 3, разработчикам нужно реализовать только первую версию Reflex, чтобы DLSS 4 работал.
Совершенно новая модель
Объясняя, как работает DLSS 4, вы можете подумать, что это одно и то же, но это не так. DLSS 4 — это очень существенное отличие от DLSS 3, потому что здесь используется совершенно другая модель искусственного интеллекта. Или лучше сказать: модели искусственного интеллекта. Как заявляет НвидиаDLSS 4 при использовании суперразрешения, реконструкции лучей и многокадровой генерации запускает пять отдельных моделей искусственного интеллекта для каждого визуализируемого кадра, каждая из которых должна выполняться в течение миллисекунд.
Из-за того, что дает DLSS 4, Nvidia отказалась от своей предыдущей нейронной сети Convolution (CNN) и теперь использует модель Vision Transformer. В модели трансформатора есть два основных изменения. Во-первых, есть то, что называется «вниманием к себе». Модель может отслеживать значение разных пикселей в нескольких кадрах. Такая самореференция должна позволить новой модели больше сосредоточиться на проблемных областях, таких как: Например, тонкие детали со сверхвысоким разрешением, которые могут мерцать.
Модели-трансформеры также более масштабируемы, что позволяет Nvidia добавлять в DLSS гораздо больше параметров, чем предыдущий подход CNN. По данным компании, новая модель трансформера имеет даже вдвое больше параметров.
Как вы можете видеть на видео выше, Nvidia утверждает, что эта новая модель обладает большей стабильностью и сохранением мелких деталей по сравнению с предыдущим подходом CNN. Эти улучшения касаются не только графических процессоров серии RTX 50. Все видеокарты RTX могут использовать новую модель Transformer в играх DLSS 4, по крайней мере, для функций, поддерживаемых каждым поколением.
Я видел DLSS 4 в действии несколько раз, но настоящим испытанием этой функции станет запуск графических процессоров Nvidia следующего поколения. Затем я могу оценить, как эта функция работает в нескольких играх и сценариях, чтобы увидеть, как она работает. Тем не менее, в эту функцию внесено много изменений, и, согласно заявлению Nvidia, эти изменения помогут сделать DLSS еще лучше.