در جریان نمایشگاه CES 2025، دیجیتال فاندری با برایان کاتانزارو، معاون تحقیقات یادگیری عمیق کاربردی انویدیا، در مورد معرفی DLSS 4 و ویژگیهای جدید آن در زمینههای Super Resolution ،Ray Reconstruction و Frame Generation مصاحبه کرد.
بنظر میرسد پشتیبانی از تولید فریم برای کارت گرافیکهای RTX 30 انویدیا یکی از راهکارهای استراتژیک جدید انویدیا برای سال 2025 میباشد که میتوان به آن امیدوار بود.
کاتانزارو در مورد مدلهای جدید ترنسفورمر صحبت کرد که جایگزین شبکههای عصبی کانولوشنی (CNN) برای قابلیتهای Super Resolution و Ray Reconstruction شدهاند، توضیح داد. وی افزود: این مدلها به مراتب هوشمندتر از گذشته هستند، میتوان آنها را با استفاده از مجموعه دادههای بزرگتر آموزش داد، و در نتیجه باعث میشود تصمیمات بهتری اتخاذ کنند، که به رفع مشکلات پیشین DLSS، مانند لرزش یا ایجاد تصاویر شبحوار کمک میکنند. به عنوان مثال، مدل جدید Super Resolution انویدیا نسبت به نسخه قبلی چهار برابر قدرت محاسباتی بالاتری دارد. کاتانزارو تخمین دقیقی از افزایش زمان رندر ارائه نداد، اما گفت که انویدیا معتقد است این روش، بهترین تجربه بازی را روی کارتهای گرافیک جدید GeForce RTX 50 با معماری Blackwell است، که تا آواخر ماه جاری میلادی وارد بازار میشوند، ارائه خواهد داد.
- هم اکنون بخوانید: استاندارد HDMI 2.2 و استاندارد DisplayPort 2.1b معرفی شدند
انویدیا در نسل جدید با چه چالشهایی طرف بوده است!
پشتیبانی از تولید فریم (Frame Generation) در حال بازسازی است و مدل قبلی مبتنی بر شتابدهنده سختافزاری جریان نوری (Optical Flow) را کنار گذاشته و جای خود را به یک راهحل کاملا مبتنی بر هوش مصنوعی داده است. در ادامه دلایل انویدیا برای انجام این کار را بررسی خواهیم کرد:
زمانی که Nvidia DLSS 3 Frame Generation را طراحی کردیم، برای محاسبه جریان نوری (Optical Flow) به شتابدهی سختافزاری نیاز داشتیم. ما به اندازه کافی هستههای تنسور (Tensor Core) نداشتیم و الگوریتم جریان نوری ما به اندازه کافی خوب نبود. ما هیچ الگوریتم جریان نوری بی وقفه (real-time) که روی هسته تنسور اجرا شود و متناسب با بودجه محاسباتی ما باشد، نداشتیم. در عوض، شتابدهنده Optical Flow را داشتیم که انویدیا سالهاست به عنوان تکامل فناوری رمزگذاری ویدیویی خود توسعه داده بود، و همینطور در شتابدهندههای بینایی ماشین برای خودروهای خودران استفاده میشد.
برایان کاتانزارو در ادامه افزود: استفاده از این شتابدهنده در DLSS Frame Generation برای ما منطقی به نظر میرسید، اما مشکل پیاده سازی هر الگوریتم سختافزاری مانند جریان نوری (Optical Flow) این است که بهبود آن بسیار دشوار است. در واقع، محدودیتهای آن مشخص است و شکستهایی که از شتابدهنده جریان نوری ناشی میشد، را نمیتوانستیم با استفاده از یک شبکه عصبی هوشمندتر اصلاح کنیم. تا زمانی که تصمیم گرفتیم، تولید فریم در DLSS 4 را به طول کامل بر اساس هوش مصنوعی بسازیم.
مدل جدید تولید فریم (Frame Generation) حالا بیشتر از قبل به هستههای تنسور وابسته است، اما از VRAM کمتری استفاده میکند، و در نتیجه کیفیت تصویر بهتری ارائه میدهد. (که کاتانزارو آن را بسیار مهم، بهویژه برای قابلیت تولید فریم چندگانه (Multi Frame Generation) موجود در پردازندههای گرافیکی RTX 50 جدید، دانست) و همچنین از نظر کارایی پیشرفت داشته است، زیرا هزینه محاسباتی آن بین چندین فریم تقسیم میشود.
آیا DLSS 4 بصورت بروزرسانی برای RTX 30 عرضه میشود!
آلکس باتالیای دیجیتال فاندری از برایان کاتانزارو پرسید: آیا میتوان مدل جدید DLSS را به سختافزارهای قدیمیتر مانند سری GeForce RTX 30 منتقل کرد یا خیر، و رئیس بخش DLSS انویدیا ( کاتانزارو) این احتمال را رد نکرد! و توضیح داد:
من فکر میکنم این بیشتر یک مسئله بهینهسازی و مهندسی است و در نهایت به تجربه کاربری بستگی دارد. ما این فناوری تولید فریم را، که بهترین فناوری تولید فریم چندگانه (Multi Frame Generation) است، را با سری 50 عرضه میکنیم و خواهیم دید که در آینده قادر به دستیابی به چه نتایجی بر روی سختافزارهای قدیمیتر هستیم.
به عنوان یادآوری، انویدیا وقتی فناوری تولید فریم را برای کارتهای گرافیک سری RTX 40 معرفی کرد، کاتانزارو اشاره کرده بود که این ویژگی به دلیل داشتن شتابدهندهی سختافزاری جریان نوری بهتر، نسبت به سری RTX 30، مخصوص کارت گرافیکهای جدید است. اما بهطور تئوری امکان انتقال این فناوری به کارتهای قدیمیتر هم وجود داره، ولی عملکردش به خوبی کارتهای جدید نخواهد بود.
اما با توجه به حذف شتابدهنده سختافزاری Optical Flow در مدل جدید، به نظر میرسد که این احتمال وجود دارد که این فناوری به سختافزارهای قدیمیتر هم انتقال یابد. با این حال کاتانزارو تاکید کرد که نیازمندیهای بیشتری برای هستههای تنسور وجود دارد و معماری قدیمیتر GPUها عملکرد ضعیفتری در این زمینه دارند. با این حال خواهیم دید که آیا انویدیا واقعا میتواند این کار را انجام دهد یا خیر.
منبع: Wccftech