NVIDIA GEFORCE新品解禁 笔记本专用GTX 1650正式登场!

作者: PX_H 0 发布时间:2019-04-24 10:22:34


进入2019年以来其实在整个世界上有很多大的展会和活动,包括游戏开发者的展会,以及英伟达主办的GTC,GPU TECHNOLOGY CONFERENCE。在这些展会上面,其实不管是游戏行业,还是GPU行业也好,英伟达方面都做了许多努力工作。

光线追踪的疑问与发展


TURING是NVIDIA第12代GPU架构,与之前很多GPU架构的名字都是以科学家的名字来命名的一样。这次12代是TURING,上一代是PASCAL,再上面还有福特,麦斯威尔等等。

整个TURING的架构里面并不只是有光线追踪和做张量计算的这些核心,在架构上也是做了很大的改进,最主要的几个点:一个是有并发式浮点和整数指令同步执行,这样在很多游戏里面或者很多应用里面有浮点和整数指令的时候可以节省非常多的系统资源,让GPU运行的更有效率。

另外,TURING的缓存结构也做了优化,把之前分出来的共享式缓存以及L1缓存做了一个整合,其实我们同一个缓存架构以后也更方便这个系统调用缓存的资源。另外,我们还有自适应着色的功能,可以在游戏里面极大地节省GPU的资源,也是提升性能的一个很重要的技术。

这代显卡里面分成了RTX和GTX两条不同的产品线,它的显著差异就是RTX是带有光线追踪加速硬件核心的,以及Tensor Core的,而GTX里面没有这两个硬件加速核心。但是,它的架构依然是我们TURING架构。在游戏里面依然可以获得TURING架构获得的好处。


以《古墓丽影:暗影》这个游戏为例,每100个指令集里面其实有38个是做整数的,有62个是做浮点的。大概是这样一个比例。如果用以前的Pascal的GPU来做处理,因为它的整数和浮点没有办法同步执行。那100个指令要单独先做浮点,再做交叉的。在做浮点的时候,整数的那部分就要闲置,这个是有一个时间上的浪费。在新的TURING架构里面,以1660Ti和1060作对比,只要62个指令就可以把所有100个指令全都完成,这样的话实际上在执行效率的时候就提升了38%,接近40%。

在缓存架构上,之前Pascal的架构时候做数据交换每个L1缓存的位宽和它的容量都是比较小的,中间还有一些共享的显存的部分。它每一个显存区块用到的地方是不一样的,它不能共享。在TURING里面把这部分打通了,L1的缓存会更大,整个L1缓存做交换的数据位宽也会更宽,这样也提升了整个数据交换的效率。

在显卡的自适应着色方面也有两个不同的技术。正常渲染一个图像,如果是用百分之百的比例去渲染这个画面的话,它用到的shader的资源就是百分之百,其实在一个画面里面并不是所有的部分都需要用百分之百的精度去做渲染的。用自适应着色的技术,根据这一帧里面的部分,把它用不同的精度做渲染。最后出来的图像跟原始的图像画质上一模一样。省去了那些无效的计算,能够节省40%的shader的资源,这样就带来了显著的性能提升。本身可编辑着色已经在 DirectX 12里面集成了,所以本世代的GPU在DirectX 12里性能会更好。


其实每一代显卡发展的时候,都要经历一个阵痛期,因为必须先有硬件,然后再有API支持了这些硬件的技术和功能,尤其是开发商才方便在他开发的游戏里面集成这些技术和功能。

其实从DX9发布的时候,到DX9游戏普及这中间经历了一年零七个月时间。包括DX11替代DX10的时候,也用了差不多一年的时间才会有游戏陆续在出。相比以前DX10版本的更新以及迭代,这些新技术在游戏里面的应用。现在DX Ray Tracing从硬件发布,从8月份到现在是几个月的时间,半年多时间里面有有很多游戏开始在集成进去了,已经可以玩到了。包括《战地5》、《古墓丽影》、《地铁》、《逆水寒》,DXR普及的速度比之前任何一个版本都要快。

既然DXR有了一个更新,相应它带来的工作流程,需要硬件执行的部分也是有很大变化的。之前没有光线追踪的时候是不需要去做跟光线追踪相关的BVH算法,Bounding Volume Hierarchy这个算法,如果以前有光线追踪的需求,包括在设计上面非实时的,那都是通过CUDA核心来做的。现在有光线追踪在游戏里面,在这部分的算法会有一个显著的提升,这个部分就变成了目前GPU里面很繁重的一个工作。所以这次采用了一个专用的RT CORE来做这方面的工作。


除了筛选以外,还要计算每一个光线打到物体上以后,因为每一个物体都是由三角形组成的。在3D世界里面三角形是最基本的图形,要去计算光线和三角形的交汇点,然后判断光线应该怎么样反射,去计算光线的这些数据。另外,在自然界里面的光线其实是接近于无数的,大家数不出来说这个环节里有多少光线,但是在计算机里模拟这个环境的时候是有光线数量限制的,不可能做到完全跟现实世界上的光影是一样的,只能尽可能地模拟这个现实世界中的光影。只有数量足够多的时候,最后输出这个画面的时候才越平滑,噪点才越少。降噪这个技术也是在光线追踪里面比较重要的一部分。

光线追踪在不同的游戏里面应用的地方是不一样的。现在更多的是采用混合渲染,有部分场景是用了光线追踪反射的效果,阴影的效果,但是有些地方还是用以前传统的光栅化的方式来做,追求一个画面显示效果和最终性能的平衡。不同游戏里面游戏开发商也可以选择加入不同光线追踪的效果。


不同的应用点对系统的需求也是不一样的。举例来讲,之前《星球大战》那个DEMO用的是光线的反射、阴影以及环境光遮蔽,用了这三个部分。在《逆水寒》里面是用了反射和阴影。《古墓丽影》里面比较简单,只用了阴影而已。很多玩家觉得《古墓丽影》的光线效果并没有那么逼真,并没有那么好,这个就是原因所在,因为它在里面没有加入那么多东西。在《地铁:离去》里面环境营造的就比较好,是用了全局光照,全局光照技术是能把整个游戏场景渲染得更逼真的一个部分,当然它对系统的要求也特别高。像《战地V》里面最典型的就是水面反射,汽车上反射的倒影,武器上的反射,采用的是反射的技术。包括马上要发布的《原子之心》,还有3DMARK的测试里面也是用了反射和阴影。

阴影的部分跟反射不太一样,反射是单光源,但是阴影里面是多光源的状态,它的数量就相对来讲比较多。然后,除了发光物体以外还有会有一个还原光源里面,所以光源来源也比较多。也会做BVH搜寻,它不会有弹跳,但因为它光线很多,计算量也不小。实际上展示出来阴影实际虚化的效果没有反射看上去那么的震撼,不过它的工作量是不小的。

另外为什么英伟达一起推出的光线追踪RT和DLSS这两个技术。RT可以让画面发生一个质的改变,但是它对硬件性能要求很高。当硬件没有办法达到的时候,通过DLSS来提升它的性能。所以这两个技术其实是互补的。


环境光遮蔽,这是以前就有的一个东西了。我们是通过光线追踪的方式做环境光遮蔽,它会在一个小的区域角落里面进行很多的,不同环境光的迭代,迭代的需求。然后去营造一个区域的小阴影。这个虽然看上去没有反射那么直接,但是它对于营造游戏的氛围是有帮助的。比如说星球大战里面,这个机器人就很多凹陷进去的部分,是有阴影的。如果处理得不真实,看上去就很假。所以这个是能够提升游戏的稳定度的。同样因为它里面光线的数量非常多,所以对硬件的需求也很高。

光线追踪还是未来发展的趋势,从整个生态的搭建来讲和进度上来看,其实已经比较完备了。首先是Unity和UNREAL ENGINE已经都集成了光线追踪。在API上面除了微软的DX以外和Vulkan,Vulkan后面也会有一些游戏用它来开发。很多国内的手游愿意用Vulkan引擎来做。这两个主流的引擎都支持的话,未来在API上面也将没有障碍。

既然光线追踪这么好,为什么你们还要出1660,16系列,为什么要把光线追踪的硬件加速到核心拿掉,为什么要把Tensor Core拿掉?

在英伟达产品规划上面,其实是有一个从上到下非常完整的一个规划。从调研上来看,目前在电脑上的游戏最火的五款游戏,LOL,CSGO、堡垒之夜、PUBG和守望先锋,这些游戏其实都是电竞类型的游戏。这些游戏都有一个特点,没有加入那么多的新技术,但是玩家数量非常大,而且它对硬件的需求没那么高,不像3A大作,只能跑个60多帧,可能很老的平台也可以跑得很好。但是游戏的玩家很多,英伟达想通过技术的改进让这些玩家也能够获益。


所有电竞选手来讲,响应延迟是最重要的,因为他们其实在做任何一个动作的时候非常快。作为专业电子竞技的选手来讲,他们就需要这种低延迟,及时响应的画面。

在这方面电竞选手需要两点,一个是最快的,延迟最低的GPU,还有是显示器,因为显示器是能看到最直观的画面,它首先要有及时的响应急速的响应,画面必须马上能在显示器上显示出来,画面要显示得精准,刷新率要足够高。有了这些先进的硬件,可以帮助你在竞技类的游戏里面获得更好的成绩。

在这里英伟达做了一个对比,CSGO和守望先锋里面通过英特尔的集显、GTX 750Ti跟最新的RTX 2080来比,它的延迟是有非常大的差别的。对于电竞选手来讲,老的平台会对他们的成绩产生非常明显的影响。

在《堡垒之夜》和PUBG里可以看到,用了不同的硬件,他们训练玩儿的时间越来越长,用了更好的硬件,他们的成绩能够提升得更快。用了更好的硬件,经过这么长时间训练以后,你能够提升到的成绩,你的硬件越好,你能提升的幅度也越大。

游戏笔记本


游戏笔记本这两年发展的特别特别快,比台式机的发展要快得多,很多的游戏玩家已经开始从用台式机去玩游戏,转到用笔记本玩游戏了,增长非常快。在五年里面,这个数据增长了十倍,玩家希望把高品质的PC游戏带到移动平台,可以随时随地能玩。

通过我们英伟达提出的解决方案来达到一个更好的游戏体验,让主流的这些游戏能够达到100帧以上,可以满足不同审美的玩家,或者不同等级需求的玩家。另外,跟游戏机平台相比,笔记本的优势就是首先游戏更多,而且更多游戏都是开放的。


而且还有很多周边的硬件,比如说耳机、硬件、鼠标也好,这些周边的硬件都是可以选自己喜欢的,我们不是说你一定要买这个手柄,一定要怎么样。另外,它除了玩儿游戏,还可以做设计,可以进行办公,都可以。另外,有些配置是可以定制的。因为通常笔记本厂商推出一个型号以后,你可以去选用多大的内存和硬盘都可以去选。

目前在笔记上的一个趋势,越来越多的笔记本用到笔记本开始用到144赫兹刷新率的屏幕。以前在10系列的时候,高端笔记本可能用了一个1080的GPU,但是它配的全部是60赫兹。这个在游戏体验上,尤其是像吃鸡、射击类的游戏上体验是大打折扣的。往后也会有越来越多的游戏笔记本都用高刷新率的屏幕。

在这里英伟达把16系列TURING的GPU带到了笔记本上,基本上涵盖了所有主流OEM品牌都有,有超过80款不同的设计。

为什么要做1660Ti笔记本?


首先笔记本有一个更新周期的,基本上三到四年会换一个新的笔记本,尤其是游戏笔记本,体验上有绝对的提升,用户才会做这个更新。

相比2015年960M笔记本,现在的笔记本在在CPU上本身是从英特尔第四代升到了第九代。另外在刷新率上,以前960M肯定都是60赫兹的,现在都有144的屏幕了,更适合游戏玩家,内存也更快,硬盘也更快,用了SSD+机械硬盘组合的方式,也更轻薄。

通过TURING的架构,跟PASCAL架构的对比,越是新发布的游戏,TURING架构的笔记本产品它领先的百分比越高。

另外在新的TURING架构里面,英伟达也更新了直播部分的一个编码,在这个编码里面可以提供非常好的画质。当主播在用新的TURING架构产品的时候做直播,他们发出来的画面会更好,画质会更好。同时也不会影响他们玩游戏,他们在游戏当中的性能基本上不受影响,CPU占用率只有2%,也不会额外占用GPU的资源。

笔记本里面也支持GEFORCE Experience,通过GEFORCE Experience, 它可以下载到最新的GAME READY DRIVER,可以对目前发布的游戏的更新或者未来发布的新游戏都会第一时间支持。另外每一代的驱动的更新都会让这个游戏笔记本的性能提升。不管是在兼容性还是在性能上都会变得更好。另外当有一些新功能的时通过驱动更新有的笔记本也可以实现这样的功能。

GTX 1650发布


同时英伟达还发布了一款入门级的产品GTX 1650。这款GTX 1650是2倍于950M的产品,跟台式机的1050比大概有1.7倍性能提升,主流这些游戏可以达到60帧。体验上肯定没有高端的产品好,但是性价比比较高,比较适合入门级的玩家。

目前基本上所有主流的笔记本品牌都会采用的显卡,从最低的GTX 1650开始,到1660Ti,到RTX 2060,2070,2080,这是一个TURING1架构笔记本系列的全家族的型号,针对不同的玩家需求他们可以去选最适合他们的产品。