本文中,英特尔院士AdityaNavale 将分享图形处理器从实现更好的像素绘制到解决人类复杂计算挑战的演进历程。
-Aditya Navale,英特尔院士,GPU核心IP架构总监
事实上,我们和大家一样期待英特尔进军独立显卡市场。
英特尔院士AdityaNavale 表示:“我一直希望英特尔能够进入独显市场。”AdityaNavale 在英特尔工作了30年,其中20多年都深耕于图形技术。
不久前,英特尔发布了英特尔锐炫™移动端独立显卡,并将在今年推出应用于台式机的独立显卡。这标志着英特尔在显卡进程中迈出了重要的一步。在加速计算系统与图形事业部,Navale的团队至关重要——他们开发的核心IP架构为多代英特尔GPU奠定了基础,包括已经推出的首款英特尔锐炫A系列独立显卡。
如果我们把集成显卡(通常与CPU集成在同一裸片上)也一起算进来,英特尔已位居PC显卡市场份额的领先地位。Navale表示:“对于英特尔而言,从集成显卡到独立显卡是重要的一步,因为这是一项极具挑战性的复杂任务。”
自2019年以来,英特尔集成显卡的游戏性能已经提升至原来的数倍,而英特尔锐炫独立显卡以集成显卡技术为基础,再次实现了游戏性能的显著提升。当前的英特尔集成显卡最多包含96个执行单元,而锐炫独立显卡将采用多达512个Xe矢量引擎。Navale指出:“在面积增大5倍以上的同时,我们需要克服的挑战是,在特定功率范围内更好地提升性能。”
“除了进军独显市场并成为重要的一员,我们开发锐炫显卡的其中一个想法也是希望探索大型GPU的架构设计和软件开发。”他解释道。
作为独显领域的“新人”,想要成为具有竞争力的新选择,就意味着产品的特性和性能不仅要有吸引力,还需支持一系列的游戏和应用。“软件为先的理念一直驱动着我们的架构创新。”他说道。
从像素绘制到深度学习
什么推动了人们对于数倍于普通笔记本电脑图形处理能力的需求?答案是丰富的对照研究。
GPU的主要任务是加速图形渲染:在2D屏幕上创建2D和3D图像。简言之,GPU就是负责在屏幕上绘制像素。CPU旨在一次处理一两个复杂任务,而GPU旨在并行处理许多小任务,即绘制像素。
比如当你阅读这篇文章时,屏幕上的像素并没有太大变化,所以GPU不需要做太多工作。但当系统运行逼真的3D游戏等任务时,像素就会不断变化。Navale解释道:“越是想在游戏中呈现身临其境的沉浸感,GPU需要做的工作就越多。”无论是微风中飘动的毛发,还是不同程度的光影效果,这些细节都需要在每一个像素的显示上花费更多功夫。并且为了保证细节渲染的流畅度,这些工作需要快速地完成。
游戏仅仅是一个开始。
GPU是可用于高度并行计算的数据处理器,Navale表示:“GPU的应用场景也正在快速增长。”除了绘制像素,GPU在人工智能、深度学习和高性能计算等领域的应用也正在帮助人类解决复杂的计算挑战。
如果说面向不同负载开发芯片听起来很复杂,Navale表示,那么基于GPU构建的软件生态则为以上困境提供了“解决之道”。
“我们构建了一个满足所有新要求的软件生态。”Navale说,“考虑到高性能计算、人工智能和游戏等诸多领域的需求,软件生态需要以一种高度协同的方式不断演进。为此,我们需要在深思熟虑之后不断完善架构。”
GPU的需求成倍增长——迈向Z级计算
人们对GPU的需求正在成倍增长,因此我们需要依靠灵活性和新的设计思路,来将GPU的性能提升至全新高度。“我们将构建和部署IP,确保其既可应用于集成领域,也可应用到大型独显中。”Navale说,“这种可扩展性是内置的。我们还完成了大量的参数化工作,以便轻松快速实现它的可扩展性。”
为了实现Z级超级计算,即全球下一个重要的强大算力系统,他解释道:“产品的可扩展性还将进一步提升。”这不仅意味着每个芯片的算力要成倍增加,还要让多个芯片进行系统级封装。
“PonteVecchio 在这方面已经取得了一些进展”,它将47个不同的区块(tile)组合到单个 GPU中。“但是现在这种模式还在发展,随着我们向前迈进,它将取得更好的势头和采用情况。”