【重磅】英特尔发布关于全新架构和技术的重要内容

加州圣克拉拉，2018年12月12日——在英特尔“架构日”活动中，英特尔高管、架构师和院士们展示了下一代技术，并介绍了英特尔在驱动不断扩展的数据密集型工作负载方面的战略进展，从而为PC和其他智能消费设备、高速网络、无处不在的人工智能（AI）、云数据中心和自动驾驶汽车提供支持。

同时，英特尔展示了一系列处于研发中的基于10纳米的系统，将用于PC、数据中心和网络设备；并预览了其他针对更广泛工作负载的技术。

英特尔公司高级副总裁兼硅工程事业部总经理Jim Keller

英特尔还分享了聚焦于六个工程领域的技术战略，对这些领域的重大投资和技术创新，将推动技术和用户体验的飞跃。这六大工程领域包括：先进的制造工艺和封装；可加速人工智能和图形等专门任务的新架构；超高速内存；超微互连；嵌入式安全功能；以及为开发者统一和简化基于英特尔计算路线图进行编程的通用软件。

英特尔公司处理器核心与视觉计算高级副总裁Raja Koduri

这些技术共同为更加多元化的计算时代奠定了基石，到2022年，潜在市场规模将超过3000亿美元¹。

英特尔架构日上发布的重点内容包括：

业界首创的逻辑芯片3D堆叠：英特尔展示了名为“Foveros”的全新3D封装技术，该技术首次引入了3D堆叠的优势，可实现在逻辑芯片上堆叠逻辑芯片。

Foveros为整合高性能、高密度和低功耗硅工艺技术的器件和系统铺平了道路。Foveros有望首次将晶片的堆叠从传统的无源中间互连层和堆叠存储芯片扩展到高性能逻辑芯片，如CPU、图形和人工智能处理器。

该技术提供了极大的灵活性，因为设计人员可在新的产品形态中“混搭”不同的技术专利模块与各种存储芯片和I/O配置。并使得产品能够分解成更小的“芯片组合”，其中I/O、SRAM和电源传输电路可以集成在基础晶片中，而高性能逻辑“芯片组合”则堆叠在顶部。

英特尔预计将从2019年下半年开始推出一系列采用Foveros技术的产品。首款Foveros产品将整合高性能10nm计算堆叠“芯片组合”和低功耗22FFL基础晶片。它将在小巧的产品形态中实现世界一流的性能与功耗效率。

继2018年英特尔推出突破性的嵌入式多芯片互连桥接（EMIB）2D封装技术之后， Foveros将成为下一个技术飞跃。

全新Sunny Cove CPU架构：英特尔推出了下一代CPU微架构Sunny Cove，旨在提高通用计算任务下每时钟计算性能和降低功耗，并包含了可加速人工智能和加密等专用计算任务的新功能。明年晚些时候，Sunny Cove将成为英特尔下一代服务器（英特尔®至强®）和客户端（英特尔®酷睿™）处理器的基础架构。

Sunny Cove的功能特性包括：

• 增强的微架构，可并行执行更多操作。

• 可降低延迟的新算法。

• 增加关键缓冲区和缓存的大小，可优化以数据为中心的工作负载。

• 针对特定用例和算法的架构扩展。例如，提升加密性能的新指令，如矢量AES和SHA-NI，以及压缩/解压缩等其它关键用例。

Sunny Cove能够减少延迟、提高吞吐量，并提供更高的并行计算能力，有望改善从游戏到多媒体到以数据为中心的应用体验。

下一代图形卡：英特尔推出全新的第11代集成图形卡，配备64个增强型执行单元，比此前的英特尔第9代图形卡（24个EU）多出一倍，旨在打破每秒1万亿浮点运算次数（1 TFLOPS）的壁垒。从2019年开始，新的集成图形卡将与10纳米处理器一起交付。

与英特尔第9代图形卡相比，新的集成图形卡架构有望将每时钟计算性能提高一倍。凭借高于每秒1万亿浮点运算次数的性能，该架构旨在提高游戏的可玩性。与英特尔第9代图形卡相比，英特尔在此次活动上展示的第11代图形卡几乎将一款流行的照片识别应用程序的性能提高了一倍。第11代图形卡预计还将采用业界领先的媒体编码器和解码器，在有限的功耗配额下支持4K视频流和8K内容创作。第11代图形卡还将采用英特尔®自适应同步技术，为游戏提供流畅的帧速率。

英特尔还重申了在2020年推出独立图形处理器的计划。

“One API”软件：英特尔宣布推出“One API”项目，以简化跨CPU、GPU、FPGA、人工智能和其它加速器的各种计算引擎的编程。该项目包括一个全面、统一的开发工具组合，以将软件匹配到能最大程度加速软件代码的硬件上。公开发行版本预计将于2019年发布。

内存和存储：英特尔介绍了英特尔®傲腾™技术以及相关产品的最新情况。英特尔®傲腾™数据中心级持久内存作为一款新产品，集成了内存般的性能以及数据的持久性和存储的大容量。这项革命性的技术通过将更多数据放到更接近CPU的位置，使应用在人工智能和大型数据库中的更大量的数据集能够获得更快的处理速度。其大容量和数据的持久性减少了对存储进行访问时的时延损失，从而提高工作负载的性能。英特尔傲腾数据中心级持久内存为CPU提供缓存行（64B）读取。一般来说，当应用把读取操作定向到傲腾持久内存或请求的数据不在DRAM中缓存时，傲腾持久内存的平均空闲读取延迟大约为350纳秒。如果实现规模化，傲腾数据中心级固态盘的平均空闲读取延迟约为10,000纳秒（10微秒），这将是显著的改进2。在一些情况下，当请求的数据在DRAM中时，不管是通过CPU的内存控制器进行缓存还是由应用所引导，内存子系统的响应速度预计与DRAM相同（小于100纳秒）。

英特尔还展示了基于英特尔1 TB QLC NAND裸片的固态盘如何把更多海量数据从硬盘迁移到固态硬盘，从而可以更快访问这些数据。

英特尔傲腾固态盘与QLC NAND固态盘相结合，将降低对最常用数据的访问延迟。总体来说，这些对平台和内存的改进重塑了内存和存储层次结构，从而为系统和应用提供了完善的选择组合。

深度学习参考堆栈（Deep Learning Reference Stack）：英特尔宣布推出深度学习参考堆栈（Deep Learning Reference Stack），这是一个集成、高性能的开源堆栈，基于英特尔®至强®可扩展平台进行了优化。该开源社区版本旨在确保人工智能开发者可以轻松访问英特尔平台的所有特性和功能。深度学习参考堆栈经过高度调优，专为云原生环境而构建。该版本可以降低集成多个软件组件所带来的复杂性，帮助开发人员快速进行原型开发，同时让用户有足够的灵活度打造定制化的解决方案。

• 操作系统：Clear Linux * 操作系统可根据个人开发需求进行定制，针对英特尔平台以及深度学习等特定用例进行了调优；

• 编排：Kubernetes*可基于对英特尔平台的感知，管理和编排面向多节点集群的容器化应用；

• 容器：Docker*容器和Kata*容器利用英特尔®虚拟化技术来帮助保护容器；

• 函数库：英特尔® 深度神经网络数学核心函数库（MKL DNN）是英特尔高度优化、面向数学函数性能的数学库；

• 运行时：Python*针对英特尔架构进行了高度调优和优化，提供应用和服务执行运行时支持；

• 框架：TensorFlow*是一个领先的深度学习和机器学习框架；

• 部署：KubeFlow*是一个开源、行业驱动型部署工具，在英特尔架构上提供快速体验，易于安装和使用。

在近日举行的英特尔架构日活动上，英特尔公司处理器核心与视觉计算高级副总裁Raja Koduri介绍了英特尔在设计与工程模式方面的战略性转变。这种转变整合了一系列基础构建模块，包含英特尔公司领先的技术和IP（知识产权）组合。这一方法旨在让英特尔加快创新步伐，并将扎根于六大战略支柱：

英特尔公司处理器核心与视觉计算高级副总裁Raja Koduri

1. 制程——拥有领先的制程技术，仍是建构领先的产品之关键。先进的封装解决方案在三维空间中扩展晶体管密度，将赋予英特尔指数级提升计算密度的能力。

2. 架构——未来，英特尔会通过先进的封装和系统集成技术，把多样化的标量（scalar）、矢量（vector）、矩阵（matrix）和空间（spatial）计算架构组合部署到CPU、GPU、加速器和FPGA芯片中，并通过可扩展的软件堆栈释放强大的能力。

3. 内存——大容量、高速度的存储对于下一代计算工作负载至关重要。英特尔拥有独特的优势，能将内封存储芯片和英特尔傲腾技术结合在一起，填补内存层级中的空白，从而在更靠近硅芯片的地方提供带宽。

4. 超微互连——通信技术大到面向5G基础设施的无线连接，小到芯片级封装和裸片互连。只有提供全面的领先互连产品，才能实现大规模的异构计算格局。

5. 安全——随着安全威胁的不断涌现，使用英特尔的各种组件，可以建立更加可靠的安全策略。英特尔拥有独特优势以提供安全技术，帮助实现端到端的全面提升，并让安全性成为关键的差异化因素。

6. 软件——对于全新硬件架构的每一个数量级的性能提升潜力，软件能带来两个数量级的性能提升。对于开发者来说，拥有一套利用好英特尔芯片的通用工具集，对于获得性能的指数级扩展至关重要。

针对一些大家关心的问题， Raja Koduri做出了回答。

1) 在新的计算时代，为什么英特尔的产品和技术战略应当基于这六大支柱？

计算的格局在过去十年发生了重大变化。我们所在的世界，数据产生的速度超出了我们分析、理解和帮助保护这些数据的能力。我们看到，这对计算架构提出了巨大需求，这些架构快速演进并呈指数级扩展。面向未来五年，我们有一个大胆的工程愿景，那就是在10毫秒内，向世界上每个人提供每秒万万亿次浮点运算的计算能力和10PB数据。我们认为，这六大技术支柱是我们驱动所需产品创新以实现这一目标的关键推动力。

2) 六大支柱领域的知识产权和资源如何让英特尔在竞争中处于最有利的位置并提供差异化的产品？

在我加入英特尔时，我们可用的知识产权的绝对数量及其广度令人震撼。我在这个行业工作了近30年，从未见过这样的情况。当我们在客户端、边缘和云计算环境中推动一波又一波创新时，这些庞大的资源在每个支柱领域都为我们提供了差异化的技术组合。我相信，在所有六大领域我们都拥有独特的领先优势，为持续创新奠定了基础。

3) 创新模式为什么必须改变？

世界在变，我们的业务也已经改变；我们面对的是一个价值3000亿美元的潜在市场规模*。对计算需求的不断增长，让英特尔有机会以前所未有的方式来寻求改变、重塑和扩展。不仅是对于我们自己，为了那些把业务、关键数据和计算需求托付给我们的客户来说，我们有责任重塑我们的产品和战略，为接下来十年以及更远的未来开发技术。

4) 英特尔当下和未来如何运用这个模式？

我们现在正把这个模式（六大战略支柱）运用于我们的整个工程部门，落实在我们将在明年和未来推出的全新创新产品与技术规划。不管是通过“Foveros”逻辑堆叠实现的先进封装创新，还是面向软件开发者的“One API”方案，我们正在采取行动，推动可持续的新一轮创新。

5) 计算工作负载格局的转变，对于英特尔开发下一代产品有何影响？

与上述计算环境相关的工作负载正在发生变化。消费者或企业客户不再拥有可以只通过直接的标量架构就能解决的简单应用。相反，我们看到通过集成额外架构而更快速解决问题的程序，这些额外架构包括图形处理器、人工智能加速器、图像处理器、甚至是基于全新内存技术的FPGA等自适应设计。我们将整合计算和架构创新，通过高速互连以及新的软件开发模式，为开发者简化API，并从英特尔计算架构释放出更高的性能和效率。

6) 英特尔在这六大支柱领域的投入，如何在用户体验方面推动类似于摩尔定律的飞跃？

在前几代产品中，答案一直是晶体管密度，并且摩尔定律将在解决计算问题方面发挥主导作用。但随着制程节点发展速度相较于过去几十年呈现出减缓的态势，摩尔定律的本质将是继续提供全新的技术和能力，以满足现代计算的需求。摩尔定律的含义，不仅仅涉及晶体管，而是包括晶体管、架构研究、连接性提升、更快速的内存系统和软件的结合，共同推动其向前发展。