一般来说,手机的综合性能与其内置的处理器芯片有着非常大的关系。而我们知道目前手机市场上主流手机AI芯片品牌有高通骁龙系列、苹果A系列、华为海思麒麟系列、以及联发科系列等等。这其中以高通、苹果和华为最为出名。
那么,这些处理器芯片哪家最强呢?下面看看鲁大师给出的2019Q1季度手机AI芯片排行榜吧。
苹果A系列芯片无缘第一,华为最强芯片麒麟980仅排第三。
在218年的鲁大师的年度报告中,苹果A12在AI跑分中一骑绝尘,无“芯”能敌。这个状态一直到今年Q1季度AI排行榜出炉,苹果A12仅排第二名,华为麒麟980则仅排第三名。骁龙855终于打败了苹果A12,成为当前AI最强处理器,目前搭配这款芯片手机的有小米9、IQOO、三星S10系列等。
苹果的A12 Bionic是苹果公司推出的iOS阵营首款7nm芯片,也是苹果最新iPhone——iPhone Xs、iPhone Xs Max和iPhone XR这三款手机重要内核。A12神经引擎多达八个核心,它每秒可以处理5万亿次操作,比上代A11性能提升了不少。
华为麒麟980则是华为目前最强手机芯片,同样是基于台积电7nm制程工艺,内置CPU、GPU、NPU全面升级。目前华为系的重要旗舰都搭载了麒麟980,是华为突出其硬件实力的重要科研成果。
骁龙855碾压苹果A12
作为目前最强的手机处理器,骁龙855相比上代骁龙845有着全面性的飞跃,在AI性能上的提升也让人感到震撼,相比苹果A12高出4000分,比麒麟980高出了两万多分。
骁龙855没有像其他方案那样集成一个专为AI设计的神经网络引擎独立单元,而是继续依赖CPU、GPU、DSP等传统单元,并加入新的张量加速器(Tensor Accelerator),专门负责AI,组成第四代AI引擎。
同时,Adreno 640 GPU ALU算数单元数量增加了一半,可以实现每秒超过7万亿次运算(7 TOPs)的AI算力。
AI芯片厂商及并购案例
随着智能手机为代表的移动端市场日趋饱和,包括英特尔、高通在内的各路芯片巨头将物联网和人工智能视为又一战略机遇,引发了AI芯片的研发与投资浪潮,众多初创公司也如雨后春笋般横空出世。AI芯片产业链见图11。
图11 AI芯片产业链
(一)芯片公司动作频频
英特尔自上世纪八十年代专攻芯片以来,借助与微软的“Wintel”产业联盟称霸桌面和服务器CPU市场,但到了移动互联和大数据时代形势骤变:高通(Qualcomm)和联发科(MTK)几乎瓜分了移动CPU市场,英伟达借助GPU的并行计算能力在大数据时代趁势而起,甚至在桌面和服务器领域一直被英特尔压得喘不过气的AMD近几年股价也反弹明显。从2010年至今,英伟达的表现一骑绝尘,赛灵思在2018年下半年发力,高通的表现则弱于标普500和费城半导体指数,见图12。
图12 五家芯片巨头的股价与总回报(2010年至2018年)
来源:Factset,中投研究院
注:总回报包括股价回报、股息以及股息再投资回报
1.英特尔
英特尔正致力于把业务重心从传统的PC-centric转型到Data-centric,2013年以来完成的43笔收购交易中36笔都是服务于Data-centric,例如167亿美元收购FPGA公司Altera(2015)、4亿美元收购机器视觉公司Movidius(2016)、154亿美元收购自动驾驶公司Mobileye(2017)等[13]。英特尔的投资部门Intel Capital自1991年向超过1500家公司投资了至少120亿美元,近年投资聚焦到人工智能等领域,例如AI芯片初创公司Syntiant。英特尔2017年收入构成见图13,其中以CCG业务群为代表的传统业务仍贡献过半收入,在数据中心CPU市场占有率高达98%,但与AI、物联网、自动驾驶相关的业务正成为新的增长点。
图13 英特尔2017年收入构成
图14 英特尔财务年度数据(NASDAQ:INTC)
注:英特尔2017财年截至2017年12月30日
来源:中投研究院,Factset
除了频频投资并购,英特尔在AI芯片方面的研发力度也明显加大,在CPU、FPGA甚至GPU等多个条线同时发力。2017年,英特尔发布了世界上首款视觉处理芯片(VPU)Movidius Myriad X,适用于无人机、VR/AR穿戴设备、智能家庭等应用场景,处理能力达每秒4万亿次;同年,还发布了业内首款14纳米级FPGA Stratix 10,较前代产品时钟频率翻倍、功耗降低70%,这两款芯片见图15;2018 年6 月,英特尔在推特上表示将在2020年推出独立GPU。
图15 英特尔的Movidius VPU(左)和14纳米级FPGA(右)
来源:英特尔年报,中投研究院
英特尔PC时代的盟友微软押注FPGA并继续与英特尔合作。微软选择FPGA用于深度神经网络(DNN)评估、Bing搜索排名以及软件定义联网(SDN)加速,在减少时延的同时将更多CPU算力释放到其他任务中。微软于2010年启动了“投石车”项目(Project Catapult),并于2015年开始大规模部署到Bing和Azure数据中心,以可控成本实现了极快的推理能力,Bing搜索的数据吞吐量提升了50%、时间延迟减少了25%。2016年,微软启动了“脑波”项目(Project Brainwave),探索通过英特尔的FPGA实现实时AI。2018年,Bing和Azure数据中心将部分算力由CPU迁移至FPGA,如今每个新增的服务器都把一个FPGA集成到独特的分布式架构中,形成的可配置互联计算层拓展了CPU计算层。
2.英伟达
英伟达从游戏和图像业务起家,借助GPU的并行计算优势在AI芯片尤其是训练方面成为霸主,其在AI训练芯片的市场占有率高达95%。英伟达将其营业收入划分为GPU和Tegra处理器两大板块,其中GPU业务板块针对PC和数据中心的游戏、计算机辅助设计(CAD)、AI、加密货币等应用场景,Tegra处理器业务板块针对汽车和嵌入式设备的自动驾驶、AI、娱乐等应用场景,收入构成见图16。2018财年,英伟达的GPU业务板块收入同比增长39.8%,Tegra处理器业务板块收入同比增长86.2%(其中移动游戏与开发的收入同比增长300%)。
图16 英伟达收入构成
来源:英伟达年报,中投研究院
自2006年推出CUDA并行计算平台后,英伟达成功打造了AI和深度学习的生态系统,GPU成为主流的深度学习硬件,在云端和汽车电子等方面开疆拓土,营收和利润水平都一路攀升(见图17)。然而,英伟达继续扩张的尝试正在遭遇更多的挑战。数据中心领域,英特尔的CPU仍然不可或缺;汽车和无人机领域,特斯拉、大疆借助平台优势正在构建软硬件紧密耦合的自有生态;在一些嵌入式AI应用领域,赛灵思为代表的公司则试图证明FPGA等其它类型芯片是比GPU更合适的选择。
图17 英伟达财务年度数据(NASDAQ:NVDA)
注:英伟达2018财年截至2018年1月28日
来源:中投研究院,Factset
3. 高通
高通2017年占智能手机应用处理器市场份额的42%,比排名第二的苹果(22%)和排名第三的联发科(15%)加起来还高,但由于消费电子业务触及天花板,专利优势逐渐被稀释,毛利率不断下滑(见图18),近年股价疲软。收购恩智浦失败后,高通切入车载芯片等人工智能场景的尝试仍在继续,例如设立了1亿美元基金支持人工智能初创企业。显而易见的是,高通希望AI芯片在终端设备而不是数据中心得到快速发展。
图18 高通财务年度数据(NASDAQ:QCOM)
注:高通2018财年截至2018年9月30日
来源:中投研究院,Factset
4. AMD
AMD在CPU和桌面/服务器GPU领域都长期屈居行业第二,其毛利率明显低于英特尔和英伟达的毛利率(见图19)。2016年以来,AMD推出的锐龙(Ryzen)系列CPU等产品反响不错,股价触底反弹。2018年11月,AMD率先公布7纳米级数据中心GPU——Radeon Instinct MI60和MI50加速卡,剑指下一代深度学习、高性能计算和渲染应用[14]。
图19 AMD财务年度数据(NASDAQ:AMD)
注:AMD2017财年截至2017年12月30日
来源:中投研究院,Factset
5. 赛灵思
随着另一家FPGA龙头企业Altera被英特尔收购,赛灵思加快了转型步伐。2018年,赛灵思的自我定位从一家FPGA公司调整为“自适应与智能计算的领导者”,战略要点包括:加速布局数据中心市场,抢占人工智能推理、视频和图像处理、基因组等应用场景;巩固汽车、通讯、航天等传统业务;推出ACAP自适应计算加速平台,为大数据和人工智能应用的软硬件开发提供支持。
2018年7月,赛灵思以2.5亿美元收购了北京的深度学习企业深鉴科技[15]。深鉴科技成立于2016年3月,被收购前已完成3轮融资,其语音识别加速引擎于2018年上线亚马逊AWS。
图20 赛灵思财务年度数据(NASDAQ:XLNX)
注:赛灵思2018财年截至2018年3月31日
来源:中投研究院,Factset
2018年10月,赛灵思推出了由其UltraScale+ FPGA芯片加持的Alveo加速卡,内置多个独立xDNN引擎,解决了GPU通过批处理提高性能却增加时延的问题,宣称比高性能GPU的图像处理吞吐量高出4倍、时延少3倍[16]。
图21 赛灵思Alveo加速卡(FPGA)与GPU、CPU的性能对比
注:该对比结果在GoogLeNet V1神经网络等特定测试场景下取得。
来源:赛灵思,Accelerating DNNs with Xilinx Alveo Accelerator Cards,2018年10月
6. CEVA
美国CEVA公司是DSP的IP(知识产权)方面的领先企业,主要收入来源为IP授权费用(license fee)和特许使用费(royalty fee),因此毛利率很高,并且研发支出远高于资本支出(见图22)。针对汽车、安防、增强现实、智慧家庭、零售自动化、在线诊疗等方面的图像视频和语音AI开发了一系列IP,包括CEVA-NeuPro系列深度学习IP(其中尺寸最小的NP500瞄准物联网和可穿戴市场,NP1000瞄准中档智能手机、高级驾驶辅助系统、AR/VR头戴设备等,NP2000瞄准高端智能手机、监控、机器人和无人机,NP3000可用于企业级监控和自动驾驶),以及专为低功耗嵌入式设备设计的CEVA-XM系列图像和计算机视觉处理器IP。
图22 CEVA财务年度数据(NASDAQ:CEVA)
注:CEVA公司2017财年截至2017年12月31日
来源:中投研究院,Factset
(二)产业链上下游公司入局
AI芯片产业链上游的深度学习算法公司以及下游的云计算、智能手机公司也开始将业务延伸到芯片领域,一方面借助自有业务支撑自研芯片的研发和商业化,另一方面也通过投资并购迅速提高技术实力。
1.谷歌
谷歌在人工智能领域的布局初见雏形。软件算法方面,Tensorflow是最流行的深度学习框架之一;硬件芯片方面,云端的Cloud TPU已发布第三代,主要用于自有云计算服务,边缘计算的Edge TPU也于2018年7月发布。
2.亚马逊
亚马逊于2018年11月发布了定制的AI芯片AWS Inferentia,用于人工智能的推理任务。亚马逊是全球最大的公有云服务商以及智能音箱的开创企业,无论从数据中心云计算的角度还是从智能音箱语音识别的角度,对AI芯片都有相当的依赖性。尽管是新进入芯片行业,亚马逊的战略愿景却不止于AI芯片,还研发了ARM架构的服务器芯片Graviton用于自己的云计算服务器。
3.华为
华为早在1991年就创建了ASIC设计中心,即海思半导体有限公司的前身,从3G芯片一直到最新的麒麟980,其芯片业务借力自有产品逐步成熟。2018年10月,华为发布AI发展战略和全栈全场景解决方案,试图提供从底层芯片、开发框架到顶层应用的全套解决方案,构建开放生态。同时发布的还有采用华为达芬奇架构的两款AI芯片:面向云端高算力场景的7纳米级昇腾910、面向边缘计算低功耗场景的12纳米级昇腾310。
4.阿里巴巴
2018年4月,阿里巴巴全资收购中国大陆唯一的自主嵌入式CPU IP核杭州中天微系统有限公司,9月成立平头哥半导体有限公司,计划2019年推出首款AI芯片。中天微成立于2001年,宣称是国内唯一基于自主指令架构研发嵌入式CPU并实现大规模量产的CPU供应商,于2018年推出两款CPU IP芯片以及智能语音SoC平台。
5.比特大陆
作为国内乃至全球的数字加密货币矿机龙头,比特大陆在招股说明书中将自身定位为中国第二大和全球前十大无晶圆厂(Fabless)芯片设计公司,是“世界上少数几家有能力开发用于云端训练及推断的芯片的AI芯片公司之一”。比特大陆基于ASIC的数字加密货币矿机2017年收入约22.6亿美元,占全球市场份额的74.5%,正在谋划香港上市。2018年,该公司发布了第二代张量处理器BM1682、边缘计算BM1880等AI芯片。
比特大陆招股说明书披露其主要营收来源为矿机销售,具备一定的芯片自研经验和能力。芯片行业历史上不乏转型成功案例,远的如德州仪器从石油能源公司转型为模拟芯片龙头,近的有英伟达从游戏显卡公司发展为AI芯片龙头,然而转型之路并不平坦,比特大陆以及嘉楠耘智、亿邦国际等矿机厂商转型做AI芯片的努力方向值得认可,但充满挑战。比特大陆的芯片研发此前主要为数字加密货币挖矿服务,尽管挖矿所需的密集计算能力与AI训练需求总体相符,转型做AI芯片有一定基础,但人工智能的应用场景截然不同,而且从较低的研发占比看,转型需要尽快加大资本投入、充实技术力量。
图23 比特大陆披露的财务数据
来源:比特大陆招股说明书,中投研究院
(三)AI芯片初创企业涌现
2008年特别是2015年以来,美国、中国等国家涌现出一大批AI芯片初创企业,几乎都从事芯片设计,其中多数企业瞄准某些细分领域并从定制芯片起步,吸引了大量的天使投资和风险投资。尽管态势尚不明朗,但少数独角兽已经崭露头角。
美国Wave Computing公司成立于2008年,被咨询公司Frost & Sullivan评为“2018年机器学习行业创新领导者”。Wave Computing的数据流处理器(DPU)通过提高卷积和循环神经网络并行度提高机器学习能力。该公司收购了老牌芯片公司MIPS,力图将业务从数据中心拓展到云边缘并打造一站式服务,并使得自身拥有的专利数量超过425项。MIPS以RISC计算架构著称,与英国ARM公司是竞争关系。
美国Adapteva公司成立于2008年,致力于研发通用的多核并行计算架构及芯片,已有上万个客户。其Epiphany-V芯片是集成了1024颗64位RISC芯片的SoC,处理能效达每瓦特750亿次浮点运算,由台积电采用16纳米工艺生产。
英国Graphcore公司成立于2016年,研发了所谓智能处理器(IPU)的AI芯片,该芯片可以实现大量并发的低精度浮点运算,适合数据中心的训练任务。藉由戴尔资本的战略投资结成的合作关系,Graphcore首批产品在戴尔公司的数据中心投入使用,该产品集成有16个IPU芯片,算力超过2千万亿次浮点运算(PFLOPS)。
寒武纪科技、地平线、深鉴科技一度并称中国最知名的三家AI芯片独角兽公司。寒武纪科技成立于2015年,自称为全球第一个成功流片并拥有成熟产品的智能芯片公司,在终端以IP授权形式在智能手机、智能摄像头等设备中用于片上推理,现已推出第三代AI芯片IP即7纳米级Cambricon-1M、处理能效达每瓦特50亿次浮点运算,在云端以板卡形式在服务器集群用于云端推理和训练等应用;地平线同样成立于2015年,以智能驾驶、智慧城市和智慧零售为主要应用场景,主攻终端嵌入式市场,研发了面向智能驾驶的征程系列和面向智能摄像头的旭日系列等AI视觉芯片。
以色列Halio Technologies成立于2017年,其业务重心是为嵌入式设备提供深度学习能力,例如汽车的自动驾驶辅助系统。该公司计划2019年推出首款AI芯片。
此外还有美国边缘设备AI芯片公司Syntiant和Kneron、脉冲神经网络芯片公司BrainChip、涉足内存内计算的Gyrfalcon Technology,加拿大深度学习ASIC公司Tenstorrent,印度AI芯片公司AlphaICs,中国语音AI芯片公司云知声、思必驰,以及法国上市公司Kalray,美国的Cerebras、Esperanto Technologies、Groq,等等。
(四)代工厂受益于快速增长的AI芯片设计需求
芯片制造可能是最具马太效应的行业之一,同时具备芯片设计和制造能力的公司寥寥无几,绝大多数芯片设计公司的制造业务依赖于代工厂。芯片代工厂2018上半年的市场占有率见图24。
图24 芯片代工厂2018上半年全球市场占有率
来源:David Manners, H1 foundry rankings stay stable, Electronicsweekly.com;中投研究院
台积电作为全球最大芯片代工厂,在工艺制程上一路领先。其他代工厂在缺乏足够订单量支撑的情况下难以为继,2018年8月,仅次于台积电的两大代工厂格芯、联电均宣布放弃对先进制程的追赶,专注于提升12纳米以上成熟制程市场占有率。联电意识到,代工市场中成熟制程市场虽然成长缓慢但占有绝大部分份额(见图25),有很大的营收空间供争夺。中芯国际在巩固28纳米及以上制程代工业务的基础上,14纳米攻关取得重要进展,继续加大投入研发先进制程。
图25 不同制程的芯片全球市场占有率
来源:IBS, Whitepaper:Semiconductor Industry from 2015 to 2025, 2015年8月
与英伟达、AMD等芯片设计公司的情况不同,代工厂的资本支出占比远高于研发支出,反映出其重资产的特点。
图26 芯片代工厂的资本支出占比(左)与研发支出占比(右)
来源:中投研究院,Factset
(五)小结
前述公司在AI芯片领域大多基于自身特长有所侧重,比如英伟达固守GPU、赛灵思主推FPGA、初创企业首选定制芯片,高通专攻终端、谷歌和亚马逊发力云端等等,而英特尔则尝试从云端到终端、从通用芯片到专用芯片全线出击。我们对相关企业的竞争态势和市场地位进行了评估,见图27。应当指出,由于AI芯片行业方兴未艾,市场格局变数较多,这个评估只是对当前形势的总体判断,不代表后续发展预期。
图27 当前AI芯片行业相关企业的竞争态势
注:半定制芯片主要指FPGA,定制芯片包括ASIC及各种类脑芯片
来源:中投研究院
AI芯片终端(边缘计算)市场高度碎片化,云端市场英伟达GPU+英特尔CPU垄断的格局也在不断面对新的挑战者,财务投资者和战略投资者的投资并购热情高涨。2014年以来,全球半导体行业并购交易每年大约200笔左右,交易金额在2015年和2016年达到峰值后显著萎缩,商业扩张意愿受到了监管政策和国际环境较大影响。AI芯片作为半导体行业的新兴领域,集中度还有较大的提升空间。
图28 全球半导体行业披露的交易数量和金额