研发一款完全自主的国产芯片架构有多难?
随着手机、PC等智能终端的普及,在终端厂商有意无意的营销下,越来越多的普通消费者也开始对“CPU、架构、ARM、X86”这些名词有了一定的了解,但是也很容易混淆。特别是近期越来越多的手机厂商的营销变得越来越硬核,除了摆参数,也开始谈到“指令集、编译器、芯片架构”这些业内人都不一定能完全懂的名词。
对于普通消费者来说,其实并不关心电子产品中用的是什么架构的芯片,他们只需要更便宜、更高性能和低功耗的电子设备。
所以对于终端厂商和芯片厂商来说,以往更倾向于直接购买国外已经成熟的内核技术,如ARM、MIPS来开发最终产品。用这些架构开发产品,在商业上是正确的,因为有了成熟的生态和工具支持,可以节省大量的时间和人力成本,快速上市抢占市场。
以手机芯片领域的代表厂商高通、华为、联发科、紫光展锐为例,他们都是在ARM提供的芯片架构基础上进行的二次开发设计。简单来说,ARM提供的微架构相当于房地产开发商提供的毛坯房,而高通等芯片商在毛坯房的基础上进行精装修。由于这种模式大大降低了芯片厂商的开发难度,使得芯片上市时间大大缩短,加上ASIC简单指令集在低功耗领域表现优异,因此ARM在追求低功耗的移动终端市场取得了巨大成功。
近年来,尽管国产IC设计公司蓬勃发展,但是芯片架构领域依然是欧美公司独大。以X86、ARM为代表,除了ARM是英国(被日本孙正义收购)的外,其余的全是美国的。其中移动处理器主要使用ARM架构(华为海思、小米澎湃等),而PC处理器(桌面和服务器)主要使用MIPS(龙芯)和X86架构(兆芯、海光等),而物联网主要使用RISC-V(阿里中天微、松果电子等)架构。
真正自主掌握,为什么我们需要MVP核?
因为过于依赖国外的芯片架构,一旦遭遇类似中美贸易战这样的不可抗力,国产芯片很容易遭到针对性的打压。比如最近就出现了几件在业内颇具影响力的事情:一是ARM说要暂停与华为的合作,二是AMD中止了X86架构后续的授权给海光。尽管ARMv8技术专利权已被华为永久买断,但后续的ARMv9华为很可能面临“无米下锅”的窘境。
随着芯片架构市场逐渐垄断化,采用ARM架构授权的成本其实也越来越高,动辄千万起跳。除了在手机等市场的玩家还能支付ARM高昂的授权费用外,针对IOT领域碎片化市场的玩家已经无法承担了。
尽管业内有人认为华为可以采用最近比较热的RISC-V来作为“备胎”,但RISC-V在手机芯片等消费领域面临不少天然的缺陷。此外RISC-V虽然是开源芯片架构,但依然来自于美国伯克利大学。依赖国外的芯片架构来设计芯片虽然省时省力,但却是受制于人,“技术无国界”在真实世界其实是不存在的。
正是看到了芯片架构领域的垄断,包括高通、三星等芯片商都开发过自己完全主导的芯片架构。而据说国内的紫光展锐、方舟科技也开发过自主芯片架构,从IC CORE设计,指令集设计,编译器设计,都是自主研发。不过在与ARM的竞争中,都面临生态系统不够成熟的问题,而在市场上也没有真正出现过采用自研芯片架构的产品。至于其它的国产芯片,当时龙芯用的是MIPS架构,中天微用的是C-core,至于RISC-V那是很后来的事情了。
在屈指可数的自研国产芯片架构的先行者中,2009年成立的中微电具有非常重要的意义,其自研的MVP核在技术上非常超前。
所谓MVP(Multi-threaded Virtual Pipeline stream Processor),最初的意思是“多线程虚拟管线技术”。后来中微电将自研的处理器架构IP命名为MVP。
中微电开创性的将CPU和GPU统一在一个核内,一个核既可以当成CPU,也可以当成GPU来使用,并且支持四个线程的并行运算。可以说,MVP核是业界首次将CPU和GPU的功能集成在一个核上,同时也是国内第一个基于并行计算的、且具有先进的同步多线程设计的多核处理器芯片。
2011年12月,中国核高基及IC专家魏少军教授,以及众多集成电路行业专家分别到深圳中微电考察,当时专家对中微电在没有外部帮助的情况下,独立完成了具有完全自主知识产权的MVP核表示高度赞扬,认为融合了CPU和 GPU的指令集ISA是一个很大的创新。
错失平板机会,先驱成先烈 ?
据了解,中微电的成立初衷源自于创始人梅思行的一个愿望。在硅谷从业多年的梅先生,一直希望为中国的技术发展做出自己的贡献。作为Nvidia的主架构师之一,梅先生直接参与了数代Nvidia图形处理器芯片中的流处理器架构和硬件设计 ,包括第一个GPU(第一代GeForce),第一个可编程GPU(第一代xbox),第一个GPGPU(G80),可以说是芯片设计领域不折不扣的大牛。
正是由于有梅先生的坚持,中微电从成立之初在技术上就极具前瞻性。当时CPU和GPU的发展已经沿着并行可编程的路线走到一个竞争交叉点,CPU和GPU都在互相融合互补,越来越多的算法放到GPU中运行,希望成为未来的计算中心平台,软件编程的思路也在发生变化,越来越多的调用GPU的性能来进行运算。
按照梅先生的设想,中微电希望能用自研的MVP核来自己做芯片,对比ARM架构的芯片,MVP核芯片在并行运算上拥有功耗、成本、性能的多重优势,多个MVP可组成一组强大计算能力的多核、多线程的处理器,特别适用在云计算服务器等需要大量多核运算的设备中。可以让系统级SOC设计成本远低于其它芯片设计公司。
两位创始人(左:周志德 右:梅思行 )
2009年,梅先生与多年好友周志德先生共同成立了一家芯片设计公司ICube(中微电)。周先生是世界著名的编译器专家,曾任MIPS首席工程师、SGI首席科学家、PathScale公司编译工程总监。他也是编译界普遍采用的Open64编译器的首席架构师, 后来演化为著名的Open64编译器,周先生因此树立了全球编译器顶级权威的地位。处理器大牛加上编译器大牛,这个创业阵容堪称豪华。
2011年,中微电流片了第一颗基于65纳米的SOC产品IC3228,采用完全自主研发的芯片架构MVP核集成的SOC,也是国内第一个独立研发的多线程处理器核。其CPU性能高于双核ARM Cortex-A9, 且具有当时主流嵌入式GPU的性能。
也就在同一年,珠海一家芯片设计公司找到中微电,希望详细了解中微电的MVP核,并采用IP授权的方式合作开发芯片。不过这家公司最终考虑到生态成熟的问题,选择了ARM架构授权芯片,同时发布了第一颗平板处理器A10,并在当年抓住了平板电脑的机会成为黑马。这家公司就是珠海全志科技。
如果当时全志和中微电的IP授权模式合作成功,可能今天的移动芯片架构的市场格局就要发生变化了。事实上,当时找中微电谈合作的远不止是全志一家,据了解华为也曾找中微电谈过合作。
不过当时中微电更看好方兴未艾的智能家电领域,同时也将赌注更多押宝在了自己流片成功的IC3138上。据介绍,当时市面上同类的,采用ARM架构的主控芯片,最便宜的也要卖到7~8美金一颗,而IC3138的定价是2美金,可以说具有极大的价格优势。
在方案商的选择上,中微电选择了跟比亚迪合作,比亚迪当时也是格力、美的、海尔等家电厂商的方案提供商。当时智能家电和物联网的概念还不普及,可以说中微电的想法已经非常超前,要通过一个通用方案在家电中都带上通信、触屏功能,变成可触控操作的智能家电。
在中微电的办公室,还摆放着当时与一家香港的果汁机品牌合作的智能果汁机,外挂WIFI通信模块,带触屏功能,可以用手机APP操作,内置了两千多套打果汁的菜谱。当时连手机、平板也才刚刚普及触屏功能。据了解,当时这个果汁机卖很贵,单价达到几千元,当时出货了近万套,销往台湾以及海外市场。
随后,比亚迪刚好将业务重点转向新能源汽车,将专门做电子的五部和六部进行合并裁员,智能家电也就不再是比亚迪的发展方向了。
深圳中微电科技有限公司执行董事王炳煌
“如果当时能坚持下来,正好能赶上智能家居的一波浪潮。”深圳中微电科技有限公司总裁王炳煌先生感叹的提到芯片行业的一个规律,“有时候做太早了,先驱就成先烈了。”
2014年,中微电的母公司,港股上市的中国微电子科技集团(00139)由于主营业务变更,将旗下深圳中微电的业务剥离出来。而就在这一年,中微电也面临了成立以来最大一次的人员变动,创业元老周志德离开了团队,也间接促成了中国科技业另一件重大事件的发生。
方舟编译器的诞生
2014年,大批来自清华、中科院的博士加入了华为方舟实验室。其中最重磅的是方舟编译器的技术首席科学家周志德。
2015年,华为方舟实验室推出了自主研发的编程语言CM。
2016年,华为专门成立了“编译器与编程语言”的实验室。
2019年4月,在华为P30系列国内发布会上,华为发布了一个普通观众不太懂,但其实意义重大的技术——“方舟编译器”。
这也是一家国内消费电子产品公司首次把编译器作为一大亮点来介绍。
编译器的作用是把程序员编的高级语言代码转换成计算机的机器码,起到承上启下的作用。
在以前,每一家CPU架构厂商都会开发自己的编译器,但随着CPU架构从百花齐放走向逐渐垄断,只剩下惠普、英特尔、英伟达、vmware等头部的厂商仍然保留编译器开发团队。
为什么周先生这么重要?
40多年前,劳伦斯利弗莫尔国家实验室(LLNL:美国以核武器研发为主的两个国家实验室之一),启动了名为“S-1”超级计算机项目,许多斯坦福学生/毕业生参与,其中包括周志德。
周志德是美国“S-1”项目编译器的主力研发之一,于1977-1983年在斯坦福读博,毕业后先去了Daisy Systems,该机构与世界上最早的(之一)商业EDA公司——Valid Logic Systems齐名。
之后,周志德先后进入MIPS和SGI任职,在SGI期间领衔开发出Pro64编译器,后来演化为著名的Open64编译器。因此,周树立全球编译器顶级权威地位,成为编译器领域的顶级大佬。
此后,周志德又加入Cognigine,参与创立PathScale和ICube(周的LinkeIn),但随着全球CPU体系结构走向了高度垄断,编译优化的价值也不再显著,PathScale被反复卖了好几轮。
周志德在离开PathScale之后,与英伟达出身的梅思行合作,共同创立了中微电,并主导了MVP的编译器。
华为有了自己的编译器,使得芯片架构定制化有了实现的可能。可以像苹果一样定制自己的芯片或者直接换掉ARM架构。而对于中微电来说,尽管周志德离开了公司,但是周先生主导研发的MVP编译器仍在发挥着作用。有了这个编译器,应用程序开发者的源代码可以在MVP编译器上编译,直接在中微电MVP上运行,大大的降低了开发难度。
重新出发,走IP路线
时间来到2019年,与10年前相比,此时的中国半导体行业发展环境发生了天翻地覆的变化。
这中间隔着半导体大基金的成立、各地资本对集成电路企业的热捧、中美贸易战、中兴与华为事件……半导体上下游的国产化被重新提上日程。半导体技术也从多核多线程的潮流转向了人工智能。
市场的变化教育了资本,也教育了从业者。经历过低谷、重新出发的中微电,商业模式发生了悄然的改变。
据了解,中微电承担过国家重大专项核高基项目的研发。同时承接了深圳市科创委、南山科技局的多项科技攻关项目,均已成功验收。华为事件后,国家对于重大技术专项项目的支持力度明显加大”,中微电总裁王炳煌先生表示, “这的确是国产集成电路设计公司的福音”。
从《深圳市进一步推动集成电路产业发展行动计划(2019 —2023 年)》的红头文件来看,高端通用芯片(CPU/GPU/FPGA)以及EDA、IP核都属于核心关键技术。
在半导体业界都在谈“国产化替代”的当下,对比其他友商,只有中微电可以真正提供完全自主知识产权指令集的架构的处理器。中微电完全可以在攻关卡脖子技术上做出贡献”,王炳煌表示。
在芯片领域,目前中微电的通用芯片项目开发暂缓,而改为与系统厂商合作进行芯片定制。比如针对AI边缘计算的芯片,针对AI云端服务的芯片。除此之外,中微电也在和一些国产EDA厂商合作进行推广销售,国产EDA也希望能推广更多的国产芯片IP。
IP这一块,中微电基于MVP内核分别提供低功耗MCU和高性能的CPU两种IP,其中MCU采用65nm工艺,对标ARM M0/M3,主要应用到天然气、电力计量、智能家电控制等领域。而CPU则采用28nm工艺,对标ARM、MIPS、RISC-V,主要应用到高性能SOC、智能终端领域。
中微电同时提供高性能的GPU IP,采用28nm工艺,对标Mali、Adreno,PowerVR,主要应用移动显示终端领域,支持OpenGLES3.1/2.0/1.1,像素填充率可达20GP/s,三角形填充率可达2GTri/s。
此外,中微电还提供高性能的并行计算IP-GPGPU(通用可编程并行计算处理器),采用28nm工艺,对标Nvidia CUDA核,支持边缘计算、并行计算、人工智能。据了解,目前中微电GPGPU的核心功能已经通过FPGA验证,软件环境支持OpenCL和Tensorflow Lite等。
对标NVIDIA CUDA,什么是GPGPU?
对于GPGPU的定义有很多种,利用GPU做一些非渲染的计算被称为GPGPU——General-purpose computing on graphics processing units,图形处理器通用计算。GPGPU的另一大优势就是支持与各大CPU架构的适配,这样兼容性变得更好。简单来说,就是将GPU和CPU结合在一起,用来进行应用程序加速,并将一些计算密集型任务从CPU移到到GPU。
可以说GPGPU正在重新定义数据处理和深度学习网络方面的能力。据了解,NVIDIA CUDA的主要应用将包括极高能效的百亿亿次AI超级计算机。
2019年6月17日,在德国法兰克福的国际超算大会上,NVIDIA宣布其独有的CUDA编程架构开放支持ARM CPU架构。NVIDIA CUDA就是GPGPU的典型代表。NVIDIA将在今年年底前,向ARM生态系统提供全堆栈的AI、HPC软件,可支持所有AI框架、600多个HPC应用程序的加速。堆栈优化完成后,NVIDIA将为所有主流CPU架构提供加速,包括x86、POWER、ARM。
为了更好的支持ARM CPU架构,Nvidia还推出了一款形状、外接口类似于树莓派的嵌入式主板Jetson Nano,搭载Cortex-A57处理器,GPU则是128个NVIDIA CUDA核心,支持4K 60Hz视频解码。相比树莓派,Jetson Nano要强大多了,支持深度学习、人脸识别等应用,做个自动驾驶小车控制也可以。其性能可以与搭配NPU的瑞芯微RK3399 PRO进行对比。
边缘计算算力板性能对比
中微电推出的边缘计算算力板正好对标Jetson Nano,除了采用自研的GPGPU 核之外,通过PCIE接口可支持ARM架构CPU,如瑞芯微、MTK、全志等的处理器。支持的应用场景包括边缘计算场景中的图像识别以及人工智能算法,如汽车驾驶众的疲劳检测、乘客识别。人脸闸机、人脸支付场景,公共场所视频监控场景,人数统计等。从上图的性能参数对比可以看到,采用64个GPGPU 核,其FLOPs性能就超过128核的CUDA,同时在功耗、面积方面都更具优势。从性能上,MVP的核心架构有自己的独特优势,根据FPGA的仿真验证和流片数据,可以得出结论,功耗会小很多,面积小了流片成本也小很多。
除了边缘计算,其实中微电的MVP核也可以针对服务器端市场。不过这个市场由于玩家比较集中,目前并不是中微电的目标市场。
根据王炳煌先生透露,中微电接下来在继续完善、优化以上三种IP的基础上,还将针对可行的终端应用场景和市场,定义基于MVP-CPU+MVP-GPGPU+MVP-MCU 核心技术的芯片。目前中微电已经与自主可控信息安全领域和某商显公司合作定义用于人脸识别和人脸支付场景的自主产权芯片,同时和人工智能物联网公司合作定义边缘计算芯片。
据了解,中微电预计到2020年将完成GPGPU芯片的MPW验证,以及GPGPU芯片算力板的开发。
不过,随着人工智能算力战争的日趋激烈,边缘计算领域这个赛道的玩家和对手越来越多,对于中微电来说,目前也感觉到越来越大的紧迫感和危机感。比如南京的天数智芯、上海的登临科技都宣称开发出了自研的GPGPU芯片,并且拿到了一大笔钱。
对于现在的中微电来说,除了竞争对手,还需要考虑下一步的融资事宜。毕竟要开一颗最新工艺的芯片,是非常烧钱的。不过好在与港股上市公司剥离后,深圳中微电重新成为了一家股权结构清晰的公司,对于下一轮融资较为有利。
MVP或RISC-V,谁能打破ARM的生态垄断?
前面提到,最近这两年开源的RISC-V架构大热,由于是开源的,所以被视作国产芯“自主可控”的发展契机。
有数据显示,中国有300家以上公司在关注RISC-V或以RISC-V指令集进行开发,并且有了一定的成果,有些芯片企业已经做出了RISC-V的物联网芯片,比如最近阿里系的“平头哥”就大出风头。
不过尽管炒得很热,但RISC-V和MIPS、MVP等所有非主流的芯片架构一样,都面临生态问题。RISC-V在企业级、消费级的工控和桌面办公领域都无法真正解决生态问题。“除了X86和ARM,包括MIPS和RISC-V,任何不是销量前二的指令集,都会有生态问题。”梅思行先生认为,在不需跑第三方软件的市场,生态环境并不算什么问题,比如一些工业或行业应用。“如果用户的应用软件是有源代码的,我们可以负责移植;如果第三方应用是JAVA,生态环境问题也不大,因为MVP核可以跑Java vm。”梅先生表示。
生态环境的建立需要时间,arm在x86生态环境下的崛起过程,就是一个例子。
作为一个全新的CPU架构,MVP采取的策略是:1. MVP具备独立且高效的C/C++的编译器;2. MVP会运行Android操作系统并会继续支持其他开源的系统;3. MVP会移植Android之上的所有应用环境及普遍应用程序;4. 如Android所提倡,MVP会有效运行独立于CPU的Java应用程序,而事实上Android的Dalvik虚拟器也已经是一个并行编程的适合MVP的软件平台;5. MVP会提供高度灵活及高效率的QEMU软件开发平台。相信随着时间推移,MVP的软件生态环境会更趋成熟。
实际上,MVP和RISC-V架构在指令集上非常相似,MVP的独特之处是硬件多线程,同时涵盖了shader language,集成了GPGPU的指令。
此外RISC-V虽然是开源的,但那个是最基础的,真正实现量产上市仍然需要投入大量资源进行第二次开发。相对来说,MVP似乎是介于ARM和RISC-V之间,有限的专利授权费,但是又提供成熟的开发工具。对于国产芯片设计公司来说,MVP显然既能满足完全国产化,又能够满足低成本和灵活性的多重需求。王炳煌表示,MVP也可以考虑进行指令集的开源,联合更多有实力的合作伙伴共同来壮大生态。
点评:芯片国产化东风来临,中微电未来可期
作为一家本土市场成长起来的IC设计公司。
在完全从零开始,打造自主知识产权开发的MVP项目中,中微电不但给后来者指明了方向,培养了一大批优秀的半导体研发人员,同时也为自主指令集以及自研芯片架构在业内进行了推广普及。
尽管由于各种原因,目前的中微电在商业上不能算成功,但它的出现仍然是“中国芯”发展的一个重要里程碑。
在芯片投入上,尽管我国这几十年来一直把集成电路技术作为高科技发展的内容之一。然而对于资本和企业来说,芯片产业仍然是个高投入高风险的行当,投入并不一定有回报,就算有回报也是很久之后的事情。
不过近年来,随着半导体大基金的成立,以及资本的热捧,半导体业变得日趋浮躁,很多项目匆忙上马,缺乏对未来的长远规划。
在这种情况下,我们更加需要中微电这种多年来一直坚持在国产自主指令集方向上深耕的企业。在中美贸易战的大背景下,各行各业都将会加大对于国产芯片的采购力度。而在类似于政府采购项目、军工等敏感项目,更是要求国产化率达到一定的标准以上。
笔者认为,借着目前国产芯片替代的东风,中微电未来一定能脱颖而出,绽放国产处理器的光彩。同时MVP核作为国产自主的芯片架构,也必然在与ARM、RISC-V架构的竞争中,获得自己的一席之地。