“半残5G”、“胶水5G”?看华为麒麟990如何挑战友商8系列

麒麟990和麒麟990 5G的对比:主要差别包括基带、工艺、NPU以及CPU主频

2019年9月6日,华为在2019德国柏林消费电子展(IFA)上发表了两款旗舰级芯片:麒麟990和麒麟990 5G。其中麒麟990 5G是真正意义上的,全球首款单芯片5G SoC芯片。同时还宣布在9月19日德国慕尼黑发布的华为Mate30上,将首发搭载麒麟990系列芯片。

《芯扒客》作为受邀媒体也第一时间来到北京,全程参与报道了此次发布会,同时也跟华为Fellow艾伟先生进行了交流。

华为Fellow艾伟演讲

NSA/SA全网通非“半残5G”,单芯片集成非“胶水5G”

作为全球首款单芯片5G SOC,麒麟990是目前业内最小的5G手机芯片方案。在Sub-6GHz频段下实现领先的2.3Gbps峰值下载速率,上行峰值速率达1.25Gbps,带来业界最佳5G体验。

很多人不了解5G手机芯片的研发难度,其实早在两年前华为就已经发布了5G基带芯片Balong 5G 01,不过当时体积太大,只能用到CPE终端中。

经过版本迭代,采用最新的7nm+ EUV工艺,华为首次将5G基带芯片(Balong5000)和CPU/GPU/NPU在内的应用处理器集成到了一个Die上。板级面积相比业界其他方案小36%,在一颗指甲大小的芯片上集成了103亿晶体管,是目前晶体管数最多、功能最完整、复杂度最高的5G SoC。由于是单芯片,相比传统的4G SoC外挂5G Modem的解决方案,功耗表现优20%,带来更长效持久的5G体验。

注意,是集成到了一个Die上,不是两个Die,所以业内某些说麒麟990是胶水5G的谣言可以止住了。

据了解,麒麟芯片早在2014年就开始EUV技术的储备,极紫外光刻(Extreme Ultraviolet Lithography),常称作EUV光刻,它以波长为10-14纳米的极紫外光作为光源的光刻技术。是目前实现7nm最前沿的晶圆技术,就连台积电的产能也无法满足所有的手机芯片客户。

麒麟990 5G在Sub-6GHz频段下实现2.3Gbps峰值下载速率,1.25Gbps上行峰值速率。还支持5G双卡,一卡5G上网的同时,另一卡可接听VoLTE高清语音通话。

《余承东转文暗示友商被高通坑了?详解中移动坚持SA组网的真实原因》(点击)一文中,芯扒客详细介绍了NSA和SA组网的区别,以及为什么高通希望国内运营商先上NSA组网。

工信部也表示自2020年1月1日起,申请入网的5G终端需要同时支持独立组网和非独立组网(SA和NSA)。综合来看,NSA是5G初期的过渡方案,成熟的5G解决方案必须具备同时支持SA和NSA的能力。

据了解,麒麟990 5G也是业界首个全网通5G SoC,率先同步支持SA/NSA 5G双模组网。如果只支持NSA组网模式,那么可以说这种5G芯片只能算“半残”5G。

如何解决5G商用面临的三大痛点?

5G商用初期,由于网络覆盖不完善5G还面临着弱信号场景联接不稳定、功耗较高、高速移动场景联接体验不佳等挑战。

在5G信号较弱的场景下,麒麟990 5G推出智能上行分流设计,在视频直播、短视频上传等应用场景同时使用5G和4G网络,上传速率提升5.8倍,优化5G上行体验;

为解决5G带来的功耗问题,麒麟990 5G率先支持BWP(Bandwidth Part)技术,在5G大带宽条件下实现带宽资源的灵活切换,与业界主流旗舰芯片相比,5G功耗表现优44%,带来更长效的5G体验;

面向高速移动场景,麒麟990 5G支持基于机器学习的自适应接收机,实现更精准的信道测量,下行速率提升19%,实现稳定的5G联接。

GPU大幅提升,CPU采用cortexA76略显保守

再来看一下麒麟990的CPU和GPU。

CPU方面,麒麟990 5G采用2个大核(基于Cortex-A76开发)+2个中核(基于Cortex-A76开发)+4个小核(Cortex-A55)的三档能效架构,最高主频可达2.86GHz,与业界主流旗舰芯片相比,单核性能高10%,多核性能高9%。能效方面针对不同大小的核精细调校,大核能效优12%,中核能效优35%,小核能效优15%,带来更快的手机应用打开速度,日常使用体验更加流畅。

GPU方面,麒麟芯片始终追求更好的用户体验。针对GPU在运行重载游戏、播放高清视频等高负载场景下容易出现的发热、掉帧、卡顿等问题,麒麟990 5G搭载16核Mali-G76 GPU,与业界主流旗舰芯片相比,图形处理性能高6%,能效优20%,实现业界领先的性能与能效。全新系统级Smart Cache分流,支持智能分配DDR数据,在重载游戏等大带宽场景下带宽较上一代最高可节省15%,功耗可降低12%,进一步提升GPU能效。

针对游戏场景,麒麟990 5G推出Kirin Gaming+ 2.0,基于性能、能效强大的CPU、GPU与DDR芯片,Kirin Gaming+ 2.0推出高性能、高能效、高画质游戏解决方案,实现业界顶级游戏体验。Kirin Gaming+ 2.0的核心技术是全新升级的AI调频调度技术,在CPU、DDR系统调频调度中全新引入GPU融合调度,并加入游戏关联线程优化技术,动态感知性能瓶颈。不仅如此,Kirin Gaming+通过对100万帧以上的游戏画面大数据进行学习,建立了精准的Kirin Gaming+游戏性能功耗模型,将性能功耗调度细化到游戏每一帧画面中,游戏帧率稳定60帧,每帧负载调频准确性提升30%。同时,麒麟990 5G支持HDR 10特效,游戏画质更高清,游戏体验更加真实沉浸。

大小双核NPU,达芬奇架构比麒麟970提升12倍性能

2017年,麒麟970在业内首次采用独立NPU神经网络处理单元,开创端侧人工智能的行业先河。2018年,麒麟980搭载双核NPU实现领先的AI算力,带来AI人像留色、卡路里识别等一系列创新AI体验。2019年,全新高端系列麒麟810更是首次采用华为自研达芬奇架构NPU,打破端侧AI性能纪录。

作为首款采用达芬奇架构NPU的旗舰级SoC,麒麟990 5G创新设计了NPU大核+NPU微核架构,NPU大核针对大算力场景实现卓越性能与能效,业界首发NPU微核赋能超低功耗应用,充分发挥全新NPU架构的智慧算力。

达芬奇架构是华为在2018年推出的全新自研AI计算架构,基于其灵活可裁剪的特性,华为面向全场景推出昇腾(Ascend)系列芯片,可用于小到几十毫瓦,大到几百瓦的训练场景,横跨全场景提供最优算力,而此次麒麟990 5G搭载的正是面向智能手机场景的Ascend Lite和Ascend Tiny。

在双大核NPU(Ascend Lite*2)加持下,麒麟990 5G实现业界最强AI算力,与业界其他旗舰AI芯片相比,性能优势高达6倍,能效优势高达8倍,持续刷新端侧AI的算力高点。无论是在业界典型的中载神经网络模型ResNet50(用于检测、分割和识别),还是在移动端更流行的轻载神经网络模型MobilenetV1(用于分类、检测、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均达到业界最佳水平。业界首发NPU微核(Ascend Tiny)赋能超低功耗应用,在人脸识别的应用场景下,NPU微核比大核能效最高可提升24倍,让AI运算更省电。对于轻载的模型表现最好,最重要的是能效最好,无论是重载还是轻载模型,能耗都更低,比其它方案能效好8倍之多。

基于麒麟990 5G的AI强劲算力,过去很多受限于功耗和算力的应用都将成为可能。麒麟990 5G使能AI多人实时换背景,通过先进的AI多实例分割技术,能够将视频画面中的每一个人物主体单独识别出来,实现多人物视频拍摄替换背景,甚至可以选择画面中需要保留的人物,让视频应用充满更多想象。

随着AI+5G时代的到来,轻量化、免安装、跨平台和更多的交互体验将成为未来应用的发展趋势,这也要求手机芯片具备5G芯端云一体化的AI能力,以及大数据、平台化等更多创新技术集群。基于华为推出的全新达芬奇架构NPU和HiAI Foundation芯片能力开放,麒麟平台将持续为开发者提供更强大的端侧算力,充分激发端侧AI的运算潜能。此次,麒麟990 5G也将为HiAI 2.0开放平台注入新的能量,助力开放能力进一步升级——支持300+算子,业界最多;提供完备的IDE工具,Android Studio插件,支持代码自动生成,提高开发效率;提供达芬奇架构IR开放,支持业界主流框架对接,实现更加完备的兼容性,让算法开发者保持原有的开发习惯,在HiAI平台上自动获取加速能力,为开发者提供更强大的工具链,探索AI+5G应用的无限可能。

拍照神器继续提升,ISP5.0与单反级硬件降噪技术

拍照方面,麒麟990 5G采用全新ISP 5.0,首次在手机芯片上实现BM3D(Block-Matching and 3D filtering)单反级硬件降噪技术,暗光场景拍照更加明亮清晰;全球首发双域联合视频降噪技术,视频噪声处理更精准,视频拍摄无惧暗光场景;基于AI分割的实时视频后处理渲染技术,视频画面逐帧调节色彩,让手机视频呈现电影质感。

如今,视频已经成为一种全新的生活记录方式,随手拍摄并剪辑短视频、Vlog分享自己的生活是每个社交达人的必备技能,用户也越来越关心手机视频的拍摄效果,追求和手机修图一样简单又智能的视频处理能力。麒麟990 5G采用全新ISP 5.0,吞吐率提升15%,能效提升15%,全面优化视频处理能力。

在夜晚、光线较弱的暗光环境下,视频拍摄出现的噪点非常影响成像质量。从噪声类型来说,视频拍摄中出现的主要是时域噪声和空域噪声。其中,时域噪声是前后帧画面播放随时间变化产生的噪声,空域降噪是每一帧视频画面原本存在的固有噪声。业界在视频降噪方面大多采用单一的时域降噪,主要消除时间维度带来的噪声。此次,麒麟990 5G全球首发双域联合视频降噪技术,针对视频中的高频、中频、低频噪声混合的场景,增加频域降噪过程,重点针对噪声进行精准分离处理,视频降噪能力提升20%,暗光环境下拍摄的视频更加清晰。首次在手机芯片上实现基于AI分割的实时视频后处理渲染技术,对每一帧视频画面色彩精心调色,让手机视频也能拥有电影调色质感。

同时,手机在暗光场景下的拍照能力也始终是用户关注的焦点。麒麟990 5G首次在手机芯片上实现BM3D(Block-Matching and 3D filtering)单反级硬件降噪技术,首次将单反级的图像处理能力应用在手机上,照片降噪能力提升30%,暗光场景噪点更少,让手机大片越夜越美丽。

基于ISP的能力升级,麒麟990 5G支持全新炫酷Face AR。通过从摄像头捕获的人脸图像数据和基于NPU运行的神经网络算法,Face AR能够对人脸进行建模、实时跟踪、表情捕获,并且可以进一步分析出人脸信息背后的诸如心率、呼吸率等健康数据,提供围绕人脸的丰富的AR增强现实体验,探索AR应用的更多可能。

点评:ARM A76核是唯一缺陷?能否单挑骁龙865?

总的来说,这次麒麟990 CPU、GPU、NPU、ISP全面升级,全方位超越了骁龙855。其中CPU提升较为保守,GPU、NPU提升幅度较大。

在集成5G的情况下取得上述成就,已经相当难得。

应该说这次麒麟990的GPU升级幅度很大,具体到游戏性能的提升很明显。但是CPU升级则比较保守,业内有媒体质疑是否因为华为与ARM的合作面临问题?但是笔者认为,ARM最新的cortex-A77仍然属于ARM v8内核,而华为已经买断了ARM v8内核的知识产权,所以这应该是不是问题。

关键的问题可能还是华为麒麟的技术路线发生了改变,认为手机的用户体验将更多的来自于GPU/NPU/ISP的提升。这跟友商高通的路线不同,高通每次产品升级仍将更多的精力放在CPU的提升上。

笔者认为手机芯片的CPU/GPU在现阶段逐渐性能过剩,而手机用户的体验提升更多的将来自于拍照、AI应用等具体的场景,和针对性的算法提升,这些都不是光靠提升CPU和GPU就能解决的。因此华为通过在AI、拍摄领域大量投入,力求弯道超车的思路不但是可行的,而且是很正确的。

华为Fellow在现场表示,其实麒麟990针对cortex A76进行了性能优化,但他更强调功耗的降低。华为的芯片研发节奏是上市一代、开发一代、准备一代,这个开发周期差不多是两年。所以麒麟990在开发的时候,并没有遇上断供危机。所以ARM不给最新架构的猜测是错误的,只不过是正常的产品周期换代而已。至少在目前的周期内,麒麟990应该是现阶段最强大的5G SOC,集成了8核的CPU和16核GPU,集成了最强大的5G基带芯片,双核NPU可以提供最强大的AI性能。

这意味着在骁龙865问世前,整个高通阵营在5G领域将毫无还手之力。

而就算明年骁龙865问世之后,那还有下一代麒麟芯片在等着呢,所以咱们就别为华为瞎操心了。

而将在明年才发布的骁龙865,将采用cortex A77的CPU,与麒麟990能否真正一战呢?让我们再等等看。

发表评论

邮箱地址不会被公开。 必填项已用*标注