麒麟950性能解析 16nm工藝力碰驍龍三星
2015-11-06 21:09:45 中關村在線麒麟950性能解析 16nm工藝力碰驍龍三星
16納米FinFET尖端工藝
海思從2013年底開始了麒麟950的立項,一開始就面臨兩難選擇,28nm工藝已經在麒麟上延續多代,競爭對手驍龍810的20nm和三星Exynos 7420的14nm均已量產商用,海思必須在工藝上更進一步,起初麒麟950考慮使用臺積電20nm工藝,發現雖然晶體管密度有近一倍提升,單位面積功耗卻有1.5倍的上升,背離了海思高效低耗的初衷,最終在和臺積電緊密合作之后,麒麟950決定挑戰工藝復雜度大幅增加的16nm FinFET plus晶體管技術。
傳統晶體管結構中,控制電流通過的閘門,只能在閘門的一側控制電路的接通與斷開,屬于平面的架構。在FinFET的架構中,閘門成類似魚鰭的叉狀3D架構,可于電路的兩側控制電路的接通與斷開。這種設計可以大幅改善電路控制并減少漏電流(leakage),也可以大幅縮短晶體管的閘長。14nm的xynos 7420采用的就是這種結構設計。
16nm FinFET plus工藝做到了性能功耗的優勢兼具,單芯片集成的晶體管數目從20億個增加到30億個,是TSMC 28HPM的兩倍,工藝性能提升65%,同時節省70%的功耗,相比20SoC工藝,性能提升40%,功耗節省60%。
但是整個工程難度成倍提升,首先是FinFET中晶體管結構變形為3D結構,由此帶來了更為復雜的3D模型以及更容易產生的寄生效應;其次金屬互聯難度成倍提升,設計規則也從此前的10000+條增長至近40000條。為了實現商用,麒麟芯片團隊和臺積電在16nm上展開摸索,共同推動了16nm先進工藝的量產成熟,并于2014年4月實現首次投片,并于2015年1月實現量產。
值得一提的是今年8月份麒麟950就已實現穩定量產,在剔除離子污染帶來的硅純度不穩定和金屬互聯不穩定威脅后,良品率已經從20%提升至了80%,采訪中臺積電也表示作為先導合作伙伴,無需擔心海思產能問題,也就是說一旦華為Mate 8上市,至少在芯片供應上不會拖后腿。
A72+MaliT880 領先的ARM架構
性能方面麒麟950采用了業界首個4*A72+4*A53 big.LITTLE架構設計以及全新一代的MaliT880(主頻900MHz)圖形處理器。ARM公司于今年2月份推出了A57的繼任者A72,得益于先進的工藝,A72核心頻率更高,可以達到2.5GHz,ARM提供的數據表明,A72核心在16nm FinFET工藝下,2.5GHz頻率運行時功耗只有750mW。性能方面ARM Cortex A72核心相比A57提升11%,功耗降低了20%,能效比綜合提升30%。性能和功耗上華為拿麒麟950和驍龍810以及三星Exynos 7420進行了兩項橫向測試——Boost突發性能測試以及高頻持續性能。Boost性能對比是測試CPU在應對高復雜運算時能夠調用的性能,主要考驗單核,麒麟950要比A57的三星Exynos 7420高出22%;在3.5W散熱能力約束條件下三種不同架構芯片的高頻持續性能也不盡相同,主要考驗芯片的散熱能力。散熱能力不足情況下維持芯片的高位運行不僅會導致手機發熱也會讓芯片主動關閉處理器,所以持續性也是測試芯片性能的指標之一,這里麒麟950依然要比對手高出56.5%。
GPU方面祖傳MaliT628MP4退役,用性能更為強勁的MaliT880圖形處理器取而代之,其主頻高達900MHz,基于16nm FinFET+工藝的Mali-T880在同頻率下性能是Mali-T760的1.8倍,同時功耗減少40%。與麒麟930相比,麒麟950圖形生成能力提升100%,GFLOPS提升100%。存儲性能方面,麒麟950支持雙通道LPDDR4內存、UFS 2.0、eMMC 5.1、Category 10 LTE、USB 3.0、藍牙4.2以及最高4200萬像素攝像頭模塊等頂級標準。
值得一提的是為了進一步優化用戶的實際使用體驗,麒麟950使用高速攝像機以每秒10000幀的速率捕捉手機操作的每一個細節,最終確定了影響用戶體驗的三大關鍵——啟動速度、操作響應以及滑動幀率。發現快速響應的體驗取決于CPU的Boost性能,用戶觸發操作時CPU占用率會在瞬間升至近70%,手機必須做到100毫秒響應才能不會給用戶造成運行速度慢的感受。流暢則取決于芯片的持續性能,一般工作狀態下需要確保每一幀繪圖在1/60秒內完成,才不會有卡頓的體驗。
解決卡慢 智能Boost調度算法
了解造成手機卡頓和變慢的因素之后,麒麟950在性能之上加入了啟發式智能調度算法,針對不同的使用場景采取不同的響應方式。比如智能Boost可以在需要Boost的地方,進行基于場景負載預測和智能探針技術的預判,提供多種百ms級的Boost響應,完成后迅速收回。根據負載預測,靈活將負載分擔給DSP、GPU、大/小/微核以及專用IP上提升能耗比;針對Android關鍵流程進行優化改進,發揮多核優勢,減少串行等待。最終做到在不積累額外熱量的同時,提升用戶的實際性能體驗。功耗方面麒麟950運行在一塊3500毫安時的電池時,也做到了續航的全面提升,普通用戶的手機續航能力提升了10小時,可以達到兩天的使用時間。
新智能感知處理器i5
協處理器方面麒麟950擁有全新升級的i5,i5采用了最新的M7核心,性能比M3提升4倍。作為麒麟950大小核架構的一部分,i5將二代中主CPU架構中的融合運算能力搬運到了自己身上,在不用喚醒主CPU的情況下自己就可以進行部分計算;i5還可以與大核A72、小核A53協同共享資源,由主系統進行智能調度,在需要主CPU工作的場景下,處于感知狀態下的i5克迅速喚醒主CPU,進而縮小CPU的啟動時間。值得一提的是i5仍然可以在1%電量時持續搜集來自各個傳感器的數據,以極低的功耗讓手機處于Always Sensing狀態。
芯片級智能定位
另外麒麟950還推出了新一代的融合定位機制,主要應對城市復雜的信號場景,比如隧道中無法定位、高樓林立時造成定位凌亂以及造成多次無意義搜星的功耗提升。基于麒麟芯片的新一代融合定位機制FLP(Fused Location Provider)可以做到智能判斷場景和運動狀態,用于調動不同的定位源,為我們提供合適的定位結果。實際體驗中解決GPS信號不好時定位離散漂移的問題;沒有GPS信號時可以段時間持續定位并做到增加軌跡記錄功能;在GPS信號斷續以及多路徑情況下光標做到持續定位不跳變;提供持續方向指引用戶持續方向不迷失。實現超低功耗解決方案,FLP功耗從90mA降到6.5mA,功耗降幅超90%。
自研ISP帶來突破性拍照性能
在處理器升級的同時,麒麟也虛心接受用戶的批評,比如“麒麟芯片萬年GPU”、“拍照對焦太肉”,現場海思CTO艾偉承認作為一家年輕的廠商,在很多領域受限,比如ISP技術。為了解決這些不可控頑疾,麒麟950還首次商用了自家ISP技術,目前麒麟950支持14bit雙ISP,吞吐率為960MPixel/s,支持混合對焦技術,可以根據拍照場景自適應選擇最佳對焦方式,實現快速精準對焦。攝像頭方面支持前后同時1300萬像素傳感器,最大可以支持3200萬像素攝像頭拍攝。基于芯片的人臉檢測技術可以做到最高35張臉的連續識別跟蹤能力,同時做到拍照時人臉膚色的真實還原。以下是即將發布的華為Mate8和iPhone6s的拍照盲測對比,左側iPhone6是,右側華為Mate8,這些場景中麒麟950的表現更優秀。
最后麒麟950還加入了新一代自研射頻芯片,能夠實現原來兩顆射頻芯片的功能,單芯片支持載波聚合功能,支持的頻段更寬(450MHz-3.5H),助力手機更廣泛的全球漫游。另外它依舊只支持LTE Cat6,最高支持300Mbps的下行速度,華為解釋稱更高的網路速度對于目前的運營商服務是無法實現的,所以網絡方面麒麟950依舊跟隨運營商的服務能力而設定,同時也最大程度上對載波聚合的頻段進行組避免不必要的浪費。
研發投入不足 麒麟不會走出去
大會上艾偉先生對麒麟處理器取得的成就和未來發展做了一些總結和展望,主要總結為以下5點
1、麒麟芯片將從920開始全線支持4G+網絡,目前中國使用的4G+手機中有50%以上采用麒麟芯片;
2、提供更好的“悅音”通話,隨著中國移動推動VoLTE的商用,麒麟9XX平臺全系列支持VoLTE,語音帶寬和采用率提升一倍,通話延遲大幅縮短,視頻通話質量提升10倍。
3、在中國移動近期各省宣布商用的VoLTE終端中,基于麒麟920芯片的Mate7成為標桿機型。
4、運營商的質量報告中顯示搭載麒麟芯片的整機穩定性排名第一。
5、麒麟芯片終端出貨量已經超過5000萬。
現場海思和臺積電代表也回答了記者的一些問題,對于用戶比較關心的海思是否會走出去,讓其他廠商搭載其芯片,華為表示華為營收10%的收入投入到研發當中,但依舊處于投入不足的狀態,沒有精力和人員為其他廠商調試和匹配,在沒有強有力的研發團隊支撐的情況下,海思處理器不會“貿然”走出去。另外可以肯定的是本月底發布的華為Mate8將搭載全新的麒麟950.