英特爾自從第12代酷睿處理器發(fā)布后,在13代、14代產(chǎn)品上只是調(diào)整核心規(guī)格、頻率,對(duì)核心微架構(gòu)進(jìn)行小改動(dòng),整體來(lái)看并未大幅度改動(dòng)整個(gè)處理器的架構(gòu)。雖然憑借著強(qiáng)悍的性能、極高的頻率以及優(yōu)秀的整體表現(xiàn),英特爾酷睿i系列處理器依舊在市場(chǎng)上呼風(fēng)喚雨,但是隨著AI技術(shù)的興起以及整個(gè)行業(yè)形勢(shì)發(fā)展,英特爾如果要持續(xù)保持領(lǐng)先地位、引領(lǐng)行業(yè)發(fā)展的話,還是需要做出更多的變化。2024年6月5日,英特爾公開(kāi)了新一代代號(hào)Lunar Lake的處理器產(chǎn)品,帶來(lái)了全新的P核、E核、GPU、NPU以及SoC設(shè)計(jì),全面革新了整個(gè)處理器的方方面面,更好的應(yīng)對(duì)AI時(shí)代的計(jì)算需求,同時(shí)也維持了極高的傳統(tǒng)計(jì)算能力,讓我們一起來(lái)看一下它的主要變化。 延續(xù)模塊化策略、內(nèi)存首次和處理器封裝在一起 英特爾在Meteor Lake上首次采用了Chiplet設(shè)計(jì),讓不同的核心比如計(jì)算核心、GPU核心、IO核心以及SoC核心采用不同的工藝制造,并通過(guò)高級(jí)封裝技術(shù)將其整合在一起。這種工藝和核心解耦、各自采用更合適工藝制造的方式,帶來(lái)了處理器設(shè)計(jì)上的重大變革。在Lunar Lake上,英特爾維持了這樣的技術(shù),但是創(chuàng)新性地加入了內(nèi)存的封裝,帶來(lái)了集成度更高的產(chǎn)品,進(jìn)一步提高了性能、能耗比以及應(yīng)用體驗(yàn)。 從整體架構(gòu)角度來(lái)看,內(nèi)存的封裝將帶來(lái)整個(gè)系統(tǒng)級(jí)的效能提升。因?yàn)橹靼鍙S商不需要在PCB上布置單獨(dú)的內(nèi)存供電和數(shù)據(jù)傳輸線路,這些功能全部轉(zhuǎn)移到處理器的PCB基板上,同時(shí)由高頻率內(nèi)存帶來(lái)的信號(hào)線布置、抗干擾設(shè)計(jì)等都可以全部取消。對(duì)英特爾來(lái)說(shuō),內(nèi)存轉(zhuǎn)移到處理器基板上,還獲得了更穩(wěn)定的性能和更高的能耗比,以及最重要的移動(dòng)設(shè)備內(nèi)部面積節(jié)省。 英特爾數(shù)據(jù)顯示將內(nèi)存轉(zhuǎn)移到處理器基板后,帶來(lái)了40%物理功耗降低、250平方毫米面積的節(jié)省以及每個(gè)芯片8.5GT/s的傳輸帶寬速率,容量方面也可以達(dá)到32GB。這對(duì)筆記本電腦產(chǎn)品來(lái)說(shuō)是足夠用的。 性能核和能效核全面進(jìn)化、IPC大幅度提升 Lunar Lake在核心微架構(gòu)上相對(duì)于Meteor Lake的另一個(gè)重大改進(jìn)在于整個(gè)處理器最關(guān)鍵的微架構(gòu)得到了更新。Lunar Lake的性能核也就是P核的微架構(gòu)進(jìn)化至Lion Cove,E核微架構(gòu)進(jìn)化至Skymont,帶來(lái)了相對(duì)上一代微架構(gòu)性能的大幅度提升。 宏觀特點(diǎn)來(lái)看,Lion Cove主要是增大規(guī)模、提高內(nèi)部執(zhí)行能力、增加更多執(zhí)行端口并針對(duì)緩存進(jìn)行大規(guī)模革新,英特爾認(rèn)為L(zhǎng)ion Cove在性能和面積效率方面進(jìn)行了改進(jìn),同時(shí)更加符合現(xiàn)代化的需求。 更具體來(lái)看的話,性能核心的核心改進(jìn),主要在于幾點(diǎn):整個(gè)分支預(yù)測(cè)寬度增加至之前的8倍、VEC和INT的亂序執(zhí)行部分進(jìn)行分離調(diào)度,此外還帶來(lái)了更寬的調(diào)度單元、增強(qiáng)的內(nèi)存子系統(tǒng),加入了L0級(jí)別緩存以及徹底改動(dòng)了內(nèi)存子系統(tǒng)等。在性能功耗方面,帶來(lái)了基于AI的電源管理以及針對(duì)核心面積和性能的優(yōu)化。 如果說(shuō)上述改進(jìn)大家感知不明顯的話,那么Lion Cove取消了超線程技術(shù)以及相關(guān)的晶體管資源,應(yīng)該是本次最重要的變化了。英特爾認(rèn)為,目前E核心在很大程度上起到了超線程技術(shù)的作用,同時(shí)超線程技術(shù)也需要耗費(fèi)大量的晶體管資源,因此本代處理器干脆徹底取消,以獲得更好的面積性能比,同時(shí)也可以降低核心面積、功耗以及成本。 性能方面,性能核心相比上代產(chǎn)品,平均提升了14%的IPC,低功耗下更明顯一些,高功耗下提升依舊可以大于10%。如果再算上更高的頻率的話,效能提升就更為可觀了。 性能核心的改進(jìn)如果說(shuō)是顯著提高的話,那么能效核心的改進(jìn)就可以說(shuō)是翻天覆地了。Skymont的能效核心改進(jìn)主要是整體IPC的提高、能效核心現(xiàn)在也能在更高的工作負(fù)載范圍內(nèi)輸出性能了,此外還帶來(lái)了增強(qiáng)的矢量計(jì)算和AI計(jì)算等。 整體來(lái)看,能效核心分支預(yù)測(cè)大幅度加強(qiáng),前端指令解碼來(lái)到了3×3也就是9寬度設(shè)計(jì),同時(shí)整個(gè)架構(gòu)規(guī)模、調(diào)度端口、緩存以及隊(duì)列深度等都進(jìn)行了極大幅度的擴(kuò)充。在矢量計(jì)算方面,SIMD增加到4×128位,這意味著吞吐能力相比上代產(chǎn)品翻倍,對(duì)VNNI指令的支持也更為出色了。簡(jiǎn)單總結(jié)的話,就是能效核心現(xiàn)在變得不像人們印象中的就是為節(jié)能而設(shè)計(jì)的核心了,在規(guī)模大幅度擴(kuò)大后,它相應(yīng)地迎來(lái)了更高的性能,完全可以當(dāng)做主核心來(lái)使用了。 性能方面,Skymont相比上代產(chǎn)品,單線程浮點(diǎn)能力提升到1.68倍,多線程整數(shù)能力最高提升4倍(由于功耗范圍擴(kuò)展),或者只有前代1/3的功耗。由于前代Crestmont的整體性能已經(jīng)超過(guò)英特爾之前使用的Skylake以及各種“+++”版本的性能,在如此大改后,甚至可以認(rèn)為Skymont在微架構(gòu)IPC方面可能距離Lion Cove差距不大,但是擁有更好的能效比表現(xiàn),這可能是英特爾未來(lái)發(fā)展重要變化之一。 在整個(gè)集群性能調(diào)度方面,Lunar Lake調(diào)度更為成熟。由于全新的工藝、更優(yōu)秀的P、E核心以及更高性能功耗比的設(shè)計(jì),Skymont和Lion Cove在性能、功耗的交叉點(diǎn)上移了不少,現(xiàn)在更多的任務(wù)可以交給Skymont進(jìn)行操作,Lion Cove只在更高性能需求的時(shí)候登場(chǎng),這無(wú)疑帶來(lái)了更好的性能功耗比表現(xiàn)。 由于大小核心的存在,英特爾還是延續(xù)了硬件線程調(diào)度器的做法,但是做出了更多改進(jìn),比如更好的OS分區(qū)設(shè)置、更好的電源集成管理以及整體算法的優(yōu)化、AI判斷的加入、更精細(xì)的調(diào)控等,都帶來(lái)了整體線程調(diào)度效率的提高。 Lunar Lake的整個(gè)調(diào)度目前更為動(dòng)態(tài)、更為自主。P核心和E核心的調(diào)度優(yōu)先級(jí)方面更偏向于能耗比提高,但也同時(shí)針對(duì)性能需求做了很好的優(yōu)化。由于E核心現(xiàn)在更強(qiáng)大、覆蓋最佳性能功耗比區(qū)間更廣闊,因此轉(zhuǎn)移至P核心的概率也更低,只有突發(fā)重載的情況,P核心才會(huì)火力全開(kāi)。 GPU和NPU加強(qiáng),AI計(jì)算大提升級(jí) 英特爾在自研GPU上進(jìn)展相當(dāng)不錯(cuò),其產(chǎn)品憑借高性價(jià)比得到了很多消費(fèi)者的青睞。在Lunar Lake上,英特爾引入了第二代Xe GPU架構(gòu),帶來(lái)了新的矢量引擎,整體性能、效率也顯著提升。 第二代Xe GPU的重要改進(jìn)在于規(guī)模更大,光線追蹤和AI性能更強(qiáng)。比如8個(gè)Xe核心、8個(gè)更強(qiáng)的光追單元以及增強(qiáng)的XeSS內(nèi)核等。規(guī)模大意味著性能強(qiáng),這在GPU上是百試不爽的靈藥,Lunar Lake的GPU性能是上代產(chǎn)品的1.5倍,能夠更好地滿足用戶針對(duì)圖形方面的需求。 在AI計(jì)算方面,新的Xe GPU集成了新的矢量引擎,同樣是帶來(lái)了更大的規(guī)模,比如原生支持SIMD16,支持的精度更多,包括INT2、INT4、INT8、INT16以及BF16和FP16等,針對(duì)AI模型計(jì)算整體無(wú)論是效率還是功能方面都會(huì)有更好的提升。 媒體引擎方面,本代英特爾啟用了全新設(shè)計(jì)的媒體引擎,帶來(lái)了AV1編解碼和VVC編解碼支持。主要的特性包含針對(duì)eDP 1.5的節(jié)能功能,包括可以降低畫(huà)面抖動(dòng)的顯示幀率和媒體幀率的自適應(yīng)適配、節(jié)約CPU能耗的內(nèi)容排隊(duì)序列、降低整體顯示功耗的選擇性顯示內(nèi)容(Early Transport)等。規(guī)格方面主要是加入了H.266也就是VVC的解碼支持,H.266相比目前的AV1文件大小繼續(xù)縮小大約10%,此外還有自適應(yīng)編碼、屏幕內(nèi)容編碼流SSC等特性。顯示方面支持3個(gè)顯示通道、支持DP 2.1、HDMI 2.1等。 總的來(lái)說(shuō),整個(gè)Lunar Lake的圖形性能是大幅度提升的,英特爾數(shù)據(jù)是提升了大概50%,并且AI性能高達(dá)67TOPS,更多新特性的支持等。由于GPU的升級(jí),更多的用戶可以直接選擇集成顯卡配置的機(jī)型,也能得到不錯(cuò)的圖形計(jì)算應(yīng)用體驗(yàn),這是很令人滿意的。 在NPU方面,Lunar Lake的NPU由于AI應(yīng)用的發(fā)展,也得到了大幅度提升和加強(qiáng)。NPU的整體算力高達(dá)48 TOPS,雖然看起來(lái)比GPU低,但是NPU整體計(jì)算效率是更高、更節(jié)約能耗的,因此更多的AI計(jì)算任務(wù)可以直接在NPU上完成而不需要?jiǎng)佑肅PU和GPU。NPU的變化主要是帶來(lái)了新的功能,比如支持原生激活功能和數(shù)據(jù)轉(zhuǎn)換、支持大語(yǔ)言模型的嵌入標(biāo)記化等。架構(gòu)方面,本代也就是第4代NPU的規(guī)模更大,包括12個(gè)增強(qiáng)的Shave DSP以及6個(gè)神經(jīng)網(wǎng)絡(luò)引擎,帶寬翻倍,MAC架構(gòu)優(yōu)化等,帶來(lái)了整體性能的大幅度提升。 英特爾總結(jié)到,Lunar Lake目前最高可以提供120TOPS的算力,可以完成大量AI計(jì)算,包括文生圖、大模型本地化運(yùn)行等。在越來(lái)越多的軟件內(nèi)置AI功能的現(xiàn)在,本地AI計(jì)算依舊是非常重要的,這一點(diǎn)英特爾也是順應(yīng)時(shí)代進(jìn)行的操作。 超高能效比的新一代高性能AI移動(dòng)處理器 由于文章篇幅有限,我們?cè)诒疚闹泻?jiǎn)單總結(jié)一下Lunar Lake的特性,給大家展示了相關(guān)的重點(diǎn)。如果各位想對(duì)Lunar Lake有更深入的認(rèn)識(shí)和了解的話,請(qǐng)關(guān)注《微型計(jì)算機(jī)》2024年7月上刊,我們將詳細(xì)地為大家介紹Lunar Lake的技術(shù)架構(gòu)細(xì)節(jié)。 最后,我們還是針對(duì)Lunar Lake的發(fā)布以及附于其上的技術(shù)應(yīng)用進(jìn)行一些總結(jié)。Lunar Lake是英特爾在進(jìn)入Chiplet時(shí)代后的一次全面革新,整個(gè)Lunar Lake無(wú)論是P核心還是E核心,包括GPU、NPU以及互聯(lián)性能等都進(jìn)行了全面變化和提升,帶來(lái)了大量的全新技術(shù),支持更多的新規(guī)格。毫不夸張的說(shuō),本次Lunar Lake新技術(shù)應(yīng)用之多、之復(fù)雜遠(yuǎn)超之前任何一款產(chǎn)品。英特爾近幾年在技術(shù)演進(jìn)上的進(jìn)展還是極為激進(jìn)的,無(wú)論是上一代Meteor Lake還是本代Lunar Lake,在架構(gòu)設(shè)計(jì)、技術(shù)應(yīng)用以及整體規(guī)格上正在全面轉(zhuǎn)向,Lunar Lake實(shí)際產(chǎn)品也就是酷睿Ultra 200系列上市后的表現(xiàn)令人期待,我們也盡快聯(lián)系廠商,力爭(zhēng)第一時(shí)間拿到產(chǎn)品并分享具體性能給大家。 |
|